Модуль II·Статья II·~3 мин чтения
Принцип максимума: доказательство и применения
Принцип максимума Понтрягина
Превратить статью в подкаст
Выберите голоса, формат и длину — AI запишет аудио
Принцип максимума: доказательство и применения
ПМП — нетривиальный результат: его доказательство не сводится к простому интегрированию по частям, как для EL. Понтрягин и его ученики (Болтянский, Гамкрелидзе, Мищенко) построили доказательство через «игольчатые вариации» и теорему отделимости выпуклых множеств. Применения охватывают экономику, инженерию, биомедицину и менеджмент — везде, где есть динамическая оптимизация.
Идея доказательства
Игольчатые вариации (needle variations). Вместо гладких возмущений (как в EL) рассматриваем «иглу»: на коротком интервале [t₀, t₀ + ε] заменяем u*(t) на произвольное допустимое v ∈ U, в остальное время оставляем u*. Это порождает скачкообразное изменение состояния x(t) и, соответственно, целевой функции J.
Конус вариаций. Совокупность всех таких возмущений в пределе ε → 0 даёт конус достижимости в пространстве состояний. Если u* оптимально, конус достижимости и направление улучшения J должны быть «по разные стороны» некоторой гиперплоскости — иначе найдётся возмущение, улучшающее J.
Разделение конусов. Нормаль к разделяющей гиперплоскости — вектор ψ(t₀). Условие, что игольчатая вариация не улучшает J, эквивалентно H(x*(t₀), v, ψ(t₀), t₀) ≤ H(x*(t₀), u*(t₀), ψ(t₀), t₀) для всех v ∈ U. Это и есть условие максимума.
Условие Эйлера как частный случай
Если U = ℝᵐ (без ограничений), max H достигается внутри U → ∂H/∂u = 0. Это классическое уравнение Эйлера в гамильтоновой форме.
Если U = [a, b] и H выпукла по u, то u* = clip(u_свободное, a, b), где u_свободное — корень ∂H/∂u = 0.
Если H линейна по u, как часто бывает в задачах с управлением через тягу, скорость, инвестиции, — оптимум лежит на границе U → bang-bang.
Экономические применения
1. Задача оптимального роста (Рамсей-Касс-Купманс). max ∫₀^∞ e^{−ρt}·u(c(t)) dt при k̇ = f(k) − c, k(0) = k₀.
Здесь k — капитал, c — потребление, f(k) — производственная функция, ρ — норма дисконта, u — функция полезности.
H = e^{−ρt}·u(c) + ψ·(f(k) − c). Из ∂H/∂c = 0: e^{−ρt}·u'(c) = ψ. Из ψ̇ = −∂H/∂k = −ψ·f'(k).
Логарифмируя и дифференцируя первое условие: ċ/c = (f'(k) − ρ)/σ, где σ = −c·u''(c)/u'(c) — эластичность замещения. Это уравнение Эйлера потребления — стержневое уравнение современной макроэкономики.
Численный пример. При f(k) = k^0.36, ρ = 0.04, σ = 1 (логарифмическая полезность): стационарное состояние k* = (α/(ρ+δ))^{1/(1−α)}, при δ = 0.1 → k* ≈ 1.79, c* ≈ 0.99.
2. Истощение природных ресурсов (правило Хотеллинга). max ∫₀^T e^{−rt}·p(q)·q dt при ṡ = −q, s(T) ≥ 0.
ПМП даёт: предельная рента ресурса (p + p'·q − c'(q)) растёт со скоростью r. Поэтому цена нефти, газа, минералов «обязана» расти примерно с темпом дисконтирования. Эмпирически правило выполняется лишь приблизительно из-за технологических прорывов и открытия новых месторождений.
3. Оптимальное управление эпидемией. SEIR-модель с управлением u (доля вакцинируемых): минимизировать ∫(I + α·u²) dt — баланс между числом заболевших и стоимостью вакцинации. ПМП даёт оптимальное расписание массовой вакцинации.
Инженерные применения
- Оптимальная посадка. Falcon 9: задача состоит в минимизации расхода топлива при ограничениях на угол атаки, тягу, конечную скорость. Решается через convex relaxation ПМП в реальном времени.
- HVAC-системы. Оптимальное расписание кондиционирования здания (минимизация расхода энергии при поддержании комфортной температуры) — классическая задача ОУ.
Задание. Рыболовный промысел: max ∫₀^T e^{−rt}·[p − c(x)]·h dt при ẋ = g(x) − h, x(0) = x₀, 0 ≤ h ≤ h_max. g(x) = r_b·x·(1 − x/K) — логистическая модель популяции. (а) Запишите ПМП. (б) Найдите биологическое равновесие (без управления): g(x) = 0 → x = K. (в) Найдите биоэкономическое стационарное состояние x*: f'(x*) = r + c'(x*)·... (точно выпишите). (г) Численно (для p = 10, r = 0.05, K = 1, r_b = 0.5, c(x) = 1/x) постройте оптимальную траекторию x(t), h(t).
§ Акт · что дальше