Модуль II·Статья II·~3 мин чтения
H∞-управление как дифференциальная игра
Игры с нулевой суммой и минимакс
Превратить статью в подкаст
Выберите голоса, формат и длину — AI запишет аудио
H∞-управление как дифференциальная игра
Проблема устойчивости при неизвестных возмущениях
В реальных системах управления — самолётах, энергосистемах, химических реакторах — всегда есть неизвестные возмущения: турбулентность, изменения нагрузки, параметрическая неопределённость. Классическое управление (LQR) оптимально при известной модели, но может «сломаться» при возмущениях. H∞-управление строит регулятор, который гарантированно устойчив при худшем случае возмущений — это задача «минимаксной» оптимизации, естественно формулируемая как дифференциальная игра.
H∞-задача: постановка
Система: ẋ = Ax + Bu + Dw (w — неизвестное возмущение), выход z = Cx + Eu.
Задача H∞: найти управление u = K(x), минимизирующее «коэффициент усиления» от w к z в наихудшем случае:
‖T_{zw}‖∞ = sup{w≠0, w∈L₂} ‖z‖{L₂} / ‖w‖{L₂} < γ
‖T_{zw}‖_∞ — H∞-норма передаточной функции от w к z. Это «усиление наихудшего сигнала».
Как дифференциальная игра: управление u — минимизатор, возмущение w — максимизатор:
J = ∫₀^∞ [‖z(t)‖² − γ²‖w(t)‖²] dt
min_u max_w J: найти u, чтобы при наихудшем w суммарная «энергия» z меньше γ² · энергии w. Если min max J < 0 — цель достигнута.
Игровая формулировка
J = ∫₀^∞ [‖Cx+Eu‖² − γ²‖w‖²] dt + граничное условие.
Это LQ-дифференциальная игра с: Q = CᵀC, R = EᵀE, S = γ²I (D вместо C матрица возмущения).
Гамильтониан: H = ‖Cx+Eu‖² − γ²‖w‖² + pᵀ(Ax+Bu+Dw).
Условие оптимальности:
- min по u: 2EᵀCx + 2EᵀEu + BᵀP = 0 → u* = −(EᵀE)⁻¹(EᵀCx + (1/2)BᵀPx)
- max по w: −2γ²w + DᵀPx = 0 → w* = DᵀPx/(2γ²)
LMI-решение H∞
Условие ‖T_{zw}‖_∞ < γ эквивалентно существованию P = Pᵀ ≻ 0 такой, что выполняется матричное неравенство:
[AᵀP+PA+CᵀC PB PD ] [ BᵀP −EᵀE 0 ] ≺ 0 [ DᵀP 0 −γ²I ]
Это LMI (Linear Matrix Inequality)! Задача: минимизировать γ при этом LMI-ограничении → SDP-задача. Решается стандартными пакетами за секунды.
Физическая интерпретация
Что означает H∞-норма < γ?
Представьте систему как «чёрный ящик», принимающий сигнал w и выдающий z. Если ‖T‖_∞ = 2 и γ = 2, это означает: при любом входе w с «энергией» 1 (∫w² dt = 1) выход z имеет «энергию» ≤ 4. Система «усиливает» не более чем в γ раз.
Связь с устойчивостью: если H∞-норма конечна — система устойчива. Минимальная γ, при которой задача решаема — «запас устойчивости» системы.
Полный разбор: H∞-синтез для подвески автомобиля
Модель: ẋ₁ = x₂ (скорость кузова), mẋ₂ = −k(x₁−x₃) − c(x₂−x₄) + u (амортизатор), Mẋ₃ = x₄, Mẋ₄ = k(x₁−x₃) + c(x₂−x₄) − kₜ(x₃−w). Здесь w — неровности дороги, u — активная подвеска.
Цель: минимизировать ‖ускорение кузова ẍ₁‖ при ограниченном ‖u‖ и худших ‖w‖.
Это H∞-задача: z = [ẍ₁, u]ᵀ, возмущение w = неровность. Минимизируем γ = ‖T_{zw}‖_∞.
Результат: H∞-регулятор уменьшает ускорение кузова на 30-40% по сравнению с пассивной подвеской при тех же ограничениях на ход подвески.
Применения
H∞-управление — стандарт в авиационном и ракетном управлении (Boeing, Airbus), энергосистемах (управление генераторами при случайных нагрузках), автомобилестроении (активные подвески, ABS, ESP), робототехнике (устойчивость к неизвестным нагрузкам). Пакеты: MATLAB Control Toolbox hinfsyn, Python-Control h_inf_synthesize.
H∞-норма и интерпретация
Для линейной системы с входом w и выходом z H∞-норма передаточной функции: ‖T_{zw}‖_∞ = sup_w ‖z‖₂ / ‖w‖₂
Это «наихудший коэффициент усиления». H∞-управление минимизирует эту норму, гарантируя ограниченность z для любых w единичной нормы. Параметр γ задаёт целевой уровень: ‖T_{zw}‖_∞ < γ.
Связь с дифференциальной игрой
Задача H∞-синтеза эквивалентна дифференциальной игре с функционалом: J = ∫₀^T (zᵀz − γ²wᵀw) dt
Регулятор u играет «за себя» (минимизирует), возмущение w — «за противника» (максимизирует). При условии Айзекса оптимальная пара даёт H∞-регулятор.
Алгоритмы синтеза
- Уравнения Риккати с γ-итерацией: бинарный поиск по γ + решение уравнения Риккати для каждого γ
- LMI (Linear Matrix Inequalities): формулировка через выпуклые ограничения, решение через SDP-решатели (SeDuMi, MOSEK)
- μ-синтез: учёт структурированной неопределённости (D-K iteration)
- Loop-shaping: классическая методика H∞ через формирование частотной характеристики
Применения
H∞-управление — стандарт в гражданской авиации (закрытый контур автопилота Boeing 777, Airbus A380), управлении гидроэлектростанциями (демпфирование колебаний турбин), магнитной левитации (Maglev), активных подвесках автомобилей. Робастность к неопределённости параметров делает его незаменимым там, где модель системы неточна.
§ Акт · что дальше