H∞-управление как дифференциальная игра

Проблема устойчивости при неизвестных возмущениях

В реальных системах управления — самолётах, энергосистемах, химических реакторах — всегда есть неизвестные возмущения: турбулентность, изменения нагрузки, параметрическая неопределённость. Классическое управление (LQR) оптимально при известной модели, но может «сломаться» при возмущениях. H∞-управление строит регулятор, который гарантированно устойчив при худшем случае возмущений — это задача «минимаксной» оптимизации, естественно формулируемая как дифференциальная игра.

H∞-задача: постановка

Система: ẋ = Ax + Bu + Dw (w — неизвестное возмущение), выход z = Cx + Eu.

Задача H∞: найти управление u = K(x), минимизирующее «коэффициент усиления» от w к z в наихудшем случае:

‖T_{zw}‖∞ = sup{w≠0, w∈L₂} ‖z‖{L₂} / ‖w‖{L₂} < γ

‖T_{zw}‖_∞ — H∞-норма передаточной функции от w к z. Это «усиление наихудшего сигнала».

Как дифференциальная игра: управление u — минимизатор, возмущение w — максимизатор:

J = ∫₀^∞ [‖z(t)‖² − γ²‖w(t)‖²] dt

min_u max_w J: найти u, чтобы при наихудшем w суммарная «энергия» z меньше γ² · энергии w. Если min max J < 0 — цель достигнута.

Игровая формулировка

J = ∫₀^∞ [‖Cx+Eu‖² − γ²‖w‖²] dt + граничное условие.

Это LQ-дифференциальная игра с: Q = CᵀC, R = EᵀE, S = γ²I (D вместо C матрица возмущения).

Гамильтониан: H = ‖Cx+Eu‖² − γ²‖w‖² + pᵀ(Ax+Bu+Dw).

Условие оптимальности:

min по u: 2EᵀCx + 2EᵀEu + BᵀP = 0 → u* = −(EᵀE)⁻¹(EᵀCx + (1/2)BᵀPx)
max по w: −2γ²w + DᵀPx = 0 → w* = DᵀPx/(2γ²)

LMI-решение H∞

Условие ‖T_{zw}‖_∞ < γ эквивалентно существованию P = Pᵀ ≻ 0 такой, что выполняется матричное неравенство:

[AᵀP+PA+CᵀC PB PD ] [ BᵀP −EᵀE 0 ] ≺ 0 [ DᵀP 0 −γ²I ]

Это LMI (Linear Matrix Inequality)! Задача: минимизировать γ при этом LMI-ограничении → SDP-задача. Решается стандартными пакетами за секунды.

Физическая интерпретация

Что означает H∞-норма < γ?

Представьте систему как «чёрный ящик», принимающий сигнал w и выдающий z. Если ‖T‖_∞ = 2 и γ = 2, это означает: при любом входе w с «энергией» 1 (∫w² dt = 1) выход z имеет «энергию» ≤ 4. Система «усиливает» не более чем в γ раз.

Связь с устойчивостью: если H∞-норма конечна — система устойчива. Минимальная γ, при которой задача решаема — «запас устойчивости» системы.

Полный разбор: H∞-синтез для подвески автомобиля

Модель: ẋ₁ = x₂ (скорость кузова), mẋ₂ = −k(x₁−x₃) − c(x₂−x₄) + u (амортизатор), Mẋ₃ = x₄, Mẋ₄ = k(x₁−x₃) + c(x₂−x₄) − kₜ(x₃−w). Здесь w — неровности дороги, u — активная подвеска.

Цель: минимизировать ‖ускорение кузова ẍ₁‖ при ограниченном ‖u‖ и худших ‖w‖.

Это H∞-задача: z = [ẍ₁, u]ᵀ, возмущение w = неровность. Минимизируем γ = ‖T_{zw}‖_∞.

Результат: H∞-регулятор уменьшает ускорение кузова на 30-40% по сравнению с пассивной подвеской при тех же ограничениях на ход подвески.

Применения

H∞-управление — стандарт в авиационном и ракетном управлении (Boeing, Airbus), энергосистемах (управление генераторами при случайных нагрузках), автомобилестроении (активные подвески, ABS, ESP), робототехнике (устойчивость к неизвестным нагрузкам). Пакеты: MATLAB Control Toolbox hinfsyn, Python-Control h_inf_synthesize.

H∞-норма и интерпретация

Для линейной системы с входом w и выходом z H∞-норма передаточной функции: ‖T_{zw}‖_∞ = sup_w ‖z‖₂ / ‖w‖₂

Это «наихудший коэффициент усиления». H∞-управление минимизирует эту норму, гарантируя ограниченность z для любых w единичной нормы. Параметр γ задаёт целевой уровень: ‖T_{zw}‖_∞ < γ.

Связь с дифференциальной игрой

Задача H∞-синтеза эквивалентна дифференциальной игре с функционалом: J = ∫₀^T (zᵀz − γ²wᵀw) dt

Регулятор u играет «за себя» (минимизирует), возмущение w — «за противника» (максимизирует). При условии Айзекса оптимальная пара даёт H∞-регулятор.

Алгоритмы синтеза

Уравнения Риккати с γ-итерацией: бинарный поиск по γ + решение уравнения Риккати для каждого γ
LMI (Linear Matrix Inequalities): формулировка через выпуклые ограничения, решение через SDP-решатели (SeDuMi, MOSEK)
μ-синтез: учёт структурированной неопределённости (D-K iteration)
Loop-shaping: классическая методика H∞ через формирование частотной характеристики

Применения

H∞-управление — стандарт в гражданской авиации (закрытый контур автопилота Boeing 777, Airbus A380), управлении гидроэлектростанциями (демпфирование колебаний турбин), магнитной левитации (Maglev), активных подвесках автомобилей. Робастность к неопределённости параметров делает его незаменимым там, где модель системы неточна.