Модуль VI·Статья I·~4 мин чтения
Метод Ляпунова в применениях
Теория устойчивости Ляпунова
Превратить статью в подкаст
Выберите голоса, формат и длину — AI запишет аудио
Метод Ляпунова: применения в управлении и нелинейной динамике
От теории к инженерии
Прямой метод Ляпунова — не только теоретический инструмент, но и практическое средство проектирования. В теории управления он позволяет проектировать алгоритмы управления, гарантирующие устойчивость замкнутой системы «по построению». В отличие от частотных методов (критерий Найквиста), метод Ляпунова напрямую работает с нелинейными системами и нестационарными режимами.
Управление с обратной связью
Рассмотрим нелинейную систему: ẋ = f(x) + g(x)u, где x — состояние, u — управление.
Задача: выбрать u = u(x) так, чтобы x → 0 при t → ∞.
Метод управления Ляпунова: Выбираем желаемую функцию Ляпунова V(x) (например, V = |x|²/2). Требуем V̇ < 0:
V̇ = ∇V · (f + gu) = ∇V · f + (∇V · g) u < 0.
Если ∇V · g ≠ 0, выбираем: u = −k(x) · (∇V · f + ε|∇V · g|) / (∇V · g), где k > 0, ε > 0.
Тогда V̇ = ∇V · f − k|∇V · f + ε|∇V · g|| ≤ −ε k |∇V · g| < 0 при ∇V ≠ 0.
Это управление на основе Ляпунова: устойчивость гарантирована конструктивно.
LQR-управление (Linear Quadratic Regulator)
Для линейной системы ẋ = Ax + Bu задача оптимального управления:
Минимизировать J = ∫₀^∞ (xᵀQx + uᵀRu) dt
при u = −Kx, Q ≥ 0 (штраф за состояние), R > 0 (штраф за управление).
Решение: Оптимальный регулятор K = R⁻¹BᵀP, где P — единственное положительно определённое решение уравнения Риккати:
AᵀP + PA − PBR⁻¹BᵀP + Q = 0.
Связь с Ляпуновым: Функция V = xᵀPx является функцией Ляпунова для замкнутой системы:
V̇ = xᵀ(Aᵀ P + PA − 2PBR⁻¹BᵀP)x = xᵀ(−Q − KᵀRK)x ≤ 0.
Практический пример: Стабилизация маятника. Пусть A = [[0,1],[-1,-0.5]], B = [[0],[1]], Q = I, R = 1. Решив уравнение Риккати (численно), получаем P и K. Замкнутая система устойчива с гарантированным качеством переходного процесса, заданным параметрами Q и R.
Конструктивные методы нахождения функций Ляпунова
Одна из центральных проблем метода Ляпунова — как найти подходящую V. Для линейных систем существуют систематические методы; для нелинейных — набор приёмов и эвристик.
Метод суммы квадратов (SOS): Для систем с полиномиальными правыми частями ищем V как сумму квадратов полиномов. Условие V > 0 и V̇ < 0 превращается в задачу полуопределённого программирования (SDP), решаемую численно за полиномиальное время.
Нейронные сети Ляпунова: В современном машинном обучении V(x) обучают как нейронную сеть, минимизируя штраф за нарушения условий функции Ляпунова. Это позволяет находить функции Ляпунова для высокоразмерных нелинейных систем.
Обратная теорема Ляпунова: Если x* = 0 глобально асимптотически устойчиво, то существует гладкая функция Ляпунова (теорема Урселла–Куржвейла). Обратная теорема существования гарантирует, что «правильная» V всегда есть — вопрос лишь в том, как её найти.
Устойчивость периодических решений: теория Флоке
Пусть система x' = f(x) имеет периодическое решение xₚ(t) = xₚ(t + T). Как анализировать его устойчивость?
Линеаризуем вдоль xₚ(t): δx' = A(t) δx, где A(t) = Df(xₚ(t)) — периодическая матрица.
Теория Флоке: Для системы с периодическими коэффициентами δx' = A(t) δx (A(t+T) = A(t)) фундаментальная матрица: Φ(t) = P(t) e^{Bt}, где P(t) — T-периодическая матрица, B — постоянная.
Мультипликаторы Флоке ρᵢ — собственные значения матрицы монодромии M = Φ(T) (за один период). Периодическое решение устойчиво тогда и только тогда, когда все |ρᵢ| < 1 (кроме одного единичного мультипликатора, соответствующего касательному направлению).
Пример: Маятник с вертикально вибрирующей точкой подвеса ẍ + (ω₀² + ε cos 2t) sin x = 0 — уравнение Матьё. При определённых соотношениях параметров мультипликаторы Флоке выходят за единичный круг — параметрический резонанс (дети раскачивают качели, «подкачивая» в нужный момент — именно параметрическое возбуждение).
Вопрос для размышления: В LQR-регуляторе параметры Q и R отражают компромисс между «качеством» стабилизации и «ценой» управления. Как правильно выбирать эти матрицы для конкретной инженерной задачи?
H-infinity управление и робастность
LQR оптимально при точно известной модели. Реальные системы имеют неопределённости: ошибки в параметрах, неучтённые динамики, внешние возмущения. H∞-управление (Zames, 1981) минимизирует «наихудший случай»: min_K ‖T_{zw}‖_∞ — норму передаточной матрицы от возмущений w к «выходу качества» z. Связь с ОДУ: задача H∞ сводится к алгебраическому уравнению Риккати с двумя матрицами (вместо одной в LQR). Решение существует тогда и только тогда, когда «запас робастности» γ > γ_min. Приложения: устойчивость лётных систем управления при отказах датчиков, подавление вибраций в жёстких механических конструкциях, управление энергосистемами при переменной нагрузке.
§ Акт · что дальше