Метод Ляпунова в применениях — Дифференциальные уравнения

Метод Ляпунова: применения в управлении и нелинейной динамике

От теории к инженерии

Прямой метод Ляпунова — не только теоретический инструмент, но и практическое средство проектирования. В теории управления он позволяет проектировать алгоритмы управления, гарантирующие устойчивость замкнутой системы «по построению». В отличие от частотных методов (критерий Найквиста), метод Ляпунова напрямую работает с нелинейными системами и нестационарными режимами.

Управление с обратной связью

Рассмотрим нелинейную систему: ẋ = f(x) + g(x)u, где x — состояние, u — управление.

Задача: выбрать u = u(x) так, чтобы x → 0 при t → ∞.

Метод управления Ляпунова: Выбираем желаемую функцию Ляпунова V(x) (например, V = |x|²/2). Требуем V̇ < 0:

V̇ = ∇V · (f + gu) = ∇V · f + (∇V · g) u < 0.

Если ∇V · g ≠ 0, выбираем: u = −k(x) · (∇V · f + ε|∇V · g|) / (∇V · g), где k > 0, ε > 0.

Тогда V̇ = ∇V · f − k|∇V · f + ε|∇V · g|| ≤ −ε k |∇V · g| < 0 при ∇V ≠ 0.

Это управление на основе Ляпунова: устойчивость гарантирована конструктивно.

LQR-управление (Linear Quadratic Regulator)

Для линейной системы ẋ = Ax + Bu задача оптимального управления:

Минимизировать J = ∫₀^∞ (xᵀQx + uᵀRu) dt

при u = −Kx, Q ≥ 0 (штраф за состояние), R > 0 (штраф за управление).

Решение: Оптимальный регулятор K = R⁻¹BᵀP, где P — единственное положительно определённое решение уравнения Риккати:

AᵀP + PA − PBR⁻¹BᵀP + Q = 0.

Связь с Ляпуновым: Функция V = xᵀPx является функцией Ляпунова для замкнутой системы:

V̇ = xᵀ(Aᵀ P + PA − 2PBR⁻¹BᵀP)x = xᵀ(−Q − KᵀRK)x ≤ 0.

Практический пример: Стабилизация маятника. Пусть A = [[0,1],[-1,-0.5]], B = [[0],[1]], Q = I, R = 1. Решив уравнение Риккати (численно), получаем P и K. Замкнутая система устойчива с гарантированным качеством переходного процесса, заданным параметрами Q и R.

Конструктивные методы нахождения функций Ляпунова

Одна из центральных проблем метода Ляпунова — как найти подходящую V. Для линейных систем существуют систематические методы; для нелинейных — набор приёмов и эвристик.

Метод суммы квадратов (SOS): Для систем с полиномиальными правыми частями ищем V как сумму квадратов полиномов. Условие V > 0 и V̇ < 0 превращается в задачу полуопределённого программирования (SDP), решаемую численно за полиномиальное время.

Нейронные сети Ляпунова: В современном машинном обучении V(x) обучают как нейронную сеть, минимизируя штраф за нарушения условий функции Ляпунова. Это позволяет находить функции Ляпунова для высокоразмерных нелинейных систем.

Обратная теорема Ляпунова: Если x* = 0 глобально асимптотически устойчиво, то существует гладкая функция Ляпунова (теорема Урселла–Куржвейла). Обратная теорема существования гарантирует, что «правильная» V всегда есть — вопрос лишь в том, как её найти.

Устойчивость периодических решений: теория Флоке

Пусть система x' = f(x) имеет периодическое решение xₚ(t) = xₚ(t + T). Как анализировать его устойчивость?

Линеаризуем вдоль xₚ(t): δx' = A(t) δx, где A(t) = Df(xₚ(t)) — периодическая матрица.

Теория Флоке: Для системы с периодическими коэффициентами δx' = A(t) δx (A(t+T) = A(t)) фундаментальная матрица: Φ(t) = P(t) e^{Bt}, где P(t) — T-периодическая матрица, B — постоянная.

Мультипликаторы Флоке ρᵢ — собственные значения матрицы монодромии M = Φ(T) (за один период). Периодическое решение устойчиво тогда и только тогда, когда все |ρᵢ| < 1 (кроме одного единичного мультипликатора, соответствующего касательному направлению).

Пример: Маятник с вертикально вибрирующей точкой подвеса ẍ + (ω₀² + ε cos 2t) sin x = 0 — уравнение Матьё. При определённых соотношениях параметров мультипликаторы Флоке выходят за единичный круг — параметрический резонанс (дети раскачивают качели, «подкачивая» в нужный момент — именно параметрическое возбуждение).

Вопрос для размышления: В LQR-регуляторе параметры Q и R отражают компромисс между «качеством» стабилизации и «ценой» управления. Как правильно выбирать эти матрицы для конкретной инженерной задачи?

H-infinity управление и робастность

LQR оптимально при точно известной модели. Реальные системы имеют неопределённости: ошибки в параметрах, неучтённые динамики, внешние возмущения. H∞-управление (Zames, 1981) минимизирует «наихудший случай»: min_K ‖T_{zw}‖_∞ — норму передаточной матрицы от возмущений w к «выходу качества» z. Связь с ОДУ: задача H∞ сводится к алгебраическому уравнению Риккати с двумя матрицами (вместо одной в LQR). Решение существует тогда и только тогда, когда «запас робастности» γ > γ_min. Приложения: устойчивость лётных систем управления при отказах датчиков, подавление вибраций в жёстких механических конструкциях, управление энергосистемами при переменной нагрузке.