Модуль V·Статья III·~5 мин чтения

Надёжность управления и робастное управление

Стохастическое оптимальное управление

Превратить статью в подкаст

Выберите голоса, формат и длину — AI запишет аудио

Надёжность управления и робастное управление

LQR/LQG предполагают, что мы знаем точную модель системы. Но реальные параметры (масса, жёсткость, сопротивление) известны лишь приблизительно: производственные допуски, износ, температурные колебания. Кроме того, реальные системы имеют невоспринятую динамику (например, гибкость металла, которую игнорируют в модели как «жёсткое тело»). Робастное управление — раздел, разработанный в 1980-90-х (Doyle, Glover, Khargonekar, Stein), — даёт инструменты для проектирования регуляторов, гарантированно работающих при допустимых неопределённостях. Сегодня это стандарт в авиации, автоматизации и автономных системах.

Источники неопределённости

Параметрические. Конкретные параметры модели неточны: масса m ∈ [0.9, 1.1] кг, жёсткость пружины k ∈ [k₀(1 − 0.2), k₀(1 + 0.2)]. Описывается интервалами или вероятностно.

Структурные (немоделированная динамика). Действительная передаточная функция G_real(s) = G_nominal(s)·(1 + Δ(s)), где Δ — неизвестное «возмущение», обычно ограниченное по норме ||Δ||_∞ < γ. Например, гибкие моды конструкции, которые проявляются на высоких частотах.

Возмущения и шумы. Внешние силы (порывы ветра, неровности дороги), шумы датчиков. Описываются как стохастические процессы или ограниченные сигналы (||d||₂ ≤ D).

Меры робастности

Запас усиления (Gain Margin, GM). Во сколько раз можно увеличить коэффициент передачи разомкнутого контура, прежде чем замкнутый станет нестабильным. Стандарт: GM ≥ 6 дБ (фактор 2).

Запас фазы (Phase Margin, PM). На сколько градусов можно сдвинуть фазу прежде потери устойчивости. Стандарт: PM ≥ 45°.

Малое усиление и малый сдвиг фазы — большой запас. Эти меры легко считать на диаграмме Боде: GM — на частоте, где фаза = −180°, PM — на частоте, где |G| = 1.

Sensitivity функция S и комплементарная T. S = 1/(1 + L), T = L/(1 + L), где L — разомкнутый контур. ||S||∞ — насколько контур усиливает возмущения. ||T||∞ — чувствительность к шуму измерений. Закон сохранения: S + T = 1, то есть нельзя одновременно сделать обе малыми во всём частотном диапазоне.

H∞ управление

H∞-норма передаточной матрицы: ||G||∞ = sup{ω} σ_max(G(jω)) — максимальное сингулярное значение по всем частотам. Это «наихудший» коэффициент передачи возмущения на выход.

Постановка H∞ задачи: найти регулятор K, минимизирующий ||T_zw||_∞, где T_zw — передаточная функция от возмущения w на оцениваемый выход z (включает обычно ошибку слежения, управляющее усилие, состояние).

Mixed-sensitivity: Стандартная постановка с весовыми функциями W_S, W_T, W_KS: Минимизировать ||[W_S·S; W_KS·K·S; W_T·T]||_∞. W_S — желаемая чувствительность (хотим малой в низких частотах, для подавления возмущений). W_T — желаемая T (хотим малой в высоких частотах, против шума). W_KS — ограничение управляющего усилия.

Решение через два уравнения Риккати (Doyle-Glover-Khargonekar-Francis, 1989). Реализовано в MATLAB Robust Control Toolbox (hinfsyn), Python (python-control).

μ-синтез

Для структурированных неопределённостей (несколько независимых блоков Δ_1, ..., Δ_k): μ — структурированное сингулярное значение.

μ-синтез (D-K итерация): Чередование оптимизации по K (H∞) и масштабирующим матрицам D. На практике сходится к локальному оптимуму. Используется для сложных систем с многими источниками неопределённости.

Адаптивное управление

Идея. Параметры регулятора подстраиваются онлайн под фактические параметры объекта.

Self-Tuning Regulator (STR, Åström). Онлайн-идентификация параметров (RLS — recursive least squares) → пересчёт K. Подходит для медленно меняющихся параметров.

Model Reference Adaptive Control (MRAC, Landau). Эталонная модель задаёт желаемое поведение y_m(t). Закон адаптации параметров минимизирует e_m = y − y_m. Гарантии устойчивости через функции Ляпунова.

Gain scheduling. Готовый набор регуляторов K_1, ..., K_M для разных режимов; переключение по measured-параметрам. Самолёт: разные K на низкой/высокой скорости. Просто, но требует тщательного обоснования при переключениях.

Численный пример: маятник с неизвестной длиной

Маятник: θ̈ = (g/l)·sin θ + u/(m·l²). Длина l ∈ [0.5, 1.5] м, номинальная l₀ = 1 м.

Линеаризация около θ = 0: θ̈ = (g/l)·θ + u/(m·l²) — неустойчиво. ПД-регулятор: u = −K_P·θ − K_D·θ̇.

Замкнутая: θ̈ = (g/l − K_P/(m·l²))·θ − (K_D/(m·l²))·θ̇.

Условие устойчивости: g/l < K_P/(m·l²) → K_P > m·l·g.

При K_P, рассчитанном для l = 1 (m = 1, g = 9.81): K_P > 9.81. Возьмём K_P = 30, K_D = 5.

Проверка для l = 1.5: g/l = 6.54, K_P/(m·l²) = 30/2.25 = 13.33 > 6.54 ✓ устойчиво. Для l = 0.5: g/l = 19.62, K_P/(m·l²) = 30/0.25 = 120 ≫ 19.62, гипер-устойчиво (но возможно перерегулирование).

При l = 3: g/l = 3.27, K_P/(m·l²) = 30/9 = 3.33 — на грани устойчивости. Если l > 3.06 — теряем устойчивость.

Решение через адаптивный элемент. Оценим l онлайн через RLS из θ̈_observed = (g/l)·θ + u/(m·l²). Адаптивный K_P(l̂) = m·l̂·g·(safety factor 3) — гарантированно устойчиво при любом l ∈ [0.5, 3].

Реальные применения

  • Авиация. Все пассажирские самолёты Airbus A320-A380 проектируются по принципам H∞/μ-синтеза, включая систему «control law switching» при отказах. F-16, F-22 — gain-scheduled регуляторы для разных режимов полёта.
  • Жёсткие диски и приводы. Управление позиционированием головки на дорожку — высокоскоростной H∞ регулятор с учётом гибкости подвеса. Точность 1-10 нм.
  • Атомные реакторы. Управление мощностью с гарантиями устойчивости при изменении температуры, выгорании топлива — H∞ синтез.
  • Производство полупроводников. Литографические машины ASML EUV — управление позиционированием с точностью < 1 нм при 10g ускорениях. Робастный синтез — критический компонент.
  • Автомобильный круиз-контроль. Адаптивные регуляторы (ACC) учитывают изменение массы (груз, пассажиры) и наклон дороги.

Задание. Маятник с неизвестной длиной l ∈ [0.5, 1.5] м, m = 1 кг, g = 9.81. Линеаризованная модель около θ = 0: θ̈ = (g/l)·θ + u/(m·l²). (а) Для номинальной модели l₀ = 1 спроектируйте ПД-регулятор u = −K_P·θ − K_D·θ̇ с целью: затухание ζ = 0.7, ω_n = 5 рад/с. (б) Проверьте устойчивость для l = 0.5, 1.0, 1.5: вычислите собственные значения замкнутой системы. (в) Симулируйте отклик при θ(0) = 0.1 рад для всех трёх значений l. (г) Реализуйте простую адаптацию: оцените l методом наименьших квадратов из последних 20 наблюдений (θ, θ̇, u), пересчитайте K_P, K_D в реальном времени. (д) Какова робастность при l = 2 (вне номинального диапазона)?

§ Акт · что дальше