Модуль I·Статья III·~5 мин чтения
Задача преследования-уклонения
Введение в дифференциальные игры
Превратить статью в подкаст
Выберите голоса, формат и длину — AI запишет аудио
Задача преследования-уклонения
Самая старая игра мира
Охотник преследует зайца. Лиса гонится за кроликом. Военный перехватчик — за целью. Задача преследования-уклонения (Pursuit-Evasion, PE) — одна из древнейших прикладных математических задач. Айзекс придал ей строгую математическую форму и открыл первые удивительные результаты: оптимальная стратегия не всегда «лети прямо к противнику». Иногда нужно «упреждать». В сложных случаях стратегия определяется топологией пространства и «барьерной поверхностью», разделяющей зоны захвата и уклонения.
Постановка: простейший вариант
Два игрока в ℝ². Преследователь P с позицией xP ∈ ℝ², скорость |u| ≤ α. Убегающий E с позицией xE ∈ ℝ², скорость |v| ≤ β.
Динамика: ẋP = u, ẋE = v, |u| ≤ α, |v| ≤ β.
Расстояние: r(t) = |xP(t) − xE(t)|.
Захват: r(t) ≤ l (захватывающий радиус). P хочет достигнуть захвата, E — избежать.
Три основных случая
Случай 1: α > β (P быстрее)
Захват гарантирован при любой стратегии E. Оптимальная стратегия P: Pure Pursuit (просто лети к E) — обеспечивает захват за конечное время.
Но не оптимальна по времени захвата! Оптимальная стратегия: Constant Bearing Navigation (курс постоянного пеленга) — угол «пеленга» (угол на цель) остаётся постоянным. Это стратегия, используемая ракетами PN (Proportional Navigation).
Почему Pure Pursuit субоптимальна? При «крутых» манёврах цели P «тянется» за E, проходя больший путь. Constant Bearing держит «курс перехвата» и сокращает расстояние быстрее.
Случай 2: α = β (одинаковые скорости)
Захват возможен, если E «к западу» от P или другие специфические начальные условия. «Классическая игра в кошки-мышки» — неоднозначный случай.
Случай 3: α < β (E быстрее)
Уклонение гарантировано. Оптимальная стратегия E: бежать напрямую от P (максимизировать расстояние).
Игра Айзекса «Homicidal Chauffeur»
Более интересный случай: P — автомобиль с минимальным радиусом поворота r (кинематически ограниченный), E — пешеход. Иногда ограниченная маневренность P позволяет E уйти даже при меньшей скорости!
Динамика P: ẋP = α cos θ, ẏP = α sin θ, θ̇ = u/r (u ∈ [−1,1]). Динамика E: ẋE = v₁, ẏE = v₂, v₁² + v₂² ≤ β².
Барьерная поверхность: Айзекс нашёл геометрию области начальных условий, из которых захват гарантирован (Capture Zone) и из которых уклонение гарантировано (Escape Zone). Граница — «барьер» — является особым решением HJI.
Стратегия «упреждения» (Proportional Navigation)
В реальных ракетных системах используется пропорциональная навигация (PN):
aN = N · |r| · LOS_rate
где aN — поперечное ускорение ракеты, N — навигационная константа (обычно 3-5), LOS_rate — угловая скорость линии визирования (Line of Sight).
Оптимальность: при линейной динамике и малом угле PN с N → ∞ оптимальна. При N = 4-5 практически близка к оптимуму.
Почему PN работает: цель перехвата — точка в будущем («упреждающая точка»), а не текущее положение цели. PN автоматически вычисляет упреждение через угловую скорость.
Численный пример: оптимальное время захвата
Параметры: P и E в ℝ², α = 2, β = 1, l = 0 (точечный захват). Начальные позиции: xP = (0,0), xE = (10, 0).
Оптимальная стратегия P (straight line chase): лети напрямую к xE(t). Так как α = 2β, P нагоняет E: dr/dt = −(α − β·cos φ), где φ — угол между u и v.
При оптимальной стратегии E (максимизировать r): v направлен прочь от P, φ = π. Тогда dr/dt = −(α − β) = −1. Время захвата: T = r₀ = 10.
Если E маневрирует поперечно: P всё равно нагонит (α > β), только нелинейной траекторией. Время будет > 10.
Применения в автономных системах
Беспилотники: задача безопасного избегания столкновений — реверс задачи преследования. Автомобиль A хочет «убежать» от B, чтобы не столкнуться. Оптимальный «убегающий» алгоритм минимизирует риск.
Multi-UAV захват: группа преследователей против одного убегающего. Результат: достаточно 2 скоординированных преследователя для гарантированного захвата даже более быстрого E в ограниченном пространстве.
Роботы: patrol-evader задача для автономных охранных роботов. Библиотека SafeRL использует HJI для вычисления «безопасных» управлений в реальном времени.
Игры с препятствиями
В реальных задачах преследования пространство содержит препятствия — стены, здания, запретные зоны. Это резко усложняет задачу: оптимальные траектории огибают препятствия, и аналитические решения редки. Численное решение HJI на сетке учитывает геометрию через граничные условия. Современные методы (Reach-avoid HJ analysis, Tomlin et al.) вычисляют «безопасные множества» — состояния, из которых преследователь гарантированно достигает цели, избегая столкновений с препятствиями.
Кооперативное преследование
Когда несколько преследователей действуют совместно, задача становится принципиально другой: даже более медленные преследователи могут гарантированно поймать быстрого убегающего, если их количество достаточно. Классический результат: в плоскости 3 кругов (область внутри окружности) достаточно одного преследователя любой ненулевой скорости для гарантированного захвата (теорема о львах и людях). На полуплоскости при равных скоростях достаточно одного, на плоскости — требуются специальные стратегии. В играх pursuit на графах задача определения числа необходимых преследователей называется cop number и связана с топологией графа.
Игры с неполной информацией
В реальных задачах преследователь не всегда видит убегающего точно. Возникают игры с частичной информацией: преследователь имеет шумные измерения, должен оценивать состояние и одновременно действовать. Это объединение задач теории оценивания (фильтр Калмана) и теории дифференциальных игр. Sub-class: Search games — преследователь не видит цель вообще и должен искать её случайным или детерминированным паттерном.
Реализация в реальном времени
Для практических систем (автономных автомобилей, дронов) задача преследования-уклонения должна решаться в реальном времени:
- Offline: предвычислить функцию ценности V на сетке состояний
- Online: lookup ближайшего значения V и градиента, выбор оптимального управления
- MPC (Model Predictive Control): на каждом шаге решать задачу оптимизации на коротком горизонте
Применения
- Военная авиация: системы автоматического перехвата (AIM-120 AMRAAM, Patriot)
- Космос: маневрирование спутников для уклонения от обломков
- Безопасность: автоматические системы охраны периметра
- Спорт: анализ оптимальных стратегий в командных играх (хоккей, футбол)
- Биология: моделирование охоты хищников, эволюция систем «хищник-жертва»
§ Акт · что дальше