Модуль V·Статья I·~4 мин чтения
Эволюционно стабильные стратегии и динамика репликатора
Эволюционная теория игр
Превратить статью в подкаст
Выберите голоса, формат и длину — AI запишет аудио
Эволюционно стабильные стратегии и динамика репликатора
Эволюция вместо рациональности
Классическая теория игр предполагает полностью рациональных игроков, знающих равновесие. Эволюционная теория игр (ЭТИ) предлагает альтернативный фундамент: вместо рациональности — отбор. Особи с более высокой приспособленностью (выигрышем) размножаются быстрее. Равновесие возникает не из рассуждений, а из эволюционной динамики.
Мэйнард Смит и Прайс (1973) разработали ЭТИ для объяснения поведения животных. Затем концепции перенесли на экономику, социологию, информатику. Главный вопрос: какие стратегии «выживают» в популяции?
Эволюционно стабильные стратегии (ЭСС)
Определение: Стратегия σ* является ЭСС, если при достаточно малом вторжении мутантов со стратегией σ ≠ σ* «резидентная» популяция σ* «вытесняет» мутантов:
u(σ*, εσ + (1−ε)σ*) > u(σ, εσ + (1−ε)σ*) для всех σ ≠ σ* и малых ε > 0
Условия ЭСС (достаточные):
- u(σ*, σ*) > u(σ, σ*) для всех σ ≠ σ* — строгое равновесие Нэша, ИЛИ
- u(σ*, σ*) = u(σ, σ*) И u(σ*, σ) > u(σ, σ) — при «ничьей» против резидентов σ* лучше против мутантов
Связь с РН: ЭСС → равновесие Нэша (в смешанных стратегиях). Обратное неверно: не каждое РН является ЭСС.
Динамика репликатора
В непрерывном времени пусть xᵢ — доля популяции со стратегией i. Динамика репликатора:
ẋᵢ = xᵢ · [uᵢ(x) − ū(x)]
Где uᵢ(x) = Σⱼ xⱼ aᵢⱼ — приспособленность стратегии i, ū(x) = Σᵢ xᵢ uᵢ — средняя приспособленность.
Смысл: стратегии с приспособленностью выше средней растут; ниже средней — убывают. Вектор (xᵢ) остаётся на симплексе Σxᵢ = 1.
Связь с ЭСС: ЭСС — асимптотически устойчивое равновесие динамики репликатора (устойчивое к малым возмущениям). РН, не являющееся ЭСС, может быть нейтрально устойчивым или неустойчивым.
Числовой пример: игра «Ястреб–Голубь»
Популяция со стратегиями: Ястреб (Я) — агрессивный, Голубь (Г) — мирный. Матрица выигрышей при V=4, C=6:
| Ястреб | Голубь | |
|---|---|---|
| Ястреб | (V−C)/2 = −1 | V = 4 |
| Голубь | 0 | V/2 = 2 |
При встрече двух ястребов: оба борются, ожидаемый выигрыш (4−6)/2 = −1 каждому. Ястреб–Голубь: ястреб берёт V=4, голубь уходит (0). Два голубя: делят V/2=2 каждому.
Пусть x — доля ястребов, (1−x) — голубей.
u(Я,x) = −1·x + 4·(1−x) = 4 − 5x. u(Г,x) = 0·x + 2·(1−x) = 2 − 2x. ū = x·u(Я) + (1−x)·u(Г).
Равновесие ẋ = 0: u(Я,x) = u(Г,x) → 4 − 5x = 2 − 2x → x* = 2/3. Доля ястребов в равновесии: 2/3 ≈ 67%.
Проверка ЭСС при x* = 2/3: это внутреннее равновесие смешанных стратегий — и оно является ЭСС при V < C. При V > C: «Ястреб» — чистая ЭСС (агрессия оптимальна).
Биологический смысл: при высокой стоимости конфликта C > V эволюция поддерживает смешанную популяцию. Территориальные споры птиц, соревнования за самок — именно такая смешанная стратегия.
Многопопуляционные игры и применения
В несимметричных играх (покупатели–продавцы, самцы–самки): динамика репликатора для двух популяций: ẋᵢ = xᵢ(uᵢ(x,y) − ū_x), ẏⱼ = yⱼ(vⱼ(x,y) − v̄_y). Устойчивость — через якобиан в точке равновесия.
Экономические приложения:
Эволюция стандартов (QWERTY vs Дворак): Два стандарта клавиатуры. Координационная игра: если все используют QWERTY, лучше тоже использовать QWERTY. QWERTY — ЭСС (даже если Дворак «объективно лучше»). Это «path dependence» — зависимость от начального пути.
Ценовые войны в отрасли: Ястреб = снижение цен, Голубь = поддержание высоких цен. При C > V → смешанное равновесие: часть фирм агрессивно снижает, часть — нет.
Биологические приложения:
Соотношение полов: Фишер доказал, что 1:1 — ЭСС. Если самцов < самок → самец имеет более высокую репродуктивную успешность → отбор в пользу рождения самцов → возврат к 1:1.
Альтруизм: правило Гамильтона: альтруистическое поведение ЭСС-стабильно, если r · Δпольза > Δиздержки (r — коэффициент родства). «Ген альтруизма» распространяется через родственников.
Эволюционная теория игр в биологии и экономике
Эволюционная теория игр объясняет, как стратегии распространяются в популяциях без рационального выбора. В биологии динамика репликатора моделирует частотно-зависимый естественный отбор: стратегии с более высокой приспособленностью растут быстрее. Многоуровневый отбор — дилемма между отбором внутри группы (подталкивающим к эгоизму) и между группами (подталкивающим к кооперации) — описывается обобщёнными репликаторами с иерархическими популяциями. В поведенческой экономике концепция «ограниченной рациональности» Саймона сближается с эволюционным равновесием: люди используют правила большого пальца (эвристики), которые стабильны к «вторжению» нестандартных стратегий в смысле ЭСС. Сигнальная игра в эволюционной биологии — реклама о себе: павлиний хвост, пение птиц — стабильные сигналы о качестве генов, ЭСС предсказывает уровень затрат на сигнал. Диффузия инноваций в социальных сетях описывается динамикой репликатора на графах: новая технология распространяется, если она является ЭСС в локальных взаимодействиях. В финансах технические трейдеры, использующие эвристики, выживают только если их стратегии близки к ЭСС в среде с другими игроками — именно это объясняет «техническую магию» рынка.
Задание: (а) При V=2, C=6: найдите ЭСС, равновесную долю ястребов x*. (б) Постройте уравнение динамики репликатора ẋ = x(1−x)(u(Я,x)−u(Г,x)) и покажите, что x* устойчиво. (в) При V=6, C=4: что является ЭСС? Как меняется биологическая интерпретация?
§ Акт · что дальше