Эволюционно стабильные стратегии и динамика репликатора

Эволюция вместо рациональности

Классическая теория игр предполагает полностью рациональных игроков, знающих равновесие. Эволюционная теория игр (ЭТИ) предлагает альтернативный фундамент: вместо рациональности — отбор. Особи с более высокой приспособленностью (выигрышем) размножаются быстрее. Равновесие возникает не из рассуждений, а из эволюционной динамики.

Мэйнард Смит и Прайс (1973) разработали ЭТИ для объяснения поведения животных. Затем концепции перенесли на экономику, социологию, информатику. Главный вопрос: какие стратегии «выживают» в популяции?

Эволюционно стабильные стратегии (ЭСС)

Определение: Стратегия σ* является ЭСС, если при достаточно малом вторжении мутантов со стратегией σ ≠ σ* «резидентная» популяция σ* «вытесняет» мутантов:

u(σ*, εσ + (1−ε)σ*) > u(σ, εσ + (1−ε)σ*) для всех σ ≠ σ* и малых ε > 0

Условия ЭСС (достаточные):

u(σ*, σ*) > u(σ, σ*) для всех σ ≠ σ* — строгое равновесие Нэша, ИЛИ
u(σ*, σ*) = u(σ, σ*) И u(σ*, σ) > u(σ, σ) — при «ничьей» против резидентов σ* лучше против мутантов

Связь с РН: ЭСС → равновесие Нэша (в смешанных стратегиях). Обратное неверно: не каждое РН является ЭСС.

Динамика репликатора

В непрерывном времени пусть xᵢ — доля популяции со стратегией i. Динамика репликатора:

ẋᵢ = xᵢ · [uᵢ(x) − ū(x)]

Где uᵢ(x) = Σⱼ xⱼ aᵢⱼ — приспособленность стратегии i, ū(x) = Σᵢ xᵢ uᵢ — средняя приспособленность.

Смысл: стратегии с приспособленностью выше средней растут; ниже средней — убывают. Вектор (xᵢ) остаётся на симплексе Σxᵢ = 1.

Связь с ЭСС: ЭСС — асимптотически устойчивое равновесие динамики репликатора (устойчивое к малым возмущениям). РН, не являющееся ЭСС, может быть нейтрально устойчивым или неустойчивым.

Числовой пример: игра «Ястреб–Голубь»

Популяция со стратегиями: Ястреб (Я) — агрессивный, Голубь (Г) — мирный. Матрица выигрышей при V=4, C=6:

	Ястреб	Голубь
Ястреб	(V−C)/2 = −1	V = 4
Голубь	0	V/2 = 2

При встрече двух ястребов: оба борются, ожидаемый выигрыш (4−6)/2 = −1 каждому. Ястреб–Голубь: ястреб берёт V=4, голубь уходит (0). Два голубя: делят V/2=2 каждому.

Пусть x — доля ястребов, (1−x) — голубей.

u(Я,x) = −1·x + 4·(1−x) = 4 − 5x. u(Г,x) = 0·x + 2·(1−x) = 2 − 2x. ū = x·u(Я) + (1−x)·u(Г).

Равновесие ẋ = 0: u(Я,x) = u(Г,x) → 4 − 5x = 2 − 2x → x* = 2/3. Доля ястребов в равновесии: 2/3 ≈ 67%.

Проверка ЭСС при x* = 2/3: это внутреннее равновесие смешанных стратегий — и оно является ЭСС при V < C. При V > C: «Ястреб» — чистая ЭСС (агрессия оптимальна).

Биологический смысл: при высокой стоимости конфликта C > V эволюция поддерживает смешанную популяцию. Территориальные споры птиц, соревнования за самок — именно такая смешанная стратегия.

Многопопуляционные игры и применения

В несимметричных играх (покупатели–продавцы, самцы–самки): динамика репликатора для двух популяций: ẋᵢ = xᵢ(uᵢ(x,y) − ū_x), ẏⱼ = yⱼ(vⱼ(x,y) − v̄_y). Устойчивость — через якобиан в точке равновесия.

Экономические приложения:

Эволюция стандартов (QWERTY vs Дворак): Два стандарта клавиатуры. Координационная игра: если все используют QWERTY, лучше тоже использовать QWERTY. QWERTY — ЭСС (даже если Дворак «объективно лучше»). Это «path dependence» — зависимость от начального пути.

Ценовые войны в отрасли: Ястреб = снижение цен, Голубь = поддержание высоких цен. При C > V → смешанное равновесие: часть фирм агрессивно снижает, часть — нет.

Биологические приложения:

Соотношение полов: Фишер доказал, что 1:1 — ЭСС. Если самцов < самок → самец имеет более высокую репродуктивную успешность → отбор в пользу рождения самцов → возврат к 1:1.

Альтруизм: правило Гамильтона: альтруистическое поведение ЭСС-стабильно, если r · Δпольза > Δиздержки (r — коэффициент родства). «Ген альтруизма» распространяется через родственников.

Эволюционная теория игр в биологии и экономике

Эволюционная теория игр объясняет, как стратегии распространяются в популяциях без рационального выбора. В биологии динамика репликатора моделирует частотно-зависимый естественный отбор: стратегии с более высокой приспособленностью растут быстрее. Многоуровневый отбор — дилемма между отбором внутри группы (подталкивающим к эгоизму) и между группами (подталкивающим к кооперации) — описывается обобщёнными репликаторами с иерархическими популяциями. В поведенческой экономике концепция «ограниченной рациональности» Саймона сближается с эволюционным равновесием: люди используют правила большого пальца (эвристики), которые стабильны к «вторжению» нестандартных стратегий в смысле ЭСС. Сигнальная игра в эволюционной биологии — реклама о себе: павлиний хвост, пение птиц — стабильные сигналы о качестве генов, ЭСС предсказывает уровень затрат на сигнал. Диффузия инноваций в социальных сетях описывается динамикой репликатора на графах: новая технология распространяется, если она является ЭСС в локальных взаимодействиях. В финансах технические трейдеры, использующие эвристики, выживают только если их стратегии близки к ЭСС в среде с другими игроками — именно это объясняет «техническую магию» рынка.

Задание: (а) При V=2, C=6: найдите ЭСС, равновесную долю ястребов x*. (б) Постройте уравнение динамики репликатора ẋ = x(1−x)(u(Я,x)−u(Г,x)) и покажите, что x* устойчиво. (в) При V=6, C=4: что является ЭСС? Как меняется биологическая интерпретация?