Теория экстремальных значений

Большинство классических методов статистики — оценка среднего, дисперсии, корреляции — работают «в центре» распределения. Но в риск-менеджменте важны крайние, редкие события: «100-летнее наводнение», крах рынка типа Black Monday, катастрофа уровня Чернобыля. Экстраполировать на основе нормального распределения здесь нельзя — реальные хвосты намного «толще». Теория экстремальных значений (Extreme Value Theory, EVT) — раздел вероятности, дающий универсальный аппарат для анализа таких событий. Аналогично тому, как Центральная предельная теорема описывает поведение средних, теоремы Гнеденко и Пикандса-Балкема-де Хаана описывают поведение максимумов и хвостов.

Теорема Гнеденко-Фишера-Типпетта (GEV)

Проблема. Имеем n iid наблюдений X_1, ..., X_n. Как распределён максимум M_n = max(X_1, ..., X_n) при n → ∞?

Без нормировки M_n → +∞ (тривиально). Нормируем: ищем последовательности a_n > 0, b_n такие, что (M_n − b_n)/a_n сходится к невырожденному распределению.

Теорема Гнеденко (1943): если предел существует, он принадлежит обобщённому распределению экстремальных значений (GEV):

G_ξ(x) = exp(−(1 + ξ·x)^{−1/ξ}), 1 + ξ·x > 0.

При ξ = 0 (предельный случай): G_0(x) = exp(−e^{−x}).

Три класса по параметру формы ξ:

ξ = 0 (Gumbel): лёгкие хвосты. Распределения: нормальное, лог-нормальное, экспоненциальное, гамма.
ξ > 0 (Fréchet): тяжёлые хвосты, степенное затухание P(X > x) ~ x^{−1/ξ}. Распределения: Парето, Стьюдент с df < ∞, Cauchy. Финансовые убытки, наводнения, страховые иски.
ξ < 0 (Weibull): ограниченный хвост (X ≤ x_max). Распределения: равномерное, бета. Редко в природных явлениях.

Параметризация с location μ и scale σ: G_{ξ, μ, σ}(x) = G_ξ((x − μ)/σ).

Метод Block Maxima

Алгоритм.

Разбить данные на блоки длины k (например, годовые максимумы для природных данных).
Взять максимум в каждом блоке: M_1, M_2, ..., M_n.
Подобрать GEV(ξ, μ, σ) методом максимального правдоподобия по {M_i}.

Недостаток. Использует только n из N·k данных — много информации теряется, особенно при коротких рядах.

Generalized Pareto Distribution (GPD)

Подход POT (Peaks Over Threshold). Используем все наблюдения выше порога u — больше данных.

Теорема Пикандса-Балкема-де Хаана (1974-75): для широкого класса распределений при достаточно высоком u условное распределение превышений (X − u | X > u) сходится к GPD:

H_{ξ, σ}(y) = 1 − (1 + ξ·y/σ)^{−1/ξ}, y ≥ 0.

При ξ = 0: H_0(y) = 1 − e^{−y/σ} (экспоненциальное).

Связь GEV и GPD: ξ_GPD = ξ_GEV. Если максимумы — Fréchet, то превышения — Pareto.

Оценка хвостового VaR

При вероятности превышения порога p_u = P(X > u) и параметрах GPD ξ, σ:

VaR_α(X) = u + (σ/ξ)·[(p_u/(1 − α))^{ξ} − 1] (при ξ ≠ 0).

При ξ = 0: VaR_α(X) = u + σ·ln(p_u/(1 − α)).

CVaR_α(X) = (VaR_α + σ − ξ·u)/(1 − ξ) при ξ < 1.

Численный пример

Дневные доходности S&P 500 за 10 лет (2014-2024), ~2520 точек. Берём убытки (−r), порог u = 2% (т.е. дни с убытком > 2%).

Превышений n_u = 65 (≈ 2.6% дней). p_u = 65/2520 = 0.0258.

Подгонка GPD методом MLE: ξ̂ = 0.18 (положительная — тяжёлый хвост, типично для финансов), σ̂ = 1.42%.

VaR_{0.99}: (1 − α)/p_u = 0.01/0.0258 = 0.388. VaR_{0.99} = 2% + (1.42/0.18)·[0.388^{−0.18} − 1] = 2% + 7.89·[1.171 − 1] = 2% + 1.35% = 3.35%.

VaR_{0.999}: (1 − α)/p_u = 0.001/0.0258 = 0.0388. VaR_{0.999} = 2% + 7.89·[0.0388^{−0.18} − 1] = 2% + 7.89·[1.823 − 1] = 2% + 6.49% = 8.49%.

CVaR_{0.99} = (3.35% + 1.42% − 0.18·2%)/(1 − 0.18) = 4.41%/0.82 = 5.38%.

Сравнение с нормальным приближением. σ исторических доходностей ≈ 1.0%. Normal VaR_{0.999} = 2.326·1% = 3.10% — в 2.7 раза недооценивает реальный хвостовой риск (8.49% vs. 3.10%).

Это и есть «черные лебеди»: события, невероятные по нормальной модели, но реальные.

Mean Excess Function

MEF: e(u) = E[X − u | X > u]. Графический инструмент выбора порога u.

Для GPD: e(u) = (σ + ξ·u)/(1 − ξ) — линейная по u. Если эмпирический MEF становится линейным выше u_0 — это хороший выбор порога.

Применения EVT

1. Гидрология. «100-летнее наводнение» — VaR_{0.99} по годовым максимумам уровня воды. Без EVT: 50 лет данных дают 0 наблюдений уровня выше «100-летнего» в среднем (хотя возможны 1-2 в одной выборке). EVT позволяет экстраполировать в хвост.

Пример: проектирование плотины Three Gorges в Китае использовало EVT для оценки 1-в-1000-лет паводка.

2. Страхование катастроф. PML (Probable Maximum Loss) — потери при 1-в-200-лет (Solvency II) или 1-в-250-лет (Lloyd's RDS) сценарии. EVT-калибровка по историческим катастрофам (ураганы, землетрясения) с поправкой на инфляцию и рост экспозиций.

3. Гидрометеорология. Высота волн (для проектирования платформ Северного моря), скорость ветра (для ветрогенераторов), осадки (для канализации).

4. Кибер-безопасность. Размер data breach: распределение Парето с очень тяжёлыми хвостами (ξ > 0.5). Equifax 2017 — 147 млн записей, Yahoo 2016 — 3 млрд.

Реальные применения

Solvency II SCR. Страховые компании используют EVT для калибровки 1-в-200-лет сценариев катастроф. RMS, AIR Worldwide — основные провайдеры моделей.
Basel FRTB. Stressed Expected Shortfall — calibration на стрессовом периоде, часто с EVT-методами для tail.
Reinsurance pricing (Munich Re, Swiss Re). Экстраполяция убытков в хвост — основа премий за CatXL и Stop Loss.
Climate risk modelling. IPCC использует EVT для оценки изменения экстремальных температур, осадков под изменением климата.
Operational risk. Severe loss events (rogue trader Société Générale 2008 — €4.9 млрд, JPMorgan London Whale 2012 — $6.2 млрд) — экстраполяция тяжёлых хвостов через POT-EVT.

Задание. Дневные доходности S&P 500 за 10 лет (можно скачать с Yahoo Finance, либо сгенерировать GARCH(1,1) симуляцию). Берём убытки (−r). (а) Постройте Mean Excess Plot e(u) для u ∈ [0, 5%]. Выберите подходящий порог u*. (б) Подгоните GPD методом MLE (scipy.stats.genpareto.fit) к превышениям над u*. (в) Вычислите VaR_{0.99}, VaR_{0.999}, CVaR_{0.99} двумя способами: EVT и нормальное приближение. (г) Сравните оценки и обсудите различия. (д) Бонус: проведите backtesting — сколько наблюдений превысили VaR_{0.99} в out-of-sample периоде? Соответствует ли уровню 1%?