Центральная предельная теорема

Центральная предельная теорема (ЦПТ) — один из важнейших результатов математики. Она объясняет, почему нормальное распределение встречается повсеместно: сумма большого числа независимых случайных величин приближается к нормальному.

Классическая ЦПТ

Теорема (Линдеберг-Леви): Для i.i.d. X₁,...,Xₙ с E[Xᵢ]=μ, Var[Xᵢ]=σ² < ∞: (X̄ₙ - μ)/(σ/√n) →_d N(0,1). Эквивалентно: (Sₙ - nμ)/(σ√n) →_d N(0,1).

Скорость сходимости (Berry-Esseen): |P((Sₙ-nμ)/(σ√n) ≤ x) - Φ(x)| ≤ C·ρ/(σ³√n), где ρ = E[|X-μ|³]. При C ≤ 0.4748. Скорость O(1/√n).

Доказательство через характеристические функции: φ_{(Sₙ-nμ)/(σ√n)}(t) = [φ_X(t/(σ√n))]ⁿ. Разложением φ_X(t) ≈ 1 - t²/2 + ... при малых t: → exp(-t²/2) = φ_{N(0,1)}(t). Теорема непрерывности Леви → CDF сходится к нормальной.

Обобщения ЦПТ

Теорема Линдеберга: Для не i.i.d. независимых Xₖ (при условии Линдеберга об «однородности»): Sₙ/(Var[Sₙ])^{1/2} →d N(0,1). Условие Линдеберга: 1/Bₙ² Σ E[Xₖ²·1{|Xₖ|>εBₙ}] → 0.

Многомерная ЦПТ: Для векторов Xᵢ: n^{-1/2}(Sₙ - nμ) →_d N(0, Σ), Σ = Cov(X).

Применения ЦПТ

Нормальное приближение в статистике: t-тест, z-тест опираются на ЦПТ. При n≥30: X̄ ~ N(μ, σ²/n) приближённо.

Страхование: Суммарные убытки S_n = X₁+...+Xₙ ~ N(nμ, nσ²). Компания резервирует P(S_n > R) < α → R = nμ + z_α·σ√n.

Задание: (а) X~Bin(100, 0.3). Нормальное приближение: P(X≤25). Сравните с точным. Нужна поправка на непрерывность? (б) Цена акции сложная мультипликативно: Sₙ = S₀·∏ᵢRᵢ, Rᵢ ~ i.i.d. ЦПТ для ln(Sₙ/S₀). Что это означает? (в) 10000 страховых полисов, μ=500 руб., σ=200 руб. Какой резерв нужен для покрытия с P=0.999?

Скорость сходимости в ЦПТ

Теорема Берри-Эссена: Пусть Xᵢ i.i.d., E[X]=0, E[X²]=σ², E[|X|³]=ρ<∞. Тогда sup_x |P(Sₙ/(σ√n) ≤ x) − Φ(x)| ≤ Cρ/(σ³√n), где C ≤ 0.4748. Скорость сходимости O(1/√n). Для Bernoulli(p): ρ/σ³ = (p²+(1-p)²)/(p(1-p))^{1/2} максимальна при p → 0 или 1 — нормальное приближение хуже для несимметричных.

Разложение Эджворта: Расширяет ЦПТ, включая поправки порядка n^{-1/2}: F_n(x) = Φ(x) − φ(x)[κ₃/(6σ³√n)·H₂(x)] + O(n⁻¹), где Hₖ — полиномы Эрмита, κ₃ — третий кумулянт. Позволяет строить более точные доверительные интервалы (bootstrap studentized CI).

Многомерная ЦПТ и функциональные пределы

Для вектора X = (X₁,...,Xₖ) i.i.d. с ковариационной матрицей Σ: √n(X̄ₙ − μ) → Nₖ(0, Σ) по распределению. Дельта-метод: если g: ℝᵏ → ℝ дифференцируемо, то √n(g(X̄ₙ) − g(μ)) → N(0, ∇g(μ)ᵀ Σ ∇g(μ)). Применение: асимптотические доверительные интервалы для функций выборочных моментов.

Функциональная ЦПТ (теорема Донскера): Пусть Sₙ(t) = S_{⌊nt⌋}/(σ√n) — нормированный случайный процесс частичных сумм. При n→∞: Sₙ(·) → W(·) (броуновское движение) в пространстве C[0,1] с топологией равномерной сходимости. Это «непрерывная версия» ЦПТ — предельный процесс, а не предельное распределение.

Пуассоновская аппроксимация: теорема Чен-Стейна

Метод Стейна-Чена даёт оценку скорости сходимости к Пуассону. Для суммы зависимых индикаторов S = ΣXᵢ, λ = E[S]: d_TV(S, Poisson(λ)) ≤ (b₁+b₂)/λ, где b₁,b₂ выражаются через попарные зависимости. Применяется в анализе числа редких совпадений: число «совпадений» в случайной перестановке, число клик в случайном графе.

Обобщённая ЦПТ и устойчивые распределения

Устойчивые распределения: X устойчиво, если X = aX₁ + bX₂ (i.i.d.) имеет то же распределение с точностью до сдвига. Нормальное, Коши, распределение Леви — устойчивые. Параметр устойчивости α ∈ (0,2]: α=2 → нормальное. Область притяжения: распределения с тяжёлыми хвостами P(X>x) ~ Cx^{−α} при α < 2 стягиваются к устойчивому. Обобщённая ЦПТ: Gnedenko-Kolmogorov (1954) — полная характеризация пределов сумм i.i.d. через устойчивые законы.

Случайные матрицы и спектральные распределения

Закон Вигнера (полукруговой): для симметричной матрицы Wₙ с i.i.d. элементами (выше диагонали) и нулевыми средними: при n→∞ эмпирическое распределение собственных значений → полукруговое: f(x) = (2/π)√(1−x²) на [−1,1]. Закон Марченко-Пастур: для прямоугольных матриц X (n×p, p/n→c) спектральное распределение матрицы XᵀX/n имеет плотность Марченко-Пастура. Применение: случайные матрицы в PCA — шумовые собственные значения следуют закону МП.

Теорема непрерывности Леви

Последовательность распределений Fₙ сходится слабо к F тогда и только тогда, когда характеристические функции φₙ(t) → φ(t) поточечно для всех t, а φ непрерывна в 0. Это мощный инструмент: позволяет доказывать ЦПТ и другие теоремы предела через анализ ХФ, минуя прямую работу с распределениями.

Скорость сходимости в ЦПТ: неравенство Берри-Эссена

Оценка скорости сходимости: sup_x |P(X̄_n−μ)/σ·√n ≤ x) − Φ(x)| ≤ C·E[|X|³]/(σ³√n). Константа C ≤ 0.4748 (Шевцова, 2011). Практическое следствие: нормальная аппроксимация хороша при n ≥ 30 для симметричных и при n ≥ 100 для сильно асимметричных распределений. Для тяжёлых хвостов (конечный третий момент отсутствует) ЦПТ неприменима в чистом виде.

Численный пример: нормальная аппроксимация суммы

Задача: X₁,...,X₃₆ ~ Uniform(0,1). Найти P(S₃₆ > 20), где S = X₁+...+X₃₆.

Шаг 1: E[Xᵢ]=1/2, Var[Xᵢ]=1/12. Для суммы: E[S₃₆]=36·(1/2)=18, Var[S₃₆]=36·(1/12)=3.

Шаг 2: По ЦПТ: S₃₆ ≈ N(18, 3). Стандартизируем: Z = (S₃₆−18)/√3.

Шаг 3: P(S₃₆>20) = P(Z>(20−18)/1.732) = P(Z>1.155) = 1−Φ(1.155) ≈ 1−0.876 = 0.124.

Шаг 4: Точность оценки по Берри-Эссену: E[|X−1/2|³]=1/32; σ³=(1/12)^{3/2}≈0.0241; n=36. Погрешность ≤ 0.4748·(1/32)/(0.0241·6) ≈ 0.010. ЦПТ-аппроксимация ошибается менее чем на 1%.