Частные производные и полный дифференциал

Переход к нескольким переменным

Реальные задачи редко зависят от одной переменной. Температура зависит от координат x, y, z и времени t. Прибыль фирмы — от цен, объёмов, затрат. Потенциальная энергия системы частиц — от положений всех частиц. Анализ функций многих переменных — непосредственный шаг к пониманию реального мира, и именно здесь возникают принципиально новые явления: понятие направленной производной, условные экстремумы, кратные интегралы.

Частные производные

Частная производная f по xᵢ в точке a — это обычная производная по xᵢ при фиксированных остальных переменных:

∂f/∂xᵢ(a) = lim(h→0) [f(a + h·eᵢ) - f(a)] / h.

Для f(x, y) = x²y + sin(y): ∂f/∂x = 2xy (дифференцируем по x, y — параметр), ∂f/∂y = x² + cos(y) (дифференцируем по y, x — параметр).

Экономическая интерпретация: Если f(K, L) — производственная функция (K — капитал, L — труд), то ∂f/∂K — предельный продукт капитала: насколько вырастет выпуск при увеличении капитала на единицу при фиксированных трудовых ресурсах. Функция Кобба–Дугласа f = AK^α L^β: ∂f/∂K = αAK^(α-1)L^β = αf/K. Это означает: предельный продукт капитала пропорционален средней производительности.

Дифференцируемость

Функция f дифференцируема в точке a, если приращение можно записать как:

Δf = Σᵢ (∂f/∂xᵢ) Δxᵢ + o(|Δx|).

Это линейное приближение функции. Полный дифференциал: df = Σᵢ (∂f/∂xᵢ) dxᵢ. Дифференциал — лучшее линейное приближение к изменению функции.

Важно: Дифференцируемость → непрерывность → существование частных производных. Но обратное неверно! Классический контрпример: f(x,y) = xy/(x²+y²) при (x,y) ≠ (0,0) и f(0,0) = 0. Частные производные существуют в нуле (обе равны нулю), но функция разрывна в нуле (предел вдоль y = x равен 1/2 ≠ 0). Поэтому для дифференцируемости нужно проверять условие на остаток o(|Δx|), а не только существование частных производных.

Градиент и производная по направлению

Градиент: ∇f = (∂f/∂x₁, ..., ∂f/∂xₙ) — вектор в ℝⁿ, указывающий направление наибольшего роста функции.

Производная по направлению l (|l| = 1): D_l f = ∇f · l = |∇f| cos θ, где θ — угол между ∇f и l. Максимальна в направлении самого градиента (θ = 0), равна нулю перпендикулярно градиенту.

В машинном обучении: Алгоритм градиентного спуска для минимизации функции потерь L(w): w ← w − η ∇L(w), где η — шаг обучения. На каждой итерации делаем шаг в направлении антиградиента — направлении наибыстрейшего убывания. Это основа обучения нейронных сетей.

Пример: f(x, y) = x² + 4y², ∇f = (2x, 8y). В точке (3, 1): ∇f = (6, 8), |∇f| = 10. Производная по направлению l = (3/5, 4/5): D_l f = 6·3/5 + 8·4/5 = 18/5 + 32/5 = 10.

Теорема о смешанных производных

Если f и все её частные производные первого и второго порядков непрерывны в окрестности точки, то порядок дифференцирования не важен:

∂²f/∂x∂y = ∂²f/∂y∂x (теорема Шварца).

Это свойство часто используется «в обратную сторону»: если ∂²f/∂x∂y ≠ ∂²f/∂y∂x, то точечная производная не существует или не является непрерывной.

Матрица Гессе и достаточное условие экстремума

Матрица Гессе H = (∂²f/∂xᵢ∂xⱼ) — симметричная матрица вторых производных.

Необходимое условие экстремума: В точке внутреннего экстремума ∇f = 0 (стационарная точка).

Достаточное условие (через матрицу Гессе в стационарной точке):

H положительно определена (все собственные значения > 0) → локальный минимум.
H отрицательно определена (все собственные значения < 0) → локальный максимум.
H неопределённого знака (есть положительные и отрицательные) → седловая точка (не экстремум).

Пример: f(x, y) = x³ − 3xy² + y⁴. Стационарные точки: ∂f/∂x = 3x² − 3y² = 0, ∂f/∂y = −6xy + 4y³ = 0. Из первого: x = ±y. В точке (0, 0): H = diag(0, 0) — неопределённо, нужен более тонкий анализ.

Условные экстремумы: метод множителей Лагранжа

Найти экстремум f(x) при ограничении g(x) = 0.

Вводим функцию Лагранжа: L(x, λ) = f(x) − λg(x). Необходимое условие экстремума: ∇L = 0, то есть ∇f = λ∇g. Это означает: в точке условного экстремума градиенты f и g параллельны — линии уровня f касаются ограничения g = 0.

Параметр λ — множитель Лагранжа: он показывает, насколько изменится оптимальное значение f при малом смягчении ограничения g = 0 → g = ε. В экономике: λ — предельная ценность ресурса (как изменится максимальная прибыль при увеличении бюджета на единицу).

Развёрнутый пример: Максимизировать f(x, y) = xy при ограничении g = 2x + 3y − 6 = 0.

L = xy − λ(2x + 3y − 6). Условия: ∂L/∂x = y − 2λ = 0; ∂L/∂y = x − 3λ = 0; g = 0.

Из первых двух: y = 2λ, x = 3λ. В ограничение: 2(3λ) + 3(2λ) = 6 → 12λ = 6 → λ = 1/2. Точка: x = 3/2, y = 1. f(3/2, 1) = 3/2. Проверка: геометрически, f = xy максимально на ограничении при равенстве «взвешенных» вкладов в ограничение.

Метод Лагранжа — основа экономической теории оптимума (максимизация полезности при бюджетном ограничении), задач инженерной оптимизации и, в обобщённой форме, уравнений Эйлера–Лагранжа вариационного исчисления.