Модуль VI·Статья I·~4 мин чтения
Частные производные и полный дифференциал
Функции многих переменных
Превратить статью в подкаст
Выберите голоса, формат и длину — AI запишет аудио
Частные производные и полный дифференциал
Переход к нескольким переменным
Реальные задачи редко зависят от одной переменной. Температура зависит от координат x, y, z и времени t. Прибыль фирмы — от цен, объёмов, затрат. Потенциальная энергия системы частиц — от положений всех частиц. Анализ функций многих переменных — непосредственный шаг к пониманию реального мира, и именно здесь возникают принципиально новые явления: понятие направленной производной, условные экстремумы, кратные интегралы.
Частные производные
Частная производная f по xᵢ в точке a — это обычная производная по xᵢ при фиксированных остальных переменных:
∂f/∂xᵢ(a) = lim(h→0) [f(a + h·eᵢ) - f(a)] / h.
Для f(x, y) = x²y + sin(y): ∂f/∂x = 2xy (дифференцируем по x, y — параметр), ∂f/∂y = x² + cos(y) (дифференцируем по y, x — параметр).
Экономическая интерпретация: Если f(K, L) — производственная функция (K — капитал, L — труд), то ∂f/∂K — предельный продукт капитала: насколько вырастет выпуск при увеличении капитала на единицу при фиксированных трудовых ресурсах. Функция Кобба–Дугласа f = AK^α L^β: ∂f/∂K = αAK^(α-1)L^β = αf/K. Это означает: предельный продукт капитала пропорционален средней производительности.
Дифференцируемость
Функция f дифференцируема в точке a, если приращение можно записать как:
Δf = Σᵢ (∂f/∂xᵢ) Δxᵢ + o(|Δx|).
Это линейное приближение функции. Полный дифференциал: df = Σᵢ (∂f/∂xᵢ) dxᵢ. Дифференциал — лучшее линейное приближение к изменению функции.
Важно: Дифференцируемость → непрерывность → существование частных производных. Но обратное неверно! Классический контрпример: f(x,y) = xy/(x²+y²) при (x,y) ≠ (0,0) и f(0,0) = 0. Частные производные существуют в нуле (обе равны нулю), но функция разрывна в нуле (предел вдоль y = x равен 1/2 ≠ 0). Поэтому для дифференцируемости нужно проверять условие на остаток o(|Δx|), а не только существование частных производных.
Градиент и производная по направлению
Градиент: ∇f = (∂f/∂x₁, ..., ∂f/∂xₙ) — вектор в ℝⁿ, указывающий направление наибольшего роста функции.
Производная по направлению l (|l| = 1): D_l f = ∇f · l = |∇f| cos θ, где θ — угол между ∇f и l. Максимальна в направлении самого градиента (θ = 0), равна нулю перпендикулярно градиенту.
В машинном обучении: Алгоритм градиентного спуска для минимизации функции потерь L(w): w ← w − η ∇L(w), где η — шаг обучения. На каждой итерации делаем шаг в направлении антиградиента — направлении наибыстрейшего убывания. Это основа обучения нейронных сетей.
Пример: f(x, y) = x² + 4y², ∇f = (2x, 8y). В точке (3, 1): ∇f = (6, 8), |∇f| = 10. Производная по направлению l = (3/5, 4/5): D_l f = 6·3/5 + 8·4/5 = 18/5 + 32/5 = 10.
Теорема о смешанных производных
Если f и все её частные производные первого и второго порядков непрерывны в окрестности точки, то порядок дифференцирования не важен:
∂²f/∂x∂y = ∂²f/∂y∂x (теорема Шварца).
Это свойство часто используется «в обратную сторону»: если ∂²f/∂x∂y ≠ ∂²f/∂y∂x, то точечная производная не существует или не является непрерывной.
Матрица Гессе и достаточное условие экстремума
Матрица Гессе H = (∂²f/∂xᵢ∂xⱼ) — симметричная матрица вторых производных.
Необходимое условие экстремума: В точке внутреннего экстремума ∇f = 0 (стационарная точка).
Достаточное условие (через матрицу Гессе в стационарной точке):
- H положительно определена (все собственные значения > 0) → локальный минимум.
- H отрицательно определена (все собственные значения < 0) → локальный максимум.
- H неопределённого знака (есть положительные и отрицательные) → седловая точка (не экстремум).
Пример: f(x, y) = x³ − 3xy² + y⁴. Стационарные точки: ∂f/∂x = 3x² − 3y² = 0, ∂f/∂y = −6xy + 4y³ = 0. Из первого: x = ±y. В точке (0, 0): H = diag(0, 0) — неопределённо, нужен более тонкий анализ.
Условные экстремумы: метод множителей Лагранжа
Найти экстремум f(x) при ограничении g(x) = 0.
Вводим функцию Лагранжа: L(x, λ) = f(x) − λg(x). Необходимое условие экстремума: ∇L = 0, то есть ∇f = λ∇g. Это означает: в точке условного экстремума градиенты f и g параллельны — линии уровня f касаются ограничения g = 0.
Параметр λ — множитель Лагранжа: он показывает, насколько изменится оптимальное значение f при малом смягчении ограничения g = 0 → g = ε. В экономике: λ — предельная ценность ресурса (как изменится максимальная прибыль при увеличении бюджета на единицу).
Развёрнутый пример: Максимизировать f(x, y) = xy при ограничении g = 2x + 3y − 6 = 0.
L = xy − λ(2x + 3y − 6). Условия: ∂L/∂x = y − 2λ = 0; ∂L/∂y = x − 3λ = 0; g = 0.
Из первых двух: y = 2λ, x = 3λ. В ограничение: 2(3λ) + 3(2λ) = 6 → 12λ = 6 → λ = 1/2. Точка: x = 3/2, y = 1. f(3/2, 1) = 3/2. Проверка: геометрически, f = xy максимально на ограничении при равенстве «взвешенных» вкладов в ограничение.
Метод Лагранжа — основа экономической теории оптимума (максимизация полезности при бюджетном ограничении), задач инженерной оптимизации и, в обобщённой форме, уравнений Эйлера–Лагранжа вариационного исчисления.
§ Акт · что дальше