Модуль II·Статья IV·~1 мин чтения
Machine Learning в продуктах: от идеи до продакшна
Данные и аналитика для бизнеса
Превратить статью в подкаст
Выберите голоса, формат и длину — AI запишет аудио
Machine Learning в продуктах: от идеи до продакшна
Жизненный цикл ML-проекта
1. Постановка задачи: ML-задача должна соответствовать бизнес-задаче. «Уменьшить отток клиентов» → «предсказать вероятность оттока в следующие 30 дней» (классификация).
2. Сбор и подготовка данных: 80% времени ML-проекта. Чистка данных, обработка пропусков, feature engineering (создание признаков из сырых данных).
3. Выбор модели и обучение: простые модели (логистическая регрессия, дерево решений) → ансамбли (Random Forest, XGBoost) → нейронные сети. Правило: начинай с простого.
4. Оценка модели: метрики зависят от задачи: Accuracy, Precision, Recall, F1 (классификация); RMSE, MAE (регрессия); AUC-ROC (вероятностная классификация).
5. Деплой (MLOps): модель в продакшне ≠ модель в ноутбуке. MLOps — практики развёртывания и поддержки ML-моделей: версионирование, мониторинг дрейфа данных, переобучение.
6. Мониторинг: модели деградируют. Data drift (изменение входных данных) и concept drift (изменение зависимости) требуют регулярного переобучения.
Feature Engineering: искусство создания признаков
Качество признаков важнее сложности алгоритма. Примеры feature engineering: из даты транзакции → день недели, час дня, дней до конца месяца; из текста → TF-IDF, word embeddings; из геолокации → расстояние до ближайшего конкурента.
Когда НЕ нужен ML
ML — не всегда лучший инструмент. Правила: (1) если проблема решается правилами — используй правила; (2) если данных мало (<1000 примеров для большинства задач) — ML не работает; (3) если не нужна автоматизация — используй аналитику.
Практическое задание
E-commerce компания хочет предсказать, вернётся ли клиент на следующий месяц. Данные: история покупок за 2 года, 500 000 клиентов. (1) Сформулируйте ML-задачу (тип, целевая переменная). (2) Предложите 10 признаков для модели. (3) Какую метрику используете для оценки? Почему? (4) Как использовать результаты модели в бизнесе?
§ Акт · что дальше