Big Data & ML·Курс
Большие данные и машинное обучение
Курс по большим данным: Hadoop, Spark, потоковая обработка, feature engineering, GNN, MLOps и ответственный AI
5
Модулей
15
Статей
~2 ч
Чтения
IV
CLOs
§ 01 — Программа
5 модулей.
Каждый модуль — отдельный блок. Большинство читается по порядку — но опытный читатель может начать с любого.
- M IСовременные методы машинного обученияGradient boosting, ансамблевые методы, reinforcement learning3 статей
18 минОткрыть → - M IIМатематические основы Deep LearningТеория аппроксимации, backpropagation, трансформер3 статей
18 минОткрыть → - M IIIСтатистика высокой размерностиПроклятие размерности, разреженность, LASSO, Ridge, PCA3 статей
18 минОткрыть → - M IVВыпуклая оптимизация для MLМетоды проксимального градиента, Adam, SGD, теория сходимости3 статей
18 минОткрыть → - M VАлгоритмы для Big DataРандомизированная линейная алгебра, хеширование, потоковые алгоритмы3 статей
18 минОткрыть →
§ 02 — Результаты обучения
4 результата.
CLO I
Инфраструктура данных
Проектировать и использовать системы обработки больших данных (Hadoop, Spark, Kafka)
CLO II
Feature Engineering
Разрабатывать признаки для ML-моделей, обрабатывать структурированные и неструктурированные данные
CLO III
Продвинутые архитектуры
Применять графовые нейронные сети и специализированные архитектуры глубокого обучения
CLO IV
MLOps и этика
Развёртывать ML-системы в production, обеспечивать справедливость и объяснимость
§ 03 — Практики