ML и Визуализация данных
Анализ данных, работа с Google Colab, Python и современными DS-библиотеками.
Теория (Лекции)
15
1.
Python для инженера данных и Основы NumPy
2.
Pandas Core — Фундамент работы с таблицами
3.
Pandas Advanced: Агрегация, Сводные таблицы и Джойны
4.
Основы визуализации с Matplotlib. Анатомия графика
5.
Многомерный анализ и Seaborn
6.
Продвинутый EDA, Очистка и Feature Engineering
7.
Введение в ML: KNN и Метрики классификации
8.
Линейная Регрессия. Интерпретируемость и Метрики
9.
Логистическая регрессия. Регуляризация и ROC-AUC
10.
Деревья решений (Decision Trees). Математика выбора
11.
Ансамбли I. Random Forest и Bagging
12.
Ансамбли II. Градиентный Бустинг (Gradient Boosting)
13.
Кластеризация: K-Means и Иерархический анализ
14.
Снижение размерности. PCA, t-SNE и Проклятие размерности
15.
Валидация, Тюнинг и Пайплайны (Pipelines)
Практика (Лабы)
15
1.
Лабораторная работа №1: Python Refresher и Векторизация с NumPy
2.
Лабораторная работа №2: Основы Pandas
3.
Лабораторная работа №3: Продвинутый Pandas (EDA)
4.
Лабораторная работа №4: Основы визуализации с Matplotlib
5.
Лабораторная работа №5: Многомерный анализ с Seaborn
6.
Лабораторная работа №6: Комплексный EDA и Feature Engineering
7.
Введение в ML: Классификация с KNN
8.
Введение в ML: Линейная Регрессия
9.
Введение в ML: Логистическая регрессия и ROC-AUC
10.
Введение в ML: Деревья Решений (Decision Trees)
11.
Введение в ML: Ансамбли. Random Forest
12.
Введение в ML: Градиентный Бустинг (XGBoost & CatBoost)
13.
Введение в ML: Кластеризация и Сегментация клиентов
14.
Введение в ML: Снижение размерности (PCA и t-SNE)
15.
Введение в ML: Пайплайны, Кросс-валидация и GridSearch