ML и Визуализация данных
Анализ данных, работа с Google Colab, Python и современными DS-библиотеками.
Теория (Лекции)
15- 1. Python для инженера данных и Основы NumPy
- 2. Pandas Core — Фундамент работы с таблицами
- 3. Pandas Advanced: Агрегация, Сводные таблицы и Джойны
- 4. Основы визуализации с Matplotlib. Анатомия графика
- 5. Многомерный анализ и Seaborn
- 6. Продвинутый EDA, Очистка и Feature Engineering
- 7. Введение в ML: KNN и Метрики классификации
- 8. Линейная Регрессия. Интерпретируемость и Метрики
- 9. Логистическая регрессия. Регуляризация и ROC-AUC
- 10. Деревья решений (Decision Trees). Математика выбора
- 11. Ансамбли I. Random Forest и Bagging
- 12. Ансамбли II. Градиентный Бустинг (Gradient Boosting)
- 13. Кластеризация: K-Means и Иерархический анализ
- 14. Снижение размерности. PCA, t-SNE и Проклятие размерности
- 15. Валидация, Тюнинг и Пайплайны (Pipelines)
Практика (Лабы)
15- 1. Лабораторная работа №1: Python Refresher и Векторизация с NumPy
- 2. Лабораторная работа №2: Основы Pandas
- 3. Лабораторная работа №3: Продвинутый Pandas (EDA)
- 4. Лабораторная работа №4: Основы визуализации с Matplotlib
- 5. Лабораторная работа №5: Многомерный анализ с Seaborn
- 6. Лабораторная работа №6: Комплексный EDA и Feature Engineering
- 7. Введение в ML: Классификация с KNN
- 8. Введение в ML: Линейная Регрессия
- 9. Введение в ML: Логистическая регрессия и ROC-AUC
- 10. Введение в ML: Деревья Решений (Decision Trees)
- 11. Введение в ML: Ансамбли. Random Forest
- 12. Введение в ML: Градиентный Бустинг (XGBoost & CatBoost)
- 13. Введение в ML: Кластеризация и Сегментация клиентов
- 14. Введение в ML: Снижение размерности (PCA и t-SNE)
- 15. Введение в ML: Пайплайны, Кросс-валидация и GridSearch