EDA, РАЗВЕДОЧНЫЙ И ПЕРВИЧНЫЙ АНАЛИЗ ДАННЫХ | MATPLOTLIB, SEABORN
ВТОРАЯ ЧАСТЬ ЛЕКЦИИ: https://youtu.be/28XZf0Fv9-0
Анализ данных в машинном обучении очень полезный этап. На лекции рассмотрим, какие графики есть, как их интерпретировать и для каких задач стоит применять.
Курсы на платформе Stepik:
1. Библиотеки Python для Data Science https://stepik.org/a/129105
2. Введение в нейронные сети (Keras/Tensorflow) https://stepik.org/a/127274
0:00 Введение
0:35 Для чего нужен EDA (Разведочный анализ данных)
1:26 Этапы EDA
2:09 Matplotlob и Seaborn
2:37 Устройство графиков в Matplotlib
4:13 Синтаксис создания графиков в Matplotlib
5:20 Полезные функции в Matplotlib
6:12 Оформление графиков. plt.style
6:56 Матрица корреляций через тепловую карту (heatmap)
10:15 Матрица для зависимости категориальных признаков
11:17 Линейные графики. plt.plot
11:39 Гистограммы. plt.hist. Плотность распределения
12:57 Диаграмма рассеяния. plt.scatter
13:16 Ящик с усами. Боксплот. plt.boxplot
15:01 Столбчатые диаграммы. plt.bar
15:30 Многорядные столбчатые диаграммы.
17:01 Столбчатые сложенные диаграммы. stacked barchart
18:11 Круговые диаграммы. plt.pie
18:46 Уникальные графики в Seaborn
18:59 sns.jointplot
19:46 sns.pairplot
20:50 sns.heatmap
21:10 Карта визуализаций. Когда какие графики применять при анализе данных
21:20 Графики для сравнений
22:04 Распределения признаков
22:23 Взаимоотношения признаков
22:36 Композиции признаков
23:47 Этапы EDA
23:54 1 этап. Изучение целевого признака
24:07 Изучение целевого признака в задаче регрессии
25:12 Изучение целевого признака в задаче классификации
25:27 Меры центральной тенденции
25:38 Меры центральной тенденции для задачи регрессии (среднее, медиана)
26:03 Меры центральной тенденции для задачи регрессии (мода)
26:09 2 этап. Изучение признаков
26:20 Изучение выбросов. Ящики с усами
27:04 Изучение выбросов. Гистограммы
27:30 Изучение пропусков. Тепловая карта
27:54 Изучение взаимного распределения признаков. jointplot
28:37 Матрица корреляций. Тепловая карта
28:50 Матрица корреляций. Проблема сильно скоррелированных признаков
30:28 3 этап. Изучение влияния признаков на целевой
30:35 Изучение взаимного распределения признаков. jointplot
30:56 Изучение взаимного распределения признаков. Ящик с усами
31:30 Изучение распределения признака для классификации
32:08 Резюме урока