Процесс Data Science
von Olga Krotova
1. 1. Назначение цели исследования
1.1. Определение цели исследования
1.2. Составление проектного задания
2. 2. Сбор данных
3. 3. Подготовка данных
3.1. Очистка данных: нахождение ошибок в данных, физически невозможных значений, выбросов и других аномальных значений
3.2. Преобразование данных: агрегирование и экстраполяция данных, сокращение количества переменных, введение вспомогательных переменных
3.3. Комбинация данных: объединение наборов данных
4. 4. Исследование данных
4.1. Визуализация
4.2. Статистический анализ данных
5. 5. Моделирование
5.1. Выбор модели и переменных для включения в модель
5.2. Обучение модели
5.3. Оценка качества, сравнение моделей, оптимизация