Анализ DataSeta
создатель Дмитрий Р
1. Загрузка данных
1.1. Проверка разделителей
1.2. Загрузка в Data Frame
2. Анализ статистики
2.1. Вычисление средних, медианных оценок
2.2. Построение гистограмм,
3. Отбор признаков для машинного обучения
4. Очистка данных
4.1. Проблемы с записями
4.1.1. нарушение уникальности
4.1.2. дублирование записей
4.1.3. противоречивость записей
4.1.4. неверные ссылки
4.2. Проблемы с признаками
4.2.1. недопустимые значения
4.2.2. отсутствующие значения
4.2.2.1. Удаление столбцов при большом количестве пропущенных значений
4.2.2.2. Замена пропущенных значений медианными/средними значениями
4.2.2.3. интерполяция данных
4.2.3. орфографические ошибки
4.2.4. многозначность
4.2.5. перестановка слов
4.2.6. вложенные значения