BIG DATA большие данные,платформы и технологии

Начать. Это бесплатно
или регистрация c помощью Вашего email-адреса
BIG DATA большие данные,платформы и технологии создатель Mind Map: BIG DATA большие данные,платформы и технологии

1. Введение в математический анализ

2. Большие данные

2.1. HDFS

2.2. Map-Reduce

2.3. Hadoop

2.3.1. как устроена YARN

2.3.2. как работает планировщик Oozie

2.3.3. как устроена NoSQL базы данных

2.3.3.1. Cassandra

2.3.3.2. HBase

2.4. Apache Flume

2.5. Apache Sqoop

3. Современные инструменты

3.1. Apache Spark

3.2. Vowpal Wabbit

3.3. Hive

4. Real-Time инструменты для обработки больших данных

4.1. Apache Storm

4.2. Apache Spark Streaming

4.3. Лямбда-архитектура

4.4. Apache Spark

5. Методики анализа больших данных

5.1. Data mining

5.1.1. Набор методик, который позволяет определить наиболее восприимчивые для продвигаемого продукта или услуги категории потребителей, выявить особенности наиболее успешных работников, предсказать поведенческую модель потребителей.

5.2. Crowdsourcing

5.2.1. Методика сбора данных из большого количества источников.

5.3. Data fusion and data integration

5.3.1. Набор методик, который позволяет анализировать комментарии пользователей социальных сетей и сопоставлять с результатами продаж в режиме реального времени.

5.4. Machine learning

5.4.1. Направление в информатике (исторически за ним закрепилось название `искусственный интеллект`), которое преследует цель создания алгоритмов самообучения на основе анализа эмпирических данных.

5.5. Pattern recognition

5.5.1. Набор методик с элементами самообучения для предсказания поведенческой модели потребителей.

5.6. Network analysis

5.6.1. Набор методик анализа связей между узлами в сетях. Применительно к социальным сетям позволяет анализировать взаимосвязи между отдельными пользователями, компаниями, сообществами и т.п.

5.7. Optimization.

5.7.1. Набор численных методов для редизайна сложных систем и процессов для улучшения одного или нескольких показателей. Помогает в принятии стратегических решений, например, состава выводимой на рынок продуктовой линейки, проведении инвестиционного анализа и проч.

5.8. Визуализация

5.8.1. Методы графического представления результатов анализа больших данных в виде диаграмм или анимированных изображений для упрощения интерпретации облегчения понимания полученных результатов.

6. Основные курсы по машинному обучению

6.1. 1.Neural Networks for Machine Learning от University of Toronto

6.2. 2. Machine Learning With Big Data от University of California

6.2.1. 3. Cognitive Services APIs от Microsoft

6.3. 4. «Машинное обучение» от «Школы данных Яндекса»

6.4. 5. «Machine Learning Foundations: A Case Study Approach» от University of Washington

7. Биг-тема

7.1. 1.Высшая математика

7.2. 2 Введение в математический анализ

7.3. 3 Ликбез по дискретной математике

7.4. 4 Дискретная математика

7.5. 5 Эффективные алгоритмы

7.6. 6 Теория вероятности

8. Практика в построении алгоритмов