시작하기. 무료입니다
또는 회원 가입 e메일 주소
Data analytics 저자: Mind Map: Data analytics

1. Caminho que o dado percorre

1.1. geração do dado

1.1.1. BLOBs

1.1.2. numérico

1.1.3. discreto

1.1.4. ordenado ou ordinal

1.1.5. desordenado ou nominal

1.2. database

1.2.1. depósito de dados

1.3. data warehousing

1.3.1. dados processados para consulta

1.3.1.1. arquitetura

1.3.1.1.1. star schema (mais comum)

1.3.1.1.2. snow flake

1.3.1.2. modelos

1.3.1.2.1. top down

1.3.1.2.2. bottom up

1.4. processo de data mining

1.4.1. coleta de dados com qualidade

1.4.1.1. processo de EDM

1.4.2. limpeza e preparação dos dados

1.4.2.1. a amostra deve ser representativa da população

1.4.2.2. outliers devem ser removidos

1.4.2.3. devem possuir a mesma granularidade

1.4.2.4. dados temporais devem ser corrigidos

1.4.2.5. dados deveme estar em unidades iguais

1.4.2.6. preencher dados vazios

1.4.2.7. eliminar dados duplicados

1.4.3. técnicas de mineração

1.4.3.1. supervised learning

1.4.3.1.1. decision trees

1.4.3.1.2. regressão linear

1.4.3.1.3. ANN

1.4.3.2. unsupervised learning

1.4.3.2.1. análise de clusters

1.4.3.2.2. association rule mining

1.4.4. avaliação dos resultados do modelo

1.4.4.1. Predictive Accuracy

1.4.4.1.1. acima de 70% é considerado um bom modelo

1.4.5. plataformas de data mining

1.4.5.1. IBM SPSS Modeler

1.4.5.2. R ou Pyhon

1.4.5.3. Weka

1.4.5.4. Excel

1.4.6. CRISP-DM

1.4.6.1. Conhecer o negócio

1.4.6.2. Coompreender seu conjunto de dados

1.4.6.3. Preparar os dados

1.4.6.4. Criar modelos

1.4.6.5. Avaliar os modelos

1.4.6.6. Implementar

1.5. visualização dos dados