La metodología y el científico de la ciencia de datos

Iniziamo. È gratuito!
o registrati con il tuo indirizzo email
La metodología y el científico de la ciencia de datos da Mind Map: La metodología y el científico de la ciencia de datos

1. Metodologías

1.1. Supervisado

1.1.1. Pasos

1.1.1.1. Formular el problema

1.1.1.2. Determinar la representación (atributos y clases)

1.1.1.2.1. Directamente

1.1.1.2.2. Hablando con expertos

1.1.1.2.3. A partir de otras técnicas (filtros)

1.1.1.3. Identificar y recolectar datos de entrenamiento (bases de datos, ficheros, etc.)

1.1.1.4. Preparar datos para análisis

1.1.1.5. Selección de modelo, construcción y entrenamiento

1.1.1.6. Evaluar lo aprendido

1.1.1.6.1. Validación cruzada

1.1.1.6.2. Expertos

1.1.1.7. Integrar la base de conocimiento a la espera de nuevos datos tras acciones

1.2. No supervisado

1.2.1. Pasos

1.2.1.1. Formular el problema

1.2.1.1.1. Búsqueda de afinidad

1.2.1.1.2. Grupos

1.2.1.2. Representación

1.2.1.3. Identificar y recolectar datos de entrenamiento (bases de datos)

1.2.1.4. Preparar datos para análisis

1.2.1.5. Selección de modelo y construcción

1.2.1.5.1. Agrupamiento de clientes (sin tener en cuenta la clase todavía)

1.2.1.6. Utilizar las estructuras encontradas para aplicar ap. Supervisado

1.2.1.6.1. Predicción de abandono en cada grupo

1.2.1.7. Generar nuevas hipótesis a evaluar

1.2.1.7.1. Características de grupos especiales. Búsqueda de más datos.

2. Científico de datos

2.1. Funciones

2.1.1. Analizan los grandes datos que posee una empresa y los usan como indicadores fiables para proponer medidas correctoras y para ayudar en la toma de decisiones sobre el rumbo que tiene que seguir un determinado negocio

2.2. Cualidades personales

2.2.1. Curiosidad

2.2.2. Habilidad de comunicación

2.2.3. Mis cualidades personales son

2.2.3.1. Curiosidad

2.2.3.2. Habilidad de comunicación

2.3. Habilidades

2.3.1. De un científico de datos

2.3.1.1. Matemática y estadística

2.3.1.1.1. Machine Learning

2.3.1.1.2. Modelo estadístico

2.3.1.1.3. Diseño experimental

2.3.1.1.4. Inferencia Bayesiana

2.3.1.1.5. Árbol de decisión

2.3.1.1.6. Regresión logística

2.3.1.2. Programación y Base de Datos

2.3.1.2.1. Ciencia fundamental de las computadoras

2.3.1.2.2. Lenguajes de programación ej. Python

2.3.1.2.3. Paquetes computacionales de estadística, ej. R

2.3.1.2.4. Bases de datos SQL Y NoSQL

2.3.1.2.5. Álgebra relacional

2.3.1.3. Conocimientos dominados

2.3.1.3.1. Pasión por los negocios

2.3.1.3.2. Influencia sin autoridad

2.3.1.3.3. Mentalidad hacker

2.3.1.3.4. Resolución de problemas

2.3.1.3.5. Estratégico

2.3.1.3.6. Proactivo

2.3.1.3.7. Creativo

2.3.1.3.8. Innovador

2.3.1.3.9. Colaborativo

2.3.1.4. Comunicación y visualización

2.3.1.4.1. Capaz de comprometerse con la alta dirección

2.3.1.4.2. Habilidad para narrar sucesos

2.3.1.4.3. Traducir los datos a decisiones y acciones

2.3.1.4.4. Diseño de artes visuales

2.3.1.4.5. Paquetes de R como ggplot o lattice

2.3.1.4.6. Conocimiento de cualquier herramienta de visualización, por ejemplo Flare, D3 js, Tableau.

2.3.2. Mis habilidades

2.3.2.1. Matemática y estadística

2.3.2.1.1. Modelo estadístico

2.3.2.1.2. Árbol de decisiones

2.3.2.2. Programación y base de datos

2.3.2.2.1. Paquete Computacional de EStadística (Statdisk)

2.3.2.3. Conocimientos dominados

2.3.2.3.1. Pasión por los negocios

2.3.2.3.2. Influencia sin autoridad

2.3.2.3.3. Resolución de problemas

2.3.2.3.4. Estratégico

2.3.2.3.5. Proactivo

2.3.2.3.6. Creativo

2.3.2.3.7. Innovador

2.3.2.3.8. Colaborativo

2.3.2.4. Comunicación y visualización

2.3.2.4.1. Capaz de comprometerse con la alta dirección

2.3.2.4.2. Habilidad para narrar sucesos

2.3.2.4.3. Traducir los datos a decisiones y acciones

2.3.2.4.4. Diseño de artes visuales

2.3.3. Habilidades que me faltan desarrollar

2.3.3.1. Matemática y estadística

2.3.3.1.1. Machine Learning

2.3.3.1.2. Diseño experimental

2.3.3.1.3. Inferencia Bayesiana

2.3.3.1.4. Regresión logística

2.3.3.2. Programación y Base de Datos

2.3.3.2.1. Ciencia fundamental de las computadoras

2.3.3.2.2. Lenguajes de programación ej. Python

2.3.3.2.3. Bases de datos SQL Y NoSQL

2.3.3.2.4. Álgebra relacional

2.3.3.3. Conocimientos dominados

2.3.3.3.1. Mentalidad hacker

2.3.3.4. Comunicación y visualización

2.3.3.4.1. Paquetes de R como ggplot o lattice

2.3.3.4.2. Conocimiento de cualquier herramienta de visualización, por ejemplo Flare, D3 js, Tableau.