El Mundo de los Datos
por Alynne Zyanya Monje Bahena
1. La Metodología CRISP DM
1.1. 1. Entendimiento del negocio
1.1.1. Visualizar el objetivo , evaluar la situación y desarrollar un plan de trabajo.
1.2. 2. Entendimiento de los datos
1.2.1. Recolectar los datos, describirlos y verificarlos.
1.3. 3. Preparación de los datos
1.3.1. Selección de los datos y determinar si existen algunos más necesarios que otros, o incluir nuevos.
1.4. 4. Modelación de los datos
1.4.1. Escoger técnica de modelación, diseño de puerbas, construcción y evaluación del modelo.
1.5. 5. Evaluación
1.5.1. Evaluar los resultados, corroborar procesos y decidir acciones futuras.
1.6. 6. Despliegue
1.6.1. Planeación de monitoreo y mantenimiento, reporte y evaluación de resultados finales.
2. Margin Call y The Big Short
2.1. Margin Call: En el extracto mostrado se habla de que el modelo predicho anuncia una pérdida para la compañia musical, esto con base en los registros revisados.
2.1.1. La ciencia de datos está presente porque al analizar el comportamiento de los datos se llega a una respuesta (posiblemente cierta).
2.2. The Big Short: Al leer los acuerdos de los préstamos y el historial de las hipotecas descucbrió que los bancos se beneficiaban.
2.2.1. La ciencia de datos está presente pues al analizar los préstamos se llega a tomar una decisión de inversión.
3. ¿Qué es la Ciencia de Datos?
3.1. La disciplina que otorga una voz a los datos.
3.2. Extrae conocimiento de cómo está operando un sector partir de análisis y crea modelos predictivos para tomar decisiones y mejorar.
4. Ejemplo 1:
4.1. La información sobre los datos de ubicación o las búsquedas que tienen los teléfonos respecto a un tema, puede ayudar a determinar qué servicios son tendencia cuáles son los mejores lugares para ubicar un centro comercial.
5. ¿Qué es Analítica de Datos ?
5.1. El analizar datos para encontrar tendencias y patrones.
5.2. A partir del análisis estadísitico identificar las razones del comportamiento de datos.
6. Ejemplo 1:
6.1. KPI´s (Key Performance Indicator)
6.2. Es un valor medible que muestra la eficacia con la que ciertos sectores lorgran los objetivos de la empresa.
6.3. Ayuda a la toma de decisiones y mejorar desempeño de áreas o trabajadores.
7. Ejemplo 1:
7.1. En la actividad de regresión, cuando graficamos el pronóstico del costo, contra el real, hubo poca distancia entre los datos, sin embargo con la ecuación de predicción se obtenían valores que excedían lo real, y esto se debe a que en mi base de datos la mayoría de las actividades son de muy poco costo.
8. Ejemplo 2:
8.1. Tras llevar un registro de la vida de anaquel de productos variando distintos conservadores de alimentos se puede llevar a determinar cuál es máximo tiempo y el mejor conservador.
9. Ejemplo 2:
9.1. Trabajar con los registros en el sector de salud pública a nivel nacional, y conocer sobre la cantidad de medicamentos recetados y su relación con el nivel socioeconómico del paciente.
10. Ejemplo 2:
10.1. Cuando una empresa checa la tendencia de su producto nuevo en los supermercados y observa que las ventas han disminuido por lo que comienza a investigar cuáles son las razones. Si es debido a la calidad del producto o al marketing.
11. ¿Qué es Big Data
11.1. Datos masivos y a menudo no estructurados.
11.2. Las herramientas convencionales que se usan para analizar no cubren la cantidad de datos
11.3. Puede presentarse en distintos formatos como: texto, vídeo, sonido e imágenes.