BIG DATA
por ana martinez
1. Cumple con: Volumen Veracidad Velocidad Variabilidad Valor
2. Ciclo de vida
2.1. -1.- Captura. - 2.- Almacenamiento 3.- Procesamiento y análisis 4. Exportación y visualización
3. Información que proviene de diferentes fuentes con diferentes estructuras con mucha velocidad.
4. Terminologia
4.1. - Datos no estructurados: datos no organizados.
4.1.1. - Datos Estructurados: datos que ya están diseñados, ya tienen una organización.
4.1.1.1. - Bases de datos: Conjunto organizado de base de datos estructurados, software permite almacenar, procesar y extraer datos.
4.1.1.1.1. - On premise (on prem): Datos guardados en oficinas bien organizados.
5. ETL
5.1. Extracción: captura de datos
5.1.1. Transformation: estandarizar datos (data cleaning) Machine Learning
5.1.1.1. Load