Data Warehouse

Get Started. It's Free
or sign up with your email address
Data Warehouse by Mind Map: Data Warehouse

1. Es una arquitectura de almacenamiento de datos

1.1. Permite organizar, comprender y utilizar sus datos para tomar decisiones estratégicas.

2. se divide en tres estructuras simplificadas

2.1. Con una estructura básica,

2.1.1. Sistemas operativos y archivos planos proporcionan datos en bruto que se almacenan junto con metadatos.

2.1.1.1. Usuarios finales lo usan para su análisis, generación de informes y minería.

2.2. área de ensayo

2.2.1. Se puede colocar entre las fuentes de datos y el almacén, ésta proporciona un lugar donde los datos se pueden limpiar antes de entrar en el almacén.

2.3. data marts

2.3.1. son sistemas diseñados para una línea de negocio en particular.

2.3.1.1. Usuarios finales pueden acceder a datos de uno o de todos los data marts del departamento.

3. Primeros datos relacionales estructurados no podían ser mezclados y emparejados

3.1. Para temas analíticos con datos textuales no estructurados

4. datos no repetitivos son

4.1. Comentarios en una encuesta, correos electrónicos y conversaciones

4.2. Los datos no repetitivos son datos basados en textos que fueron generados por la palabra escrita, hablada y leída

5. Data Warehouse vs Big Data

5.1. Big Data tiene un gran volumen de datos con una variedad, complejidad y velocidad de crecimiento enorme y que además tienen la característica de no ser estructurados.

5.2. Big Data, está creciendo cada año, alrededor de un 40%.

5.3. data warehouse almacena datos consolidados de diversas fuentes o sistemas de la empresa

5.4. Se trata de tener todos los datos juntos para después poder dividirlos para hacer un análisis de determinados sectores o estrategias.

6. Es un repositorio unificado para todos los datos que recogen los diversos sistemas de una empresa.

6.1. En el Data Warehouse, deben tener todo el contexto de los datos establecidos.

7. Se aloja en un servidor corporativo o cada vez más, en la nube.

7.1. Los datos de diferentes aplicaciones de procesamiento de transacciones Online (OLTP)

7.1.1. Se extraen selectivamente para su uso por aplicaciones analíticas y de consultas por usuarios

8. diferencias de data lake y data warehouse:

8.1. Datos: Un data warehouse sólo almacena datos que han sido modelados o estructurados, mientras que un Data Lake no hace acepción de datos.

8.2. Procesamiento: Antes de que una empresa pueda cargar datos en un data warehouse, primero debe darles forma y estructura Con un data lake, sólo se cargan los datos sin procesar

8.3. Almacenamiento: Una de las principales características de las tecnologías de big data, como Hadoop, es que el coste de almacenamiento de datos es relativamente bajo

8.4. Seguridad: La tecnología del data warehouse existe desde hace décadas, mientras que la tecnología de big data (la base de un Data Lake) es relativamente nueva.

9. La importancia de la nube para el data warehouse

9.1. Mayor agilidad Mejor control de costes Co-localización