Data Warehouse
by Pablo angeles
1. Es una arquitectura de almacenamiento de datos
1.1. Permite organizar, comprender y utilizar sus datos para tomar decisiones estratégicas.
2. se divide en tres estructuras simplificadas
2.1. Con una estructura básica,
2.1.1. Sistemas operativos y archivos planos proporcionan datos en bruto que se almacenan junto con metadatos.
2.1.1.1. Usuarios finales lo usan para su análisis, generación de informes y minería.
2.2. área de ensayo
2.2.1. Se puede colocar entre las fuentes de datos y el almacén, ésta proporciona un lugar donde los datos se pueden limpiar antes de entrar en el almacén.
2.3. data marts
2.3.1. son sistemas diseñados para una línea de negocio en particular.
2.3.1.1. Usuarios finales pueden acceder a datos de uno o de todos los data marts del departamento.
3. Primeros datos relacionales estructurados no podían ser mezclados y emparejados
3.1. Para temas analíticos con datos textuales no estructurados
4. datos no repetitivos son
4.1. Comentarios en una encuesta, correos electrónicos y conversaciones
4.2. Los datos no repetitivos son datos basados en textos que fueron generados por la palabra escrita, hablada y leída
5. Data Warehouse vs Big Data
5.1. Big Data tiene un gran volumen de datos con una variedad, complejidad y velocidad de crecimiento enorme y que además tienen la característica de no ser estructurados.
5.2. Big Data, está creciendo cada año, alrededor de un 40%.
5.3. data warehouse almacena datos consolidados de diversas fuentes o sistemas de la empresa
5.4. Se trata de tener todos los datos juntos para después poder dividirlos para hacer un análisis de determinados sectores o estrategias.
6. Es un repositorio unificado para todos los datos que recogen los diversos sistemas de una empresa.
6.1. En el Data Warehouse, deben tener todo el contexto de los datos establecidos.
7. Se aloja en un servidor corporativo o cada vez más, en la nube.
7.1. Los datos de diferentes aplicaciones de procesamiento de transacciones Online (OLTP)
7.1.1. Se extraen selectivamente para su uso por aplicaciones analíticas y de consultas por usuarios