Get Started. It's Free
or sign up with your email address
Data Warehouse by Mind Map: Data Warehouse

1. Tipos de Data Warehouse

1.1. Los data warehouse operacionales fuera de línea son almacenes de datos donde los datos son copiados y pegados por lo general en tiempo real. Por lo general, son la más simples y menos técnicos de los Data Warehouse.

1.2. Data Warehouse fuera de línea son almacenes de datos que se actualizan con frecuencia, ya sea diaria, semanal o mensual y donde los datos se almacenan en una estructura integrada, donde los demás puedan acceder a ella y llevar a cabo la presentación de informes.

1.3. Data Warehouse en Tiempo Real son almacenes de datos en los que se actualiza cada momento a medida que llegan nuevos datos. Por ejemplo, un Data Warehouse en tiempo real podría incluir datos de un sistema de Punto de Venta y se actualiza con cada venta que se haga.

1.4. Data Warehouse integrados son almacenes de datos que pueden ser utilizados por otros sistemas. Algunos Data Warehouse integrados son utilizados por otros Data Warehouse, lo que les permite acceder a ellos para procesar los informes, así como buscar los datos actuales.

2. ¿Qué es un Data Warehouse?

2.1. Un Data Warehouse es un lugar donde se almacenan los datos con fines de archivamiento, análisis de efectos y seguridad. Por lo general, un Data Warehouse es un único equipo o varios ordenadores (servidores) atados juntos para crear un sistema gigante de computadoras.

3. Componentes de un Data Warehouse

3.1. El almacén de datos se basa en un servidor RDBMS, que es un depósito de información central rodeado de algunos componentes clave para que todo el entorno sea funcional, manejable y accesible. Este almacén tiene cinco elementos que lo componen:

3.2. Herramientas de abastecimiento, adquisición, limpieza y transformación (ETL): Estas herramientas se utilizan para realizar todas las conversiones, resúmenes y todos los cambios necesarios para transformar los datos en un formato unificado en el Data Warehouse.

3.3. Base de datos del almacén de datos: La base de datos central es la base del entorno de almacenamiento de datos. Esta base de datos se implementa en la tecnología RDBMS.

3.4. Metadatos: Los metadatos son datos sobre datos que definen el almacén de datos. Se utiliza para construir, mantener y administrar el almacén de datos.

3.5. Herramientas de consulta: Las herramientas de consulta permiten a los usuarios interactuar con el sistema de almacenamiento de datos.

3.6. Almacén de datos bus: El almacén de datos Bus determina el flujo de datos en tu almacén. El flujo de datos en un almacén de datos se puede clasificar como flujo de entrada, flujo ascendente, flujo descendente, flujo de salida y metaflujo.

4. Arquitectura de Data Warehouses

4.1. Existen principalmente tres tipos de arquitecturas de Data Warehouse: Arquitectura de un nivel. Arquitectura de dos niveles. Arquitectura de tres niveles.

4.2. Arquitectura de un solo nivel El objetivo de la arquitectura de un solo nivel o de una sola capa es minimizar la cantidad de datos almacenados. Este objetivo es eliminar la redundancia de datos. Esta arquitectura no se usa con frecuencia en la práctica.

4.3. Arquitectura de dos niveles La arquitectura de dos capas separa las fuentes físicamente disponibles y el almacén de datos. Esta arquitectura no es expandible y tampoco admite una gran cantidad de usuarios finales. También tiene problemas de conectividad debido a las limitaciones de la red.

4.4. Arquitectura de tres niveles Esta es la arquitectura más utilizada. Se compone de los niveles superior, medio e inferior. Nivel inferior: la base de datos de los servidores de Data Warehouse como nivel inferior suele ser un sistema de base de datos relacional. Los datos se limpian, transforman y cargan en esta capa utilizando herramientas de back-end. Nivel medio: el nivel medio en el almacén de datos es un servidor OLAP que se implementa utilizando el modelo ROLAP o MOLAP. Para un usuario, este nivel de aplicación presenta una vista abstracta de la base de datos. Esta capa también actúa como mediador entre el usuario final y la base de datos. Nivel superior: el nivel superior es una capa de cliente front-end. El nivel superior son las herramientas y API que conecta y saca datos del almacén de datos. Podrían ser herramientas de consulta, herramientas de informes, herramientas de consulta administrada, herramientas de análisis y herramientas de minería de datos.