DATA WAREHOUSE (ALMACENES DE DATOS)
por Julio Cesar Valencia Bolaños
1. EL MODELO DE DATOS RELACIONAL modelo de análisis entidad relación (ER)
1.1. Legibilidad limitada
1.2. Dificultad para las herramientas de consulta en el acceso a un modelo ER general.
1.3. La utilización de la técnica de modelado ER frustra la recuperación de información intuitiva y con alto rendimiento Este modelo no es apropiado para Data Warehouse.
2. OLAP (On-Line Analytical Processing o procesamiento analítico on-line) es un análisis rápido de información multidimensional compartida, RESPONDE PREGUNTAS DE NEGOCIOS
3. DM (Data Mining o minería de datos)
3.1. PROCESO DE DESCUBRIR CONOCIMIENTO: Reglas de asociación, Patrones secuenciales, Árboles de clasificación.
3.2. OBJETIVOS: Predicción, Identificación, Clasificación, Optimización.
4. DSS (Decision-Support Systems o sistemas de soporte a la toma de decisiones). son las herramientas para obtener datos de nivel superior del DW para la toma de decisiones. AYUDA A LA TOMA DE DECISIONES
5. PROCESOS OPERACIONALES OLTP (On-Line Transaction Processing o procesamiento de transacciónes online)
6. BI (Business Intelligence) conjunto de tecnologías que permiten a las empresas utilizar la información disponible
6.1. Sistemas de información ejecutiva
6.2. Sistemas de soporte a la toma de decisiones
6.3. Procesamiento analítico on-line
6.4. Minería de datos
6.5. Herramientas de visualización de datos
7. VS
8. Sistema Analítico (DW o almacén de datos)
8.1. PROCESAMIENTO PARA EL SISTEMA DE SOPORTE DE DECISIONES (OLAP/DSS/DM)
8.2. Almacena datos históricos (datos tienen clave de tiempo)
8.3. Almacena datos de detalle y datos agregados a distintos niveles
8.4. Los datos son principalmente estáticos
8.5. Las actualizaciones son escasas y programadas, incremental a intervalos regulares
8.6. Los procesos no son previsibles
8.7. Dedicado al análisis de datos
8.8. Orientado a la obtención de información
8.9. Soporta decisiones estratégicas (medio y largo plazo)
8.10. Sirve a técnicos de dirección pocos usuarios*
8.11. Requerimientos de respuesta no críticos
9. CARACTERÍSTICAS
9.1. Es un almacén de datos integrados proveniente de fuentes diversas
9.2. Los datos almacenados en el DW mantienen una series de tiempo y de tendencia.
9.3. Abarcan gran cantidad de datos
9.4. se toma tiempo y dificulta extraer, transformar y cargar los datos en él.
10. EL MODELO DE DATOS DIMENSIONAL O MULTIDIMENSIONAL
10.1. Es denominada tabla de hechos y un conjunto de tablas más pequeñas denominadas tablas de dimensiones.
10.2. Una gran tabla central o tabla de hechos está conectada con un conjunto de tablas (una por dimensión)
10.3. Permite el empleo de diferentes bases de datos:
10.3.1. ROLAP, cuando se aplica el modelo dimensional a una base de datos relacional.
10.3.2. MOLAP, cuando se aplica el modelo dimensional sobre base de datos dimensional.
11. Orientado a conseguir la máxima eficacia y rapidez en las transacciones (actualizaciones).
11.1. Optimiza la transacciones que habitualmente sólo abarcan una pequeña parte de una base de datos.
12. Los datos que una empresa son sistemas usados con el fin de recogerlos u operar con ellos reciben el nombre de OLTP.
13. METADATA EN UN DW. Es donde se transforman y existen en el DW
13.1. ELEMENTOS
13.1.1. Las estructuras de datos
13.1.2. Las definiciones del sistema de registro desde el cual se construye el DW
13.1.3. Las especificaciones de transformaciones de datos que deben realizarse para la carga de nuevos datos en el DW desde las fuentes de datos.
13.1.4. El modelo de datos del DW.
13.1.5. Información de cuando los nuevos elementos de datos se agregan al DW y cuando los elementos de datos antiguos se eliminan o se resumen.
13.1.6. Los niveles de sumarización, el método de sumarización y las tablas de registros de el DW