Comienza Ya. Es Gratis
ó regístrate con tu dirección de correo electrónico
DATA WAREHOUSE por Mind Map: DATA WAREHOUSE

1. Arquitectura

1.1. INMON

1.1.1. Se basa en conceptos bien definidos del diseño de base de datos relacionales.

1.1.2. Comienza con todo el DW desde el principio o descendente (TOP- DOWN)

1.1.3. Las bases de datos de cada departamento (Data Mars) son creados solo después de creado el DW completo.

1.1.4. METODOLOGÍA

1.1.4.1. Operacional

1.1.4.2. Almacenamiento de datos atómicos

1.1.4.3. Departamental

1.1.4.4. Usuarios Finales

1.2. KIMBALL

1.2.1. Multiples base de datos altamente interoperables.

1.2.2. Difiere del modelo de base de datos relacional ( Tablas ->Métricas).

1.2.3. Describe la metodología (BOTTOM -UP) . Empieza por pequeños componentes para ir evolucionando a estructuras y modelos superiores

1.2.4. METODOLOGÍA

1.2.4.1. La construcción de un DW se origina por el interes de un departamento.

1.2.4.2. Dimensiones Conformadas :Dimensiones comunes entre diferentes departamentos

1.2.4.3. Bus de almacenamiento: Permite que la suma de los mercados de datos sea realmente un todo para un DW integrado

1.3. Similitudes

1.3.1. Uso de datos con marca de tiempo .( Día , mes , trimestre , año)

1.3.2. Extractos similares , transformación carga (ETL )

1.3.3. OLAP (On-Line Analytical Process )

1.3.3.1. Consultas sobre grandes volúmenes de datos no predecibles .

1.3.3.2. Estructura de datos transparente al usuario.

1.3.3.3. Modo de actualización Batch

1.3.3.4. Información histórica

1.3.3.5. Alta redundancia de datos.

1.4. Ventajas y Desventajas

1.4.1. INMON

1.4.1.1. Ventajas

1.4.1.1.1. DW única Fuente de verdad para la organización.

1.4.1.1.2. Las anomalías de actualización de datos se evitan debido a la baja redundancia

1.4.1.1.3. Los procesos comerciales se pueden entender fácilmente

1.4.1.1.4. Muy flexible: Datos origen mismo lugar

1.4.1.2. Desventajas

1.4.1.2.1. Complejidad a medida del tiempo (Más tablas más uniones).

1.4.1.2.2. Recursos expertos en modelado de datos

1.4.1.2.3. Configuración inicial y la entrega demoran más tiempo.

1.4.1.2.4. Más trabajo de ETL ya que los data mars se crean desde el DW.

1.4.1.2.5. Equipo amplio de especialistas.

1.4.2. KIMBALL

1.4.2.1. Ventajas

1.4.2.1.1. Rapido de configurar y construir

1.4.2.1.2. Esquema de estrella , fácil entendimiento

1.4.2.1.3. El almacenamiento de datos ocupa menos espacio en la base de datos

1.4.2.1.4. Pequeño equipo de desarrolladores y arquitectos

1.4.2.1.5. Funciona perfecto en seguimientos KPIS

1.4.2.2. Desventajas

1.4.2.2.1. Datos redundantes

1.4.2.2.2. Problemas de rendimiento

1.4.2.2.3. No puede manejar todas las necesidades de informes empresariales

1.4.2.2.4. Normalización proceso complejo.

1.4.2.2.5. Datos no están completamente integrados

2. Data Mining

2.1. Proceso de conjunto de técnicas y tecnologías para explorar grandes bases de datos de manera automática.

2.2. Objetivo : Encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de datos.

2.3. KDD

2.3.1. Descubrir información útil desde grandes repositorios.

3. Implementación

3.1. COSTOS

3.1.1. Construcción

3.1.1.1. Recursos Humanos

3.1.1.2. Tecnología

3.1.1.3. Tiempo

3.1.2. Operación y Mantenimiento

3.1.2.1. Costo evolución

3.1.2.2. Costo por cambios

3.1.2.3. Costo crecimiento

3.2. IMPACTOS

3.2.1. Usuarios Finales

3.2.2. Técnicos

3.2.3. Procesos empresariales

3.2.4. Toma de decisiones

4. Características

4.1. Orientado hacia la información relevante

4.2. Integrados

4.3. Variable en el tiempo

4.4. No Volatíl

5. Ventajas y Desventajas

5.1. Ventajas

5.1.1. Rentabilidad

5.1.2. Mejora la productividad y competitividad

5.1.3. Mejora la comunicación de la empresa

5.1.4. Aumento de la productividad

5.2. Desventajas

5.2.1. Infravaloración del esfuerzo necesario para su diseño y creación

5.2.2. infravaloración de los recursos necesarios para la captura, carga y almacenamiento de los datos

5.2.3. Incremento continuo de los requisitos de los usuarios

5.2.4. Privacidad de los datos

6. Definiciones

6.1. "Conjunto de tecnologías de soporte a la toma de decisión, cuyo objeto es que quien trabaja con los conocimientos (ejecutivo, director, analista) pueda tomar decisiones de manera más rápida y eficaz.” [Chaudhuri y Dayal – 1997]

6.2. "Una copia de los datos transaccionales estructurados específicamente para consultas y análisis"[Kimball]

6.3. "Es un componente de la arquitectura de sistemas, temático, integrado, no volátil y dependiente del tiempo diseñado para ayudar en la toma de decisiones.” [ Inmon]

7. Impactos

7.1. Mejora tiempos de análisis para obtener información.

7.2. Requiere participación activa de los usuarios

7.3. La curva de Aprendizaje de los usuarios, exige nuevas destrezas y continua alimentación por parte de los usuarios.

7.4. Reduce reportes en papel, los costos de los procesos y aumenta su eficiencia.

7.5. Aumenta oportunidades para los analistas de datos, en la comunidad empresarial.

7.6. los usuarios aprenden de los sistemas y pueden llegar a evidenciar errores en las aplicaciones.

7.7. Aumenta la confianza en la toma de decisiones, basados en la calidad de la información

8. DW EN LA NUBE

8.1. Impulso para aumentar la agilidad empresarial

8.2. Mejorar el control de costes

8.3. BENEFICIOS

8.3.1. Infraestructura flexible y dinámica.

8.3.2. Fallar temprano y recuperar más rápido.

8.3.3. Capacidades empresariales.

8.3.4. Reutilizar el conjunto de talentos existentes.

8.3.5. Menor coste de propiedad.

9. SOLUCIONES DEL MERCADO

9.1. Open Source

9.1.1. TIBCO/Jaspersoft

9.1.2. Pentaho

9.2. Licenciados

9.2.1. Microsoft

9.2.2. Qlik

9.2.3. Tableau

9.3. Colombia

9.3.1. NETEZZA

9.3.2. IBM SMART ANALYTICS SYSTEM