Almacenes de datos

Comienza Ya. Es Gratis
ó regístrate con tu dirección de correo electrónico
Almacenes de datos por Mind Map: Almacenes de datos

1. Algunas ventajas de un almacén de datos

1.1. Mejores datos

1.1.1. Al añadir fuentes de datos a un almacén de datos, las organizaciones pueden asegurarse de recabar datos uniformes y relevantes de aquella fuente.

1.2. Decisiones mas rápidas

1.2.1. Los datos de un almacén presentan formatos tan uniformes que ya están listos para el análisis. También ofrece la potencia analítica y un conjunto de datos más completo para basar las decisiones en hechos contrastados.

2. Un almacén de datos incluye los siguientes elementos

2.1. Una base de datos relacional para almacenar y administrar datos

2.2. Una solución de extracción, carga y transformación (ELT) para preparar los datos para el análisis

2.3. Análisis estadístico, informes y capacidades de minería de datos

2.4. Herramientas de análisis de clientes para visualizar y presentar datos a usuarios comerciales

2.5. Otras aplicaciones analíticas más sofisticadas que generan información procesable aplicando ciencia de datos y algoritmos de inteligencia artificial (IA)

3. Función de un almacén de datos

3.1. Un almacén de datos debe entregar la información correcta a la gente indicada en el momento correcto. El almacén de datos da respuesta a las necesidades de usuarios conocedores, utilizando sistemas de ayuda en la decisión (DSS), Sistemas de Información Ejecutiva (EIS) o herramientas para hacer consultas o informes.

3.2. Los usuarios finales fácilmente puedes hacer consultas sobre sus almacenes de datos sin tocar o afectar la operación del sistema.

3.3. Sus datos pueden ser:

3.3.1. Estructurados

3.3.2. Semiestrucutrados

3.3.3. Datos no estructurados

4. Tipos de almacén de datos

4.1. Almacén de datos empresariales (EDW)

4.1.1. Enterprise Data Warehouse es un almacén centralizado. Proporciona la capacidad de clasificar los datos según el tema y dar acceso según esas divisiones.

4.2. Almacén de datos operativos

4.2.1. También se denominan ODS, este almacén de datos se actualiza en tiempo real. Por lo tanto, se prefiere ampliamente para actividades de rutinas como por ejemplo almacenar registros de los empleados.

4.3. Data Mart

4.3.1. Es un subconjunto del almacén de datos. Está especialmente diseñado para una línea de negocio en particular como ventas o finanzas.

5. Un almacén de datos es una amplia recopilación de datos comerciales que sirven para ayudar a una organización o tomar decisiones.

6. Características de los almacenes de datos

6.1. Son organizados en torno a temas: La información se clasifica en base a los aspectos que son de interés para la empresa.

6.2. Integrado: Es el aspecto más importante. La integración de datos consiste en convenciones de nombres, codificaciones consistentes, medida uniforme de variables, etc.

6.3. Dependiente del tiempo: Esta dependencia aparece de tres formas:

6.3.1. La información representa los datos sobre un horizonte a largo tiempo.

6.3.2. Cada estructura clave contiene implícita o explícitamente un elemento de tiempo (día, semana, mes, etc)

6.3.3. La información una vez registrada correctamente, no puede ser actualizada.

6.4. No volátil

6.4.1. El almacén de datos sólo permite cargar nuevos datos y acceder a los ya almacenados, pero no permite borrar ni modificar los datos.

7. Arquitectura de un almacén de datos

7.1. Simpleza

7.1.1. Todos los almacenes de datos comparten un diseño básico en el que los metadatos, los datos de resumen y los datos sin procesar se almacenan en el repositorio central del almacén.

7.2. Simpleza con un área de preparación

7.2.1. Los datos operativos deben limpiarse y procesarse antes de almacenarse. Aunque esto puede realizarse mediante la programación

7.3. Sistema de distribución radial

7.3.1. Agregar data marts entre el repositorio central y los usuarios finales le permite a una organización personalizar su almacén de datos para servir a varias líneas de negocios.

7.4. Entornos de prueba

7.4.1. Los entornos de prueba son áreas privadas, sólidas y seguras que permiten a las empresas explorar de manera rápida e informal conjuntos de datos nuevos o formas de analizar datos sin tener que respetar o cumplir con las reglas formales y el protocolo del almacén de datos.