Big Data Analytics

GJVV_BIG_DATA

Comienza Ya. Es Gratis
ó regístrate con tu dirección de correo electrónico
Rocket clouds
Big Data Analytics por Mind Map: Big Data Analytics

1. Definición

1.1. Conjunto de datos masivo y complejos que son tratadas con aplicaciones informáticas no tradicionales

1.1.1. Análisis de comportamientos

1.1.1.1. Pronosticar

1.1.1.2. Determinar patrones

1.1.1.3. Calidad de la información

1.1.2. Extracción de valor de los datos almacenados

1.1.2.1. Técnicas matemáticas

1.1.2.2. Conocimiento del negocio/Necesidades que se atienden

1.1.2.2.1. Marketing y ventas

1.1.2.2.2. Instituciones financieras

1.1.2.2.3. Administraciones tributarias

1.1.2.2.4. Servicios de consultoria

1.1.2.2.5. Gestion y toma de desiciones

1.1.2.3. Sustento tecnológico

2. Características

2.1. DWH

2.1.1. Ventajas

2.1.1.1. Transforma datos en información para toma de decisiones

2.1.1.1.1. Orientación a negocio

2.1.1.1.2. Integrada

2.1.1.1.3. Variante en el tiempo

2.1.1.1.4. No volatil

2.1.1.2. Integra y consolida fuentes de datos

2.1.1.3. Reaccionar rapidamente a los cambios del mercado

2.1.1.4. Elimina producción y procesamiento de datos mal diseñados

2.1.1.5. Aumento de la eficiencia de los encargados de tomar decisiones

2.1.1.6. Usuarios acceden a la información en línea

2.1.2. Uso para los datos

2.1.2.1. Extracción

2.1.2.2. TRansformación

2.1.2.3. Consolidación

2.1.2.4. Integración

2.1.2.5. Centralización

2.1.3. Orientación

2.1.4. Desventajas

2.1.4.1. Gasto de formación

2.1.4.2. Rechazo inicial

3. Definición de datos

3.1. Cifra, letra o palabra que se suministra a la computadora como entrada y la máquina almacena en un determinado formato.

3.1.1. Estructurados

3.1.1.1. Creado

3.1.1.1.1. Encuestas

3.1.1.1.2. Programas de fidelización

3.1.1.2. Provocado

3.1.1.2.1. Valoración de restaurantes

3.1.1.2.2. Experiencia de compra

3.1.1.3. Tramitado

3.1.1.3.1. Procesos de compra online

3.1.1.4. Compilado

3.1.1.4.1. Censos

3.1.1.5. Experimental

3.1.1.5.1. Marketing

3.1.2. No estructurados

3.1.2.1. Datos generados en las redes sociales, foros, e-mails, presentaciones Power Point o documentos Word

3.1.3. Semiestructurados

3.1.3.1. No residen de bases de datos relacionales, pero presentan una organización interna que facilita su tratamiento,documentos XML y datos almacenados en bases de datos NoSQL.

3.2. granularidad

3.2.1. Datos actuales

3.2.2. Datos históricos

3.2.3. Datos ligeramente resumidos

3.2.4. Datos altamente resumidos

3.2.5. Metadata

3.3. Modelo de datos

3.3.1. Relacional

3.3.2. Tabla

3.3.3. Orientado a objetos

3.3.4. Jerarquico

3.3.5. Entidad Relación

3.3.6. Modelo de red

4. ¿A quien se orienta?

4.1. Organizaciones personas capacidades (generación de valor)

4.1.1. Uso de estrategias de datos

4.1.2. Desarrollo tecnológico

4.1.3. Generación masiva de datos

5. Tendencias para explotación masiva

5.1. Herramientas

5.1.1. R

5.1.1.1. Lenguaje aritmético mas natural con múltiples módulos para análisis matemáticos. Entorno de software libre para computación estadística y gráficos. Compila y se ejecuta en una amplia variedad de plataformas UNIX, Windows y MacOS.

5.1.2. Python

5.1.2.1. Python es un lenguaje de programación que le permite trabajar más rápidamente, con un lenguaje simplificado. Es un software de código abierto

5.1.3. SQL

5.1.3.1. Lenguaje de consultas estructurado. es un lenguaje específico del dominio utilizado en programación, diseñado para administrar, y recuperar información de sistemas de gestión de bases de datos relacionales

5.1.4. SAS

5.1.4.1. Uso de SQL y lenguaje propio de SAS. Empresa de software de capital privado más grande del mundo líder en Business Analytics

5.2. Análisis

5.2.1. Componentes principales

5.2.2. Regresión

5.2.3. redes

5.2.4. Cluster