Começar. É Gratuito
ou inscrever-se com seu endereço de e-mail
Rocket clouds
Big Data por Mind Map: Big Data

1. Forma parte de BI&A

1.1. Evolución 1.0 (cuadros de mando, modelos de negocio) 2.0 (contenido web) 3.0 (móviles y sensores)

1.1.1. En base a ello se utilizan diferentes tipos de herramientas: Big Data (utiliza 1.0, 2.0 y ahora 3.0) text analytics (2.0, se integra al 1.0) web analysis (text analytics, opinion analytics etc)

1.2. estrategias: e-commerce, e-government, science & technology, smart health, security and public safety

1.2.1. Tienen aplicaciones como: e commerce= sistemas de recomendación. e-government = campañas políticas,

1.2.1.1. Se obtienen datos (estructurados- fragmentados) tipo de datos: ej e-commerce (transacciones), e-government ( feedbac y comentarios de los ciudadanos)

1.2.1.1.1. analytics: segmentación BDD, detección de anomalías, análisis de contexto y texto, monitoreo de RSS

2. Gran cantidad de datos almacenados: Gartner , 2012:‘‘Big Data are high-volume, high-velocity, and/or high-variety information assets that require new forms of processing to enable enhanced decision making, insight discovery and process optimization’’

2.1. 3 V´s: Volumen Velocidad y Variedad

2.1.1. se agrega veracidad, variabilidad y complejidad y valor

2.2. Se necesitan habilidades y competencias

2.2.1. Lider: clear objective

2.2.1.1. Científicos de datos

2.2.1.2. Gestión de talento

2.2.1.3. Cultura de la empresa: que realmente tomen decisiones en base a los datos y no los datos sean justificación de la toma de decisiones

2.2.1.4. Toma de decisiones: la información y las tomas de decisiones relevantes se hacen en el mismo lugar, esto quiere decir que en big data, la información es creada y transferida y por ello la experiencia no siempre tiene que estar en el mismo lugar ( la toma de decisiones se hace dónde está la información) = flexibilidad de la empresa para adecuarse.

2.3. Captura de datos / recopilación

2.3.1. BI&A 1.0 Legados de sistemas

2.3.1.1. = conocimiento previo de la empresa (con lo que se empieza)

2.3.2. BI&A 2.0 (datos no estructurados o semi estructurados)

2.3.2.1. Texto

2.3.2.1.1. provienen de RS, emails, blogs

2.3.2.2. Video

2.3.2.2.1. closed circuit television (CCTV) video sharing websites

2.3.2.3. Audio

2.3.2.3.1. aplicaciones: call centers, healthcare

2.3.2.4. RSS

2.3.2.4.1. Content based analytics

2.3.2.4.2. structure based analytics

2.3.2.4.3. community detection

2.3.2.4.4. análisis de influencia social

2.3.2.4.5. link prediction

2.3.3. BI&A 3.0 ( movil y sensores)

2.4. Procesamiento de datos

2.4.1. Herramientas

2.4.1.1. batch processing

2.4.1.1.1. Apache Hadoop and map/reduce

2.4.1.1.2. Dryad

2.4.1.1.3. Apache mahout

2.4.1.1.4. Jaspersoft BI suite

2.4.1.1.5. Pentaho business analytics

2.4.1.1.6. Skytree server

2.4.1.1.7. Tableau

2.4.1.1.8. Karmasphere studio and analyst

2.4.1.1.9. Talend Open Studio

2.4.1.2. Procesamiento de flujo

2.4.1.2.1. Storm

2.4.1.2.2. S4

2.4.1.2.3. SQLstream s-Server

2.4.1.2.4. Splunk

2.4.1.2.5. Apache Kafka

2.4.1.2.6. SAP Hana

2.5. Almacenamiento de datos

2.5.1. nube

2.5.2. Saas

2.5.3. PaaS

2.6. Visualización de datos

2.6.1. Cuadros de mando

2.6.2. Scorecard

2.6.3. Reportes estándar

2.7. herramientas de análisis

2.7.1. Mineria de datos

2.7.1.1. modelos de predicción etc.

2.7.1.1.1. techniques to extract valuable information (patterns) from data, including clustering analysis, classification, regression and association rule learning

2.7.2. análisis estádistico

2.7.2.1. regresiones etc

2.7.2.1.1. used to exploit correlationships and causal relationships between different objectives

2.7.3. based on interactive analysis

2.7.3.1. Google’s Dremel

2.7.3.2. Apache drill

2.8. Un nuevo paradigma científico nace como un descubrimiento científico y sensible a las datos (DISD), también conocido como problemas de Big Data

2.8.1. principios

2.8.1.1. Principle 1. Good architectures and frameworks are necessary and on the top priority.

2.8.1.2. Principle 2. Support a variety of analytical methods

2.8.1.3. Principle 3. No size fits all

2.8.1.4. Principle 4. Bring the analysis to data

2.8.1.5. Principle 5. Processing must be distributable for in-memory computation.

2.8.1.6. Principle 6. Data storage must be distributable for in-memory storage.

2.8.1.7. Principle 7. Coordination is needed between processing and data units.

2.8.2. Tecnologías subyacentes

2.8.2.1. Granular computing

2.8.2.2. Cloud computing

2.8.2.3. Bio-inspired computing

3. 3 pasos para la adopción de análisis en la empresa (capacidades de empresa):

3.1. Aspiracional

3.2. Experimentado

3.3. Transformado

3.3.1. Unidad de análisis centralizado

3.3.2. 5 recomendaciones