1. ¿QUE ES BIG DATA?
1.1. Los macrodatos, también llamados datos masivos, inteligencia de datos, datos a gran escala o big data es un término que hace referencia al concepto relativo a conjuntos de datos tan grandes y complejos como para que hagan falta aplicaciones informáticas no tradicionales de procesamiento de datos para tratarlos adecuadamente.
2. Después de identificar todas las fuentes potenciales de datos, considere las decisiones que necesitará tomar una vez que comience a sacar provecho de la información. Éstas incluyen:
2.1. Cómo almacenarlos y gestionarlos,Qué tantos analizar,Cómo utilizar los insights que usted descubre
2.1.1. Cuantos más conocimientos tenga, mayor confianza tendrá al tomar decisiones de negocios. La decisión inteligente es contar con una estrategia cuando tenga abundancia de información en mano.
2.1.1.1. El paso final para lograr que el big data trabaje para su empresa consiste en investigar las tecnologías que le ayudarán a sacar el mayor provecho del big data y del análisis del mismo. Considere: • Espacio de almacenaje abundante y económico. • Procesadores más rápidos. • Plataformas distribuidas de big data de fuente abierta asequibles, como Hadoop. • Procesamiento paralelo, agrupación en clústeres, MPP, virtualización, grandes entornos de red, alta conectividad y resultados sólidos. • Computación en la nube y otras disposiciones flexibles de distribución de recursos.
3. Existen muchísimas herramientas para el manejo de big data. Algunos ejemplos incluyen Hadoop, NoSQL, Cassandra, inteligencia empresarial, aprendizaje automático y MapReduce. Estas herramientas tratan con algunos de los tres tipos de big data:
3.1. Datos no estructurados: .
3.1.1. Datos semiestructurados: datos que no se limitan a campos determinados, pero que contiene marcadores para separar los diferentes elementos. Es una información poco regular como para ser gestionada de una forma estándar. Estos datos poseen sus propios metadatos semiestructuradosque describen los objetos y las relaciones entre ellos, y pueden acabar siendo aceptados por convención. Como ejemplos tenemos los archivos tipo hojas de cálculo, HTML, XML o JSON
3.1.1.1. Datos estructurados: datos que tienen bien definidos su longitud y su formato, como las fechas, los números o las cadenas de caracteres. Se almacenan en tablas. Un ejemplo son las bases de datos relacionales y los almacenes de datos.