Mineria de Datos

Mineria de Datos

Comienza Ya. Es Gratis
ó regístrate con tu dirección de correo electrónico
Rocket clouds
Mineria de Datos por Mind Map: Mineria de Datos

1. Definición

1.1. Es el proceso de hallar anomalías, patrones y correlaciones en grandes conjuntos de datos para predecir resultados. Empleando una amplia variedad de técnicas, puede utilizar esta información para incrementar sus ingresos, recortar costos, mejorar sus relaciones con clientes, reducir riesgos y más.

1.2. Uso:

1.2.1. Para descubrir relaciones entre todas las cosas, desde precios, promociones y demografía hasta la forma en que la economía, el riesgo, la competencia y los medios sociales afectan sus modelos de negocios, ingresos, operaciones y relaciones con clientes.

2. Anállisis Data Mining

2.1. 4 Pasos:

2.1.1. 1. Determinación de los objetivos: El cliente determina qué objetivos quiere conseguir gracias al uso del Data Mining. 2. Procesamiento de los datos: Selección, limpieza, enriquecimiento, reducción y transformación de la base de datos. 3. Determinación del modelo: Primero se debe hacer un análisis estadístico de los datos y después visualización gráfica de los mismos. 4. Análisis de los resultados: En este paso se deberán verificar si los resultados obtenidos son coherentes.

2.2. Tipos de datos

2.2.1. Datos operativos o transaccionales:

2.2.1.1. ventas, costos, inventario, nómina y contabilidad

2.2.2. Datos no operacionales

2.2.2.1. ventas de la industria, datos del pronóstico del tiempo y datos macro económicos

2.2.3. Meta datos

2.2.3.1. datos sobre los datos en sí, como el diseño de base de datos lógica o los datos de las definiciones del diccionario

3. Impacto & Aplicación en Industrias y Disciplinas

3.1. Aplicación en áreas, empresas y organizaciones

3.1.1. Seguridad de datos, finanzas, salud, marketing, detección de fraude, búsquedas online, procesamiento del lenguaje natural, coches inteligentes, entre otros.

3.2. Impacto Interno

3.2.1. permite que las empresas determinen las relaciones entre los factores "internos" como el precio, posicionamiento del producto, o las habilidades del personal

3.3. Impacto Externo

3.3.1. permite que las empresas determinen las relaciones entre los factores"externos", como los indicadores económicos, la competencia, y la demografía de los clientes.

4. Software

4.1. Tipos de software de análisis disponibles

4.1.1. aprendizaje automático

4.1.2. estadísticos

4.1.3. redes neuronales

4.2. ¿Qué hace?

4.2.1. Analiza las relaciones y patrones en los datos de transacción almacenados sobre la base de consultas de los usuarios de composición abierta.

4.2.2. Buscan cualquiera de estos cuatro tipos de relaciones:

4.2.2.1. • Clases: Los datos almacenados se utilizan para localizar datos en grupos predeterminados.

4.2.2.1.1. Por ejemplo, una cadena de restaurantes podría minar datos de compra del cliente para determinar cuando los clientes los visitan y lo que normalmente ordenan. Esta información podría utilizarse para aumentar el tráfico al tener especiales del día.

4.2.2.2. • Grupos: Los elementos de datos se agrupan de acuerdo a las relaciones lógicas o preferencias de los consumidores.

4.2.2.2.1. Por ejemplo, los datos pueden ser extraídos para identificar segmentos de mercado o afinidades de los consumidores.

4.2.2.3. • Asociaciones: Los datos pueden ser minados para identificar asociaciones.

4.2.2.4. • Patrones secuenciales: Los datos se minan para anticipar patrones de comportamiento y tendencias.

4.2.2.4.1. Por ejemplo, un distribuidor especializado en sistemas al aire libre puede predecir la probabilidad de compra de una mochila basado en la compra de un consumidor de sacos de dormir y calzado de senderismo.

5. Técnicas de minería de datos

5.1. Elección del modelo

5.1.1. Determinada por dos condicionantes:

5.1.1.1. El tipo de los datos

5.1.1.2. El objetivo que se quiera obtener.

5.2. Todas estas técnicas se aplican mediante algoritmos probados e implementados en soluciones de minería de datos

5.2.1. Arboles de decisión, El algoritmo K-means, Máquinas de vectores de soporte, El algoritmo Apriori, El algoritmo EM, Algoritmo PageRank, Algoritmo AdaBoost, Algoritmo del vecino k más cercano, Naive Bayes, Algoritmo Classification and Regressive Tree (CART)

5.3. Técnicas

5.3.1. Técnicas descriptivas, en las que todas las variables tienen el mismo estatus

5.3.2. Técnicas predictivas, en las que las variables pueden clasificarse en dependientes e independientes

5.3.3. Técnicas auxiliares, en las que se realiza un análisis multidimensional de datos

6. Generales

6.1. Cinco elementos principales:

6.1.1. 1. Extraer, transformar y cargar datos de transacciones en el sistema de almacenamiento de datos.

6.1.2. 2. Almacenar y manejar los datos en un sistema de base de datos multidimensional.

6.1.3. 3. Proporcionar acceso a datos para los analistas de negocios y profesionales de tecnologías de la información.

6.1.4. 4. Analizar los datos por un software de aplicación.

6.1.5. 5. Presentar los datos en un formato útil, como un gráfico o tabla.

6.2. Hay cuatro tipos de tareas que normalmente se involucran en la minería de datos:

6.2.1. • Clasificación: la tarea de generalizar una estructura familiar para utilizarla en los nuevos datos. • Agrupamiento: la tarea de encontrar grupos y estructuras en los datos que son de alguna manera u otra lo mismo, sin necesidad de utilizar las estructuras observadas en los datos. • Aprendizaje de reglas de asociación: busca relaciones entre las variables. • Regresión: su objetivo es encontrar una función que modele los datos con el menor error.