Comienza Ya. Es Gratis
ó regístrate con tu dirección de correo electrónico
Minería de Datos por Mind Map: Minería de Datos

1. Conceptos

1.1. Técnicas que se usan para optimizar el desarrollo de BI a partir de los datos

1.2. Describe el descubrimiento “minado” de conocimiento a partir de grandes cantidades de datos

1.3. Se compone de las matemáticas, estadísticas y la Inteligencia Artificial para extraer datos.

2. Aplicaciones

2.1. Medicina, Industria, Banca, Seguros, Turismo, Hardware y Software, Deportes.

3. Proceso KDD

3.1. Es un proceso automático en el que se combinan descubrimiento y análisis. El proceso consiste en extraer patrones en forma de reglas o funciones, a partir de los datos, para que el usuario los analice.

3.1.1. Sus Etapas son

3.1.1.1. Selección de Datos

3.1.1.2. Procesamiento de Datos

3.1.1.3. Técnicas de Minería

3.1.1.4. Evaluación e interpretación de resultados

3.1.1.5. Difusión y utilización del nuevo conocimiento

4. Análisis de Sentimientos

4.1. Conocida como minería de opinión.

4.2. Mide las emociones humanas inmersas en los datos sociales.

4.3. Analiza de modo rápido y eficiente la opinión de un producto, servicio u organización.

4.4. Sigue conversaciones de los usuarios influentes y ver sus tendencias.

4.5. Los datos están en redes sociales, foros, blogs y medios de comunicación.

5. Minería de texto

5.1. Los archivos de entrada son no estructurados o semiestructurados, como word, pdf y Archivos XML.

5.2. Tiene gran aplicación en bibliotecas, centros de salud, recetas, medios de comunicación.

5.3. Herramientas de Minería de texto (con licencia):

5.3.1. Clear forest, IBM Intelligent Miner Data Mining Suite, KNIME, SAS Text Miner.

5.4. Herramientas de Minería de texto (sin licencia):

5.4.1. Aika, Rapid Miner, LingPipe.

6. Modelos de Minería de Datos

6.1. Descriptivo

6.1.1. Describe el comportamiento de los datos para que sea interpretables por un usuario experto en el negocio.

6.2. Predictivo

6.2.1. Describe los datos y los utiliza para predecir el valor de algún atributo desconocido.

6.2.1.1. Dan Respuesta a

6.2.1.1.1. ¿Cómo se venderá el próximo año el producto x?

6.2.1.1.2. ¿Cuáles el riesgo de la persona x en contraer una enfermedad?

6.2.1.1.3. ¿Qué clientes son mas propensos a darse de baja de nuestra empresa?

7. Metodología SEMMA

7.1. “Proceso de selección, exploración y modelado de grandes volúmenes de datos para descubrir patrones de negocio desconocidos”

7.1.1. Sus Fases son

7.1.1.1. 1. Muestreo

7.1.1.2. 2. Exploración

7.1.1.3. 3. Modificación

7.1.1.4. 4. Modelado

7.1.1.5. 5. Evaluación (valoración)

8. Metodología CRISP-MD

8.1. Es un método probado para orientar sus trabajos de minería de datos. Como metodología, incluye descripciones de las fases normales de un proyecto, las tareas necesarias en cada fase y una explicación de las relaciones entre las tareas.

8.1.1. Sus Fases son

8.1.1.1. Fase 1:Compresión del negocio

8.1.1.2. Fase 2: Compresión de los datos

8.1.1.3. Fase 3:Preparación de los datos

8.1.1.4. Fase 4: Modelado de datos

8.1.1.5. Fase 5: Evaluación

8.1.1.6. Fase 6: Despliegue