
1. Aplicación
1.1. Comercio y banca
1.1.1. Segmentación de clientes, previsión de ventas, análisis de riesgo.
1.2. Medicina y Farmacia
1.2.1. Diagnóstico de enfermedades y la efectividad de los tratamientos.
1.3. Seguridad y detección de fraude
1.3.1. Reconocimiento facial, identificaciones biométricas, accesos a redes no permitidos, etc.
1.4. Recuperación de información no numérica
1.4.1. Minería de texto, minería web, búsqueda e identificación de imagen, video, voz y texto de bases de datos multimedia
1.5. Astronomía
1.5.1. Identificación de nuevas estrellas y galaxias.
1.6. Geología, minería, agricultura y pesca
1.6.1. Identificación de áreas de uso para distintos cultivos o de pesca o de explotación minera en bases de datos de imágenes de satélites.
1.7. Ciencias Ambientales:
1.7.1. Identificación de modelos de funcionamiento de ecosistemas naturales y/o artificiales para mejorar su observación, gestión y/o control.
1.8. Ciencias Sociales
1.8.1. Estudio de los flujos de la opinión pública. Planificación de ciudades
2. Etapas
2.1. Determinar objetivos: el usuario determina los objetivos que quiere conseguir con el uso de la minería de datos.
2.2. Procesamiento de los datos: se realiza una selección, limpieza, enriquecimiento, reducción y transformación de la base de datos.
2.3. Elección de un modelo: una vez obtenidos los datos, se debe realizar un análisis estadístico de estos y, luego, una visualización gráfica.
2.4. Análisis de los resultados: finalmente, se deberá verificar si los resultados obtenidos son coherentes.
3. Es un conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos
3.1. Métodos
3.1.1. Árboles de decisión
3.1.1.1. Son diagramas lógicos que plantean, ante una determinada situación, cuáles son las opciones de intervención posibles
3.1.2. Redes neuronales
3.1.2.1. Son modelos que, a través del aprendizaje automático, intentan llenar los vacíos de interpretación en un sistema.
3.1.3. Clustering
3.1.3.1. Tiene como objetivo la segmentación de elementos que presentan alguna característica definitoria en común.
3.1.4. Extracción de reglas de asociación
3.1.4.1. Persigue la inferencia de silogismos del tipo si…/entonces… a partir de conjuntos de registros.
3.1.5. Redes bayesianas
3.1.5.1. Son representaciones gráficas de relaciones de dependencia probabilística entre distintas variables.
3.1.6. Regresión
3.1.6.1. Toma como punto de partida una serie histórica para, a partir de ella, predecir qué sucederá a continuación.
3.1.7. Modelado estadístico
3.1.7.1. Pretende dibujar el mapa de relaciones entre variables explicativas y dependientes, y mostrar cómo cambia a medida que lo hacen los parámetros considerados en su planteamiento.
4. Importancia
4.1. Permiten explorar grandes bases de datos, de manera automática o semiautomática
4.1.1. Filtrar todo el ruido caótico y repetitivo en sus datos.
4.1.2. Entender qué es relevante y luego hacer un buen uso de esa información para evaluar resultados probables
4.1.3. Acelerar el ritmo de la toma de decisiones informadas.