Comienza Ya. Es Gratis
ó regístrate con tu dirección de correo electrónico
Minería de datos por Mind Map: Minería de datos

1. Es

1.1. Un conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos, de manera automática o semiautomática, con el objetivo de encontrar patrones repetitivos que expliquen el comportamiento de estos datos

2. Inteligencia de negocios

2.1. Es

2.1.1. El conjunto de procesos, aplicaciones y tecnologías que facilitan la obtención rápida y sencilla de datos provenientes de los sistemas de gestión empresarial para su análisis e interpretación, de manera que puedan ser aprovechados para la toma de decisiones y se conviertan en conocimiento para los responsables del negocio.

2.1.1.1. OLAP

2.1.1.1.1. Es una tecnología que organiza grandes bases de datos comerciales y admite análisis complejos

2.2. Donde se podría utilizar

2.2.1. En la industria se podría utilizar para poder agilizar procesos

2.2.2. En mi trabajo hace poco se implementaron equipos nuevos, lo que agilizo los procesos de búsqueda de información y de nutrirse de la misma, por lo cual ayudo a estar mas preparados para saber que hacer en donde poner mayor énfasis y mejorarlo.

2.2.3. En la vida cotidiana, se podría utilizar en tu forma de no se como gastas tu dinero, de que manera lo ganamos y en que se va el mismo

3. Proceso de KDD

3.1. Es básicamente un proceso automático en el que se combinan descubrimiento y análisis

3.1.1. Etapas

3.1.1.1. Selección.

3.1.1.1.1. Una vez identificado el conocimiento relevante y prioritario y definidas las metas del proceso kdd, desde el punto de vista del usuario final, se crea un conjunto de datos objetivo, seleccionando todo el conjunto de datos o una muestra representativa de este, sobre el cual se realiza el proceso de descubrimiento.

3.1.1.2. Preprocesamiento/limpieza.

3.1.1.2.1. Se analiza la calidad de los datos, se aplican operaciones básicas como la remoción de datos ruidosos, se seleccionan estrategias para el manejo de datos desconocidos, datos nulos, datos duplicados y técnicas estadísticas para su reemplazo.

3.1.1.3. Transformación/reducción.

3.1.1.3.1. Se buscan características útiles para representar los datos dependiendo de la meta del proceso

3.1.1.4. Minería de datos

3.1.1.4.1. Búsqueda y descubrimiento de patrones insospechados y de interés, aplicando tareas de descubrimiento como clasificación.

3.1.1.5. Interpretación/evaluación.

3.1.1.5.1. Se interpretan los patrones descubiertos y posiblemente se retorna a las anteriores etapas para posteriores iteraciones

4. Tareas

4.1. Clasificación

4.1.1. Tree (Árboles de decisión)

4.1.1.1. Permite determinar la decisión que se debe tomar siguiendo las condiciones que se cumplen desde la raíz hasta alguna de sus hojas.

4.1.2. Random Forest

4.1.2.1. Es una combinación de árboles predictivos, el cual trabaja con una colección de árboles correlacionados y los promedia

4.2. Selección

4.2.1. Algoritmos Genéticos

4.2.1.1. Imitan la evolución de las especies mediante la mutación, reproducción y selección

4.2.2. Regresión lineal

4.2.2.1. Para la formación de relaciones entre datos

4.3. Predicción

4.3.1. Aprendizaje automático

4.3.1.1. Es utilizada para inferir conocimiento del resultado de la aplicación de alguna de las otras técnicas

4.3.2. Los modelos estadísticos

4.3.2.1. Se trata de una expresión simbólica en forma de igualdad que es empleada en los diseños experimentales y en la regresión, con la intención de identificar los factores que modifican la variable de respuesta

4.3.3. Regla de inducción

4.3.3.1. Consiste en derivar un conjunto de reglas para clasificar casos

4.4. Categorización

4.4.1. Redes neuronales

4.4.1.1. Instrumentos de uso frecuente para detectar categorías comunes en los datos

4.4.2. Clustering

4.4.2.1. Agrupan datos dentro de un número de clases preestablecidas o no, partiendo de criterios de distancia o similitud

4.4.3. Agrupamiento

4.4.3.1. Se trata de la disposición de los vectores de entrada de manera que estén más cercanos a los que tengan características comunes.