Minería de datos

Jetzt loslegen. Gratis!
oder registrieren mit Ihrer E-Mail-Adresse
Minería de datos von Mind Map: Minería de datos

1. Algoritmos

1.1. Algoritmo ID3

1.1.1. Es utilizado dentro del ámbito de la inteligencia artificial. Su uso se engloba en la búsqueda de hipótesis o reglas en él, dado un conjunto de ejemplos.

1.2. Algoritmo K-means

1.2.1. Es un método de agrupamiento, que tiene como objetivo la partición de un conjunto de n observaciones en k grupos en el que cada observación pertenece al grupo cuyo valor medio es más cercano. Es un método utilizado en minería de datos.

1.3. PRISM

1.3.1. Es un algoritmo de cubrimiento sencillo que asume que no hay ruido en los datos. Su objetivo es crear reglas perfectas que maximicen la relación p/t, siendo p la cantidad de ejemplos positivos cubiertos por la regla y t la cantidad de ejemplos cubiertos por la regla.

1.4. Regresión lineal

1.4.1. Es un algoritmo de aprendizaje supervisado que se utiliza en Machine Learning y en estadística. En estadísticas, regresión lineal es una aproximación para modelar la relación entre una variable escalar dependiente “y” y una o mas variables explicativas nombradas con “X”.

1.5. Algoritmo K-medoids

1.5.1. Trabaja con particiones (dividiendo el conjunto de datos en grupos) y ambos intentan minimizar la distancia entre puntos que se añadirían a un grupo y otro punto designado como el centro de ese grupo.

1.6. Algoritmo C4.5

1.6.1. Construye árboles de decisión desde un grupo de datos de entrenamiento de la misma forma en que lo hace ID3

2. Técnicas

2.1. Redes neuronales

2.1.1. Se trata de un paradigma de aprendizaje y de un procesamiento automatizado que se encuentra inspirado en la manera que funciona el sistema nervioso de los animales. Es un sistema que permite interconectar las neuronas en una red (red neuronal) que presta colaboración para la producción de estímulos de salida.

2.2. Árboles de decisión

2.2.1. Se trata de un modelo de predicción que se utiliza en el campo de la inteligencia artificial a partir de una base de datos en donde se construyen los diagramas de construcciones lógicas. Es un sistema similar a la predicción que está basado en reglas que sirven para la representación de una serie de condiciones que se presentan de manera sucesiva en la resolución de problemas.

2.3. Modelos estadísticos

2.3.1. Se trata de una expresión simbólica en forma de igualdad que es empleada en los diseños experimentales y en la regresión, con la intención de identificar los factores que modifican la variable de respuesta.

2.4. Clustering

2.4.1. Consiste en la agrupación de una serie de vectores según determinados criterios que habitualmente son a distancia. Se trata de la disposición de los vectores de entrada de manera que estén más cercanos a los que tengan características comunes.