Algoritmos en minería de datos

Comienza Ya. Es Gratis
ó regístrate con tu dirección de correo electrónico
Rocket clouds
Algoritmos en minería de datos por Mind Map: Algoritmos en minería de  datos

1. ¿Que Son?

1.1. Son un conjunto de técnicas y cálculos que le permiten crear un modelo a partir de los datos.

2. Tener en cuenta:

2.1. Al elegir el Algoritmo por tema

2.1.1. El servidor SQL incluye:

2.1.1.1. Algoritmos de clasificación

2.1.1.1.1. Predicen una o más variables discretas, basadas en atributos del conjunto de datos.

2.1.1.2. Algoritmos de regresión

2.1.1.2.1. Predicen una o más variables continuas numéricas, resultados en otros atributos del conjunto de datos.

2.1.1.3. Algoritmos de Segmentación

2.1.1.3.1. Dividen los datos en grupos, o clústeres, de elementos que tienen propiedades similares.

2.1.1.4. Algoritmos de asociación

2.1.1.4.1. Buscan correlaciones entre los atributos de un conjunto de datos.

2.1.1.4.2. La aplicación más común de esta clase de algoritmos es la creación de reglas de asociación.

2.1.1.5. Algoritmos de análisis de secuencia

2.1.1.5.1. Resumen las secuencias frecuentes de episodios en los datos.

2.2. Al elegir un algoritmo por tarea

2.2.1. Ayuda a seleccionar un algoritmo para su uso con una tarea específica

2.2.1.1. Predecir un atributo discreto

2.2.1.2. Predecir un atributo continuo

2.2.1.3. Predecir una secuencia

2.2.1.4. Buscar grupos de elementos comunes en las transacciones

3. Pueden ser:

3.1. Supervisados ​​o predictivos

3.1.1. Predicen el valor de un atributo de un conjunto de datos conociendo otros atributos.

3.1.2. A partir de los datos, la etiqueta se conoce, se produce una relación entre dicha etiqueta y otra serie de atributos.

3.1.3. Esas relaciones sirven para realizar la predicción de los datos cuya etiqueta es desconocida.

3.2. No supervisados ​​o del descubrimiento del conocimiento.

3.2.1. Se descubren patrones y tendencias en los datos actuales.

3.2.2. El descubrimiento de esa información sirve para llevar a cabo un cabo un cabo acciones y obtener un bene fi cio de ellas.

4. Cómo permiten crear un modelo?

4.1. Analiza los datos proporcionados

4.2. Busca tipos específicos de patrones o tendencias.

4.3. Usa los resultados del análisis para determinar los parámetros óptimos

5. Cómo debe ser escogido un algoritmo?

5.1. Debe ser escogido en función del tipo de problema de Data Mining que se este llevando a cabo

5.1.1. Problemas pequeños y medianos

5.1.1.1. Problemas de hasta unos 40 parametros

5.1.1.1.1. Trust-Region

5.1.1.1.2. Newton-Raphson with line Search

5.1.1.1.3. Newton-Raphson with Riging

5.1.2. Problemas medianos

5.1.2.1. Problemas donde el numero de parametros sea de 400

5.1.2.1.1. Quast-Newton

5.1.2.1.2. reouble-Dogleg

5.1.3. Problemas grandes

5.1.3.1. Problemas con mas de 400 parametros

5.1.3.1.1. Conjugate gradient

6. Algunos ejemplos de algoritmos son:

6.1. Arboles de decisión

6.1.1. organizar datos formando ramas de influencia después de una decisión inicial

6.1.2. El tronco del árbol representa la decisión inicial

6.1.3. Empieza con una pregunta de sí o no

6.2. El algoritmo K-means

6.2.1. análisis de grupos

6.2.2. dividir datos recogidos en bloques -clústers

6.3. El algoritmo Apriori

6.3.1. controla los datos de transacciones

6.4. El algoritmo EM

6.4.1. define un parámetro analizando los datos

6.4.2. predice la posibilidad de una salida futura

6.5. Algoritmo PageRank

6.5.1. Puntúa y estima la relevancia de un trozo determinado de datos dentro de un gran conjunto

6.6. Algoritmo AdaBoost

6.6.1. funciona dentro de otros algoritmos

6.6.2. anticipan un comportamiento según los datos observados

6.7. Algoritmo del vecino k más cercano

6.7.1. reconoce patrones en la ubicación de los datos y los asocia con un identificador mayor.

6.8. Naive Bayes

6.8.1. predice la salida de una identidad basándose en los datos de observaciones conocidas

6.9. Algoritmo Classification and Regressive Tree (CART)

6.9.1. organiza datos según opciones que compiten

6.10. Máquinas de vectores de soporte

6.10.1. predicen cuál de dos posibles categorías incluye los datos de entrada