Proceso de Extraccion
by JAIR EDUARDO CEDILLO LARA
1. se distribuya y se comunique a los posibles usuarios
2. Sistema experto. un analista recomiende acciones basándose en el modelo y en sus resultados
3. Difusion
4. Interés Novedad Simplicidad Comprensibilidad
5. Subjetivas
6. Precision Cobertura Confianza Error cuadratico medio(MSE) Cohesion
7. Los datos se dividen aleatoriamente en n grupos. Un grupo se reserva para el test Los otros n.-1grupos restantes forman el conjunto de entrenamiento.
8. Se dividen los datos en dos conjuntos: El conjunto de entrenamiento El conjunto de prueba
9. Validacion Cruzada
10. Validacion Simple
11. Precisos Comprensibles Interesantes
12. Caracter iteractivo Busqueda del "Buen Modelo" Modificacion de parametros del algoritmo de aprendizaje
13. Valores fuera del rango, estos mismos pueden ser erroneos o simplemente estan por encima del rango de los otros datos.
14. Coleccion de multiples bases de datos
15. Almacenes de Datos
16. Se recolectan datos por medio de base de datos externas a la organizacion y sin infrigir en la legalidad de estas mismas.
17. Consiste en extraer informacion factible por medio de una Base de Datos.
18. KDD
19. Fase de Integracion y Recoleccion
20. Fase de Seleccion, Limpieza y Transformacion
21. Construccion del Modelo
22. Fase de Evaluacion e Interpretacion
23. Tecnicas de Evaluacion
24. Medidas de Evaluación de Modelos
25. Fase de Difusión, Uso y Monitorización de modelos
26. Monotorizado
26.1. Medir lo bien que el modelo evoluciona.
27. Uso
28. tener muchas instancias de unas clases y muy pocas o ninguna de otras.
29. Tecnicas de inferencia estadistica Arboles de Decision Redes Neuronales Aprendizaje basado en instancias Algoritmos Geneticos Aprendizaje Bayesiano Programacion Logica Inductiva Metodos Basados en nucleos
30. Determinar el tipo de mineria, tipo de modelo y algoritmo indicado para el problema.
31. Tecnicas
32. Clasificacion Regresion Agrupamiento Correlaciones Reglas de Asociacion
33. Tareas
34. La calidad de los datos no lo es todo, si no el algortmi empleado para la recoleccion es otro aspecto relevante.
35. Datos perdidos,
36. Mineria de Datos
37. Interpretación y Contextualización