Proceso de Generación de conocimiento automático

Tarea Gestión del Conocimiento

Get Started. It's Free
or sign up with your email address
Proceso de Generación de conocimiento automático by Mind Map: Proceso de Generación de conocimiento automático

1. Proceso Completo

2. El aprendizaje automático, en muchos casos, consiste fundamentalmente en el aprendizaje de reglas a partir de los datos [MIT97], y por eso muchas de las técnicas de aprendizaje automático son utilizadas en la actualidad en la Minería de Datos.

3. Integración de datos

3.1. Los datos, si bien corresponden a la misma información, presentan formatos diferentes en los diferentes períodos de tiempo, debido a modificaciones del instrumento de recolección (formulario), de manera que deberán ser sometidos a un proceso de integración y unificación de conceptos.

4. Recondicionamiento y Limpieza de datos

4.1. Este paso tiene como objetivo reducir el ruido y las inconsistencias. Para ello, se seleccionará un resumen (muestra) de los datos, pudiendo de esta forma interpretar la validez de algún valor para algún atributo y mejorar la calidad de los datos. En el presente trabajo resulta interesante estudiar la cantidad de datos nulos y los outliers (datos erróneos), con el fin de reducir las posibilidades de error cuando sean procesados por el algoritmo de minería.

5. Modelacion

5.1. El modelado de datos es una manera de estructurar y organizar los datos para que se puedan utilizar fácilmente por las bases de datos. Los datos no estructurados se pueden encontrar en los documentos de procesamiento de texto, mensajes de correo electrónico, archivos de audio o vídeo, y programas de diseño.

6. Evaluación

6.1. Este paso evalúa el grado al que el modelo responde a los objetivos de negocio, y determina si hay alguna decisión de negocio que el modelo no cubra. Otra opción de evaluación es probar el modelo sobre escenarios de prueba. La evaluación también verifica otros resultados generados por la minería de datos. El objetivo es resumir los resultados de evaluación en términos de criterios de éxito de negocio, incluyendo una declaración final estableciendo si el proyecto ha alcanzado los objetivos iniciales de negocio.

7. Despliegue Consolidación de conocimiento - Patrones de conocimiento.

7.1. Los datos, si bien corresponden a la misma información, presentan

7.2. formatos diferentes en los diferentes períodos de tiempo, debido a modificaciones del

7.3. instrumento de recolección (formulario), de manera que deberán ser sometidos a un proceso de

7.4. integración y unificación de conceptos.

8. Enni Starlin Aybar mat:16-10892

9. Comprensión y análisis de información.

9.1. Es interrogar activamente un texto, construir su significado, basarlo en las experiencias previas y en los propósitos del lector. Es un proceso indispensable e inseparable en el ámbito académico, y en todos los ámbitos como profesionista.

10. Pre procesamiento

10.1. El preprocesamiento de datos es un paso preliminar durante el proceso de minería de datos. Se trata de cualquier tipo de procesamiento que se realiza con los datos brutos para transformarlos en datos que tengan formatos que sean más fáciles de utilizar.

11. Transformación de Datos

11.1. Consiste en la normalización de los mismos. Este paso implica la transformación del tipo de algunos atributos, en caso que fuera necesario, teniendo presente que convertir el tipo de un atributo a otro puede cambiar la semántica de dicho atributo. Este paso está muy ligado al algoritmo que procesará los datos para obtener conocimiento.

12. Reducción de Datos

12.1. En este paso se disminuye el tamaño de los datos, eliminando características redundantes. - Selección/Extracción de Atributos: Existen varias técnicas para llevar a cabo la tarea de selección de los atributos relevantes como ser: Métodos Basados en Filtros, mediante los cuales se filtran los datos antes de ser procesados por el algoritmo, y Métodos Basados en Wrappers, que seleccionan los atributos en función de la calidad del modelo de minería asociado a los atributos utilizados. La extracción de atributos puede ser vista como una proyección del espacio de estudio, ya que permite transformar el espacio de atributos, obteniendo otro espacio de atributos que represente la misma información de diferente manera. - Construcción de Atributos: Si se presentan patrones complejos en los datos se construirá un atributo sencillo de interpretar por el algoritmo.

13. Selección de técnicas de MD:Det. Algorítmica y análisis de resultados parciales.

13.1. Se analizan los resultados de los patrones obtenidos en la fase de MD, mediante técnicas de visualización y de representación, con el fin de generar conocimiento que aporte mayor valor a los datos. En esta fase se evalúan los resultados con los expertos y, si es necesario, se retorna a las fases anteriores para una nueva iteración.

14. Resultados de Data-set vs. algoritmos de validación (cross validation, split validation, otros).

14.1. es una técnica utilizada para evaluar los resultados de un análisis estadístico y garantizar que son independientes de la partición entre datos de entrenamiento y prueba. Consiste en repetir y calcular la media aritmética obtenida de las medidas de evaluación sobre diferentes particiones. Se utiliza en entornos donde el objetivo principal es la predicción y se quiere estimar la precisión de un modelo que se llevará a cabo a la práctica.1​ Es una técnica muy utilizada en proyectos de inteligencia artificial para validar modelos generados.