Análisis de información y minería de datos

Análisis de la información

Kom i gang. Det er Gratis
eller tilmeld med din email adresse
Análisis de información y minería de datos af Mind Map: Análisis de información y minería de datos

1. La minería de datos es el proceso de detectar la información procesable de los conjuntos grandes de datos. Utiliza el análisis matemático para deducir los patrones y tendencias que existen en los datos.

2. Definición

3. Conceptos

3.1. Inteligencia de negocios

3.1.1. La Inteligencia de Negocios es un conjunto de estrategias, tecnologías, aplicaciones enfocadas a la administración y creación de conocimiento sobre nuestro negocio, a través del análisis de datos de una organización o empresa.

3.2. OLAP

3.2.1. Proporcionan a las compañías un sistema confiable para procesar datos que luego serán utilizados para llevar a cabo análisis e informes que permitan mejorar las operaciones productivas, tomar decisiones inteligentes y optimizar la competitividad en el mercado.

3.3. Minería de datos

3.3.1. Es el proceso de detectar la información procesable de los conjuntos grandes de datos.

4. Tareas

4.1. Consiste en la extracción no trivial de información, que reside de manera implícita en los datos.

4.1.1. Clasificación

4.1.1.1. La clasificación genera una organización dentro de las propias clases,

4.1.2. Segmentación

4.1.2.1. Esta tarea también es conocida como segmentación, y se encarga de identificar grupos naturales basándose en un conjunto de atributos

4.1.3. Predicción

4.1.3.1. Está asociada a valores continuos. Es decir, en el conjunto de entrenamiento la variable objetivo es una variable continua

4.1.4. Categorización

4.1.4.1. Se asigna a una clase, representada por el valor de un atributo, el dominio del atributo.

4.1.5. Asociación

4.1.5.1. El objetivo es determinar relaciones no evidentes entre atributos categóricos.

4.1.6. Patrones secuenciales

4.1.6.1. Detectan patrones entre transacciones, lo que permite optimizar las ventas a lo largo del tiempo

5. Proceso KDD

5.1. Fayyad en 1996 define el Knowledge Discovery Databases, también conocido como KDD,o descubrimiento de conocimiento en bases de datos como “el proceso no trivial de identificar patrones válidos, novedosos, potencialmente útiles y, en última instancia, comprensibles a partir de los datos.”

5.1.1. Etapas

5.1.1.1. Etapa de Selección

5.1.1.1.1. En la etapa de selección, una vez identificado el conocimiento relevante y prioritario y definidas las metas del proceso kdd, se define qué datos serán recolectados

5.1.1.2. Etapa Pre-procesamiento/limpieza

5.1.1.2.1. En esta etapa se analiza la calidad de los datos, se aplican operaciones básicas como la remoción de datos ruidosos

5.1.1.3. Etapa Transformación/reducción

5.1.1.3.1. Se buscan características útiles para representar los datos dependiendo de la meta del proceso

5.1.1.4. Etapa Minería de datos (data mining)

5.1.1.4.1. En esta etapa el objetivo de minería de datos es la búsqueda y descubrimiento de patrones insospechados y de interés, aplicando tareas de descubrimiento

5.1.1.5. Etapa Interpretación/evaluación

5.1.1.5.1. En esta etapa se interpretan los patrones descubiertos y posiblemente se retorna a las anteriores etapas para posteriores iteraciones