Introducción al análisis de la información y la minería de datos

Comienza Ya. Es Gratis
ó regístrate con tu dirección de correo electrónico
Introducción al análisis de la información y la minería de datos por Mind Map: Introducción al análisis de la información y la minería de datos

1. Inteligencia de Negocios la combinación de tecnología, herramientas y procesos que me permiten transformar mis datos almacenados en información, esta información en conocimiento y este conocimiento dirigido a un plan o una estrategia comercial

2. OLAP Básicamente, el Cubo OLAP, que acuña su nombre por su característica multidimensional, es una base de datos que posee diversas dimensiones, ampliando las posibilidades que hasta el momento ofrecían las conocidas hojas de cálculo.

3. Minería de datos es el proceso de detectar la información procesable de los conjuntos grandes de datos. Utiliza el análisis matemático para deducir los patrones y tendencias que existen en los datos.

4. PROCESO KDD a) Entender el dominio de aplicación, cuál es el problema a resolver, y cuáles son los objetivos. En este paso es cuando reconocemos las fuentes de información más importantes y quienes tienen control sobre ellas. b) Seleccionar del conjunto de datos originales, un subconjunto apropiado, para el problema que deseamos resolver. Eliminando por ejemplo variables irrelevantes. Los datos que necesitamos están ahí afuera. Datos relevantes al dominio y objetivos de nuestro estudio pueden existir. c) En la etapa de limpieza y pre procesamiento se deberían tomar decisiones con respecto a valores faltantes, atípicos, erróneos, etc. (ruido). También se podría necesitar normalizar los valores de las variables o llevar a cabo otras tareas similares. d) Minería de datos. Encontrar características útiles para representar a los datos dependiendo de los objetivos. Reducción de dimensiones para llevar adelante el trabajo con un número reducido de variables. Minería de datos. e) Elegir las herramientas de data mining adecuadas al problema a resolver, teniendo en cuenta el objetivo (predecir, explicar, clasificar, agrupar, etc.). También se debe en esta etapa, establecer los parámetros de las redes utilizadas (arquitectura de la red, datos de entrenamiento, de validación y de testeo, etc.). f) Interpretación de los datos, llevada a cabo por el analista. En la etapa de interpretación, hallamos los patrones y modelos en los datos analizados. Los resultados deben presentarse en un formato entendible.Interpretación de los datos, llevada a cabo por el analista. En la etapa de interpretación, hallamos los patrones y modelos en los datos analizados. Los resultados deben presentarse en un formato entendible. g) En esta etapa se debería consolidar el conocimiento ganado, probando los modelos creados contra los resultados obtenidos de la aplicación de estos modelos en el mundo real. h) En esta etapa se debería consolidar el conocimiento ganado, probando los modelos creados contra los resultados obtenidos de la aplicación de estos modelos en el mundo real.

5. ALGUNAS TÉCNICAS DE MINERÍA DE DATOS Redes Neuronales. Son un paradigma de aprendizaje y procesamiento automático inspirado en la forma en que funciona el sistema nervioso de los animales. Se trata de un sistema de interconexión de neuronas en una red que colabora para producir un estímulo de salida. Genéricamente, son métodos de proceso numérico en paralelo, en el que las variables interactúan mediante transformaciones lineales o no lineales, hasta obtener unas salidas. Regresión Lineal Es la más utilizada para formar relaciones entre datos. Es rápida y eficaz, pero insuficiente en espacios multidimensionales donde puedan relacionarse más de 2 variables. Define la relación entre una o más variables y un conjunto de variables predictoras de las primeras. Agrupamiento Es un procedimiento de agrupación de una serie de vectores según criterios habitualmente de distancia. Permite la clasificación de una población de individuos caracterizados por múltiples atributos (binarios, cualitativos o cuantitativos) en un número determinado de grupos, con base en las semejanzas o diferencias de los individuos. Árboles de decisión Es un modelo de predicción utilizado en el ámbito de la inteligencia artificial. Dada una base de datos se construyen estos diagramas de construcciones lógicas, muy similares a los sistemas de predicción basados en reglas, que sirven para representar y categorizar una serie de condiciones que suceden de forma sucesiva, para la resolución de un problema.Es un modelo de predicción utilizado en el ámbito de la inteligencia artificial. Dada una base de datos se construyen estos diagramas de construcciones lógicas, muy similares a los sistemas de predicción basados en reglas, que sirven para representar y categorizar una serie de condiciones que suceden de forma sucesiva, para la resolución de un problema. Modelos estadísticos Es una expresión simbólica en forma de igualdad o ecuación que se emplea en todos los diseños experimentales y en la regresión para indicar los diferentes factores que modifican la variable de respuesta. Los modelos estadísticos son los mismos usados en la toma de decisiones, debido a que su aplicabilidad de para la minería de datos es casi absoluta.