Mineria de datos: es una forma innovadora de obtener información comercial valiosa mediante el an...

Track and organize your meetings within your company

Get Started. It's Free
or sign up with your email address
Mineria de datos: es una forma innovadora de obtener información comercial valiosa mediante el análisis de los datos contenidos en la base de datos de la empresa. Esta información sirve de ayuda para una adecuada toma de decisiones empresariales. Esencialmente, la minería de datos es un método innovador de aprovechar la información ya existente by Mind Map: Mineria de datos: es una forma innovadora de obtener información comercial valiosa mediante el análisis de los datos contenidos en la base de datos de la empresa. Esta información sirve de ayuda para una adecuada toma de decisiones empresariales. Esencialmente, la minería de datos es un método innovador de aprovechar la información ya existente

1. OLAP Es una solución utilizada en el campo de la llamada inteligencia empresarial cuyo objetivo es agilizar la consulta de grandes cantidades de datos, utiliza estructuras multidimensionales (o cubos OLAP) que contienen datos resumidos de grandes bases de datos o Sistemas Transaccionales (OLTP). Se usa en informes de negocios de ventas, marketing, informes de dirección, minería de datos y áreas similares.

2. KDD: es un proceso metodológico para encontrar un “modelo” válido, útil y entendible que describa patrones de acuerdo a la información, es un proceso metodológico para encontrar un “modelo” válido, útil y entendible que describa patrones de acuerdo a la información. Enumeramos sus etapas

2.1. Recogida de datos

2.1.1. La información que se quiere investigar se encuentra en bases de datos y otras fuentes muy diversas, tanto internas como externas muchas de estas fuentes son las que se utilizan para el trabajo transaccional.

2.2. Preparación de Datos

2.2.1. Limpieza y selección de datos: Se deben eliminar el mayor número posible de datos erróneos o inconsistentes, pueden acompañarse de “transformación” de atributos (numerización, discretización).

2.3. La Minería de Datos

2.3.1. - Una vez recogidos los datos de interés, un explorador puede decidir qué tipo de patrón quiere descubrir. - El tipo de conocimiento que se desea extraer va a marcar claramente la técnica de minería de datos a utilizar. - Según como sea la búsqueda del conocimiento se puede distinguir entre: Directed data mining y Undirected data mining

2.4. Evaluación y Validación

2.4.1. Criterios de evaluación de hipótesis 1ª Fase: Comprobación de la precisión del modelo en un banco de ejemplos independiente del que se ha utilizado para aprender el modelo. 2ª Fase: Se puede realizar una experiencia piloto con ese modelo. Por ejemplo, si el modelo encontrado se quería utilizar para predecir la respuesta de los clientes a un nuevo producto.

2.5. Interpretación y Difusión

2.5.1. Requiere un proceso de implementación o interpretación: • El modelo puede requerir implementación (p.ej. tiempo real detección de tarjetas fraudulentas). • El modelo es descriptivo y requiere interpretación (p.ej. una caracterización de zonas geográficas según la distribución de los productos vendidos). • El modelo puede tener muchos usuarios y necesita difusión: el modelo puede requerir ser expresado de una manera comprensible para ser distribuido en la organización

2.6. Actualización y Monitorización

2.6.1. Los procesos derivan en un mantenimiento: • Actualización: Un modelo válido puede dejar de serlo: cambio de contexto (económicos, competencia, fuentes de datos, etc.). • Monitorización: Consiste en ir revalidando el modelo con cierta frecuencia sobre nuevos datos, con el objetivo de detectar si el modelo requiere una actualizació

3. Tareas de minería de datos: En la clasificación cada instancia o registro de base de datos pertenece a una clase la cual se indica mediante el valor de un atributo que llamamos la clase de la instancia (Puede tomar varios valores discretos) , en la regresión se aprende una función real que asigna a cada instancia un valor real, es numérico, el grupamiento consiste en obtener grupos naturales a partir de datos, se basa en agrupar elementos por similitud. las correlaciones se usan para exterminar el grado de similitud de los valores de dos variables numéricas., por su parte las reglas de asociación identifican relaciones no explícitas entre atributos categóricos y secuenciales se usan para determinar patrones secuenciales en datos

4. Técnicas y su descripción

4.1. Regresión lineal: es un método simple, donde se utilizan atributos predictores, se pueden incorporar variantes locales o transformaciones en las variables predictoras y en la salida, puede trabajar de manera paramétrica o no paramétrica un ejemplo de esta técnica es la de discriminantes lineales de Fisher.

4.2. Árbol de decisión: serie de decisiones o condiciones organizadas en forma jerárquica a modo de árbol, sirven para encontrar estructuras de espacios de alta dimensionalidad con datos categóricos y numéricos, siguen la filosofía divide y vencerás, para trabajar el problema en subconjuntos, (árbol de clasificación, árbol de regresión)

4.3. Redes neuronales artificiales: permite modernizar problemas complejos con interacciones no lineales entre variables, trabajan directamente con valores numéricos, puede verse como un diagrama dirigido con muchos nodos (elementos del proceso) y arcos (interconexiones) entre ellos, se introducen los valores de los atributos de una instancia en los nodos de entrada y los nodos de salida determinan la predicción de la instancia.

4.4. Aprendizaje basado en instancias o casos: las instancias se almacenan en memoria, cuando llega una nueva instancia de valor desconocido se relaciona con las instancias almacenadas buscando las que mas se parecen, es muy útil para trabajar sobre datos no estándar, por ejemplo texto o multimedia.

4.5. Algoritmos evolutivos: Es un método de búsqueda colectiva, sigue los patrones de evolución biológica, se comienza con un modelo o solución inicial y a través de múltiples iteraciones, los modelos se combinan para crear nuevos modelos, utilizando una función de adaptación que selecciona los mejores modelos que sobrevivirán o serán cruzados.

5. Inteligencia de negocios Es la habilidad para transformar los datos en información, y la información en conocimiento, de forma que se pueda optimizar el proceso de toma de decisiones en los negocios, es un conjunto de procesos, aplicaciones y tecnologías que facilitan la obtención rápida y sencilla de datos provenientes de los sistemas de gestión empresarial para su análisis e interpretación