CIENCIA DE DATOS e INTELIGENCIA ARTIFICIAL

Comienza Ya. Es Gratis
ó regístrate con tu dirección de correo electrónico
CIENCIA DE DATOS e INTELIGENCIA ARTIFICIAL por Mind Map: CIENCIA DE DATOS e INTELIGENCIA ARTIFICIAL

1. DATA SCIENCE

1.1. ¿QUÉ ES?

1.1.1. estudio de la extracción generalizada de conocimiento a partir de información, de datos.

1.2. DIFERENCIA DS Y ESTADÍSTICA

1.2.1. DS:

1.2.1.1. estudio de la recolección, análisis, interpretación, presentación y organización de datos.

1.2.1.2. Es más global

1.2.2. ESTADÍSTICA:

1.2.2.1. estudio de la extracción generalizada de conocimiento a partir de información, de datos.

1.3. CONOCIMINETOS NECESARIOS

1.3.1. Bases de datos relacionales, SQL

1.3.2. Bases de datos no relacionales, Big Data, NoSQL…

1.3.3. Lenguajes de programación: R, Python

1.3.4. Machine Learning

1.3.5. Programación de altas prestaciones, programación distribuida, Hadoop

1.4. DATA MINING

1.4.1. comprende un conjunto de técnicas y algoritmos para extraer conocimiento a partir de datos (ahora mismo de grandes volúmenes de datos)

1.4.1.1. KAGGLE

1.4.1.1.1. plataforma online para realizar competiciones de Data Mining

1.4.1.2. DATASEARCH

1.4.1.2.1. es un motor de búsqueda de Google que ayuda a los investigadores a localizar datos en línea

1.4.1.3. ORANGE

1.4.1.3.1. programa informático para realizar minería de datos y análisis predictivo

1.5. BIG DATA

1.5.1. ¿QUÉ ES?

1.5.1.1. Cantidades de datos a gran escala que sobrepasan la capacidad del software convencional para ser capturadas, procesadas y almacenadas en un tiempo razonable.

1.5.1.2. Infraestructuras, tecnologías y servicios que han sido creados para poder gestionar esta gran cantidad de información.

1.5.1.3. NO SON DATOS MASIVOS

1.5.2. CCAS.:

1.5.2.1. Volumen: Cantidad de datos es “Big” cuando su almacenamiento, procesamiento y explotación empieza a ser un reto para una organización.

1.5.2.2. Velocidad: Ritmo a los cuales los datos se están generando, que suele aumentar constantemente

1.5.2.3. Variedad: Gran diversidad de formatos distintos. Esta diversidad:

1.5.2.3.1. ○ Es clave para la riqueza de posibilidades del Big Data.

1.5.2.3.2. ○ Aumenta la complejidad de almacenamiento, procesamiento y análisis.

1.5.2.4. Veracidad: Los datos tienen que ser confiables

1.5.2.5. Valor: Los datos y su análisis tienen que generar un beneficio para las empresas

1.5.3. TIPOS

1.5.3.1. PROCEDENCIA

1.5.3.2. ESTRUCTURA

2. ¿QUÉ ES IA?

2.1. estudio e investigación informática que busca formas de imitar el funcionamiento de las neuronas humanas en las máquinas y la resolución de diversos problemas basados ​​en el comportamiento humano, mediante mecanismos matemáticos y lógicos

3. REDES NEURONALES

3.1. son sistemas de cálculo o algoritmos inspirados en el funcionamiento del cerebro humano

3.2. funcionan como lo haría una neurona llevando información hasta otra a través de la sinapsis

4. MACHINE LEARNING

4.1. ¿QUÉ ES?

4.1.1. es el diseño y estudio de las herramientas informáticas que utilizan la experiencia pasada para tomar decisiones futuras

4.1.2. combina conceptos y técnicas de diferentes áreas del conocimiento, como las matemáticas, estadísticas y las ciencias de la computación.

4.2. OBJETIVO

4.2.1. generalizar, o inducir una regla desconocida a partir de ejemplos donde esa regla es aplicada.

4.3. APLICACIONES

4.3.1. Motores de búsqueda

4.3.2. Diagnósticos médicos

4.3.3. Detección de fraude en el uso de tarjetas de crédito

4.3.4. Análisis del mercado de valores

4.3.5. Clasificación de secuencias de ADN

4.3.6. Reconocimiento del habla y del lenguaje escrito

4.3.7. Juegos y robótica.

4.4. TIPOS DE APRENDIZAJE AUTOMÁTICO

4.4.1. Aprendizaje supervisado

4.4.2. Aprendizaje no supervisado

4.4.3. Aprendizaje por refuerzo

4.5. PASOS PARA CONSTRUIR UN MODELO DE ML

4.5.1. Recolectar los datos

4.5.2. Preprocesar los datos

4.5.3. Explorar los datos

4.5.4. Entrenar el algoritmo

4.5.5. Evaluar el algoritmo

4.5.6. Utilizar el modelo

4.6. DEEP LEARNING

4.6.1. DIFERENCIAS ML vs DL

4.6.1.1. ML

4.6.1.1.1. Se le suministra al algoritmo las características

4.6.1.2. DL

4.6.1.2.1. Las variables significativas las debe encontrar el propio modelo

4.6.1.2.2. No hay variables de entrada xi

4.6.1.2.3. El rendimiento no se estanca a partir de un cierto número de datos. Cuantos más datos, mejor.