1. CIENTÍFICO DE DATOS
1.1. HABILIDADES
1.1.1. Estas personas tienen grandes conocimientos matemáticos y estadísticos y, además, dominan el software estadístico y la programación y los sistemas de análisis de datos masivos como el Machine Learning. También es necesario que controlen la tecnología y las bases de datos para poder aportar cambios y mejoras.
1.2. FUNCIONES
1.2.1. Su perfil profesional puede traducir grandes volúmenes de información disponibles conocidos como Big Data. Provienen de todo tipo de fuentes de información masiva y las convierten en respuestas. Trabaja en cualquier tipo de negocio e industria con el objetivo de obtener respuestas fiables a problemas cotidianos.
1.3. CUALIDADES
1.3.1. Curioso, con mucha lógica, creativo, analítico.
2. YO, COMO CIENTÍFICO DE DATOS
2.1. HABILIDADES
2.1.1. 1. Conocimientos en informática.
2.1.2. 2. Programación.
2.1.3. 3. Curiosidad.
2.1.4. 4. Autodidacta.
2.2. MEJORAS
2.2.1. 1.ESTADÍSTICA
2.2.2. 2.MATEMÁTICAS
2.2.3. 3.TRABAJO EN EQUIPO
2.2.4. 4.CONOCIMIENTO EN SOFTWARE PARA MODELAR DATOS.
3. ¿Qué es una metodología?
3.1. La metodología no depende de tecnologías ni herramientas específicas, ni es un conjunto de técnicas o recetas. Más bien, la metodología proporciona al científico de datos un marco sobre cómo proceder con los métodos, procesos y argumentos que se utilizarán para obtener respuestas o resultados.
4. METODOLOGÍAS SUGERIDAS PARA EL CIENTÍFICO DE DATOS
4.1. Etapa 1: Comprensión del negocio
4.1.1. Esta primera etapa sienta las bases para que el problema empresarial sea resuelto con éxito. Para ayudar a garantizar el éxito del proyecto, los promotores deben participar mientras dure el proyecto para proporcionar experiencia en el dominio, revisar los hallazgos intermedios y garantizar que el trabajo siga su curso para generar la solución deseada.
4.2. Etapa 2: Enfoque analítico
4.2.1. Esta etapa implica expresar el problema bajo el contexto de las técnicas estadísticas y de aprendizaje automático, para que la organización pueda identificar las más adecuadas para el resultado deseado.
4.3. Etapa 3: Requisitos de datos
4.3.1. El enfoque analítico elegido determina los requisitos de datos. Más concretamente, los métodos analíticos a utilizar requieren de determinados contenidos de datos, formatos y representaciones, orientados por el conocimiento en el dominio.
4.4. Etapa 4: Recopilación de datos
4.4.1. En la etapa inicial de recopilación de datos, los científicos de datos, identifican y reúnen los recursos de datos disponibles (estructurados, no estructurados y semiestructurados) y relevantes para el dominio del problema.
4.5. Etapa 5: Comprensión de datos
4.5.1. Después de la recopilación de datos inicial, los científicos de datos suelen utilizar estadísticas descriptivas y técnicas de visualización para comprender el contenido de los datos, evaluar su calidad y descubrir insights iniciales sobre ellos. Para llenar los huecos es posible que sea necesario volver a recopilar datos.
4.6. Etapa 6: Preparación de datos
4.6.1. Esta etapa abarca todas las actividades para construir el conjunto de datos que se utilizará en la subsiguiente etapa de modelado. Entre las actividades de preparación de datos están la limpieza de datos (tratar con valores no válidos o que faltan, eliminar duplicados y dar un formato adecuado), combinar datos de múltiples fuentes (archivos, tablas y plataformas) y transformar los datos en variables más útiles.
4.7. Etapa 7: Modelado
4.7.1. La etapa de modelado utiliza la primera versión del conjunto de datos preparado y se enfoca en desarrollar modelos predictivos o descriptivos según el enfoque analítico previamente definido. En los modelos predictivos, los científicos de datos utilizan un conjunto de capacitación (datos históricos en los que se conoce el resultado de interés) para construir el modelo.
4.8. Etapa 8: Evaluación
4.8.1. Durante el desarrollo del modelo y antes de su implementación, el científico de datos evalúa el modelo para comprender su calidad y garantizar que aborda el problema empresarial de manera adecuada y completa
4.9. Etapa 9: Implementación
4.9.1. Cuando el modelo satisfactorio ha sido desarrollado y aprobado por los promotores del negocio, se implementa en el entorno de producción o en un entorno de pruebas comparables. Por lo general, se implementa de forma limitada hasta que su rendimiento se haya evaluado completamente.
4.10. Etapa 10: Retroalimentación Al recopilar los resultados del modelo
4.10.1. Implementado, la organización obtiene retroalimentación sobre el rendimiento del modelo y su impacto en el entorno en el que se implementó.