De Engenheiro de Software a Cientista de Dados (e vice-versa) http://bit.ly/2H8WPmz

Começar. É Gratuito
ou inscrever-se com seu endereço de e-mail
Rocket clouds
De Engenheiro de Software a Cientista de Dados (e vice-versa) http://bit.ly/2H8WPmz por Mind Map: De Engenheiro de Software a Cientista de Dados (e vice-versa) http://bit.ly/2H8WPmz

1. Sobre Mim

1.1. Bacharel em Ciência da Computação

1.2. Mestrado/Doutorado

1.3. Cerca de 20 anos de experiência de mercado.

1.3.1. Java SE/EE

1.3.2. Web (PHP/ASP.NET/Ruby)

1.3.3. Cloud

1.4. Primeiro projeto com Redes Neurais em 2012

1.5. 2013: Zunnit Technologies

1.5.1. Desafio inicial: performance e confiabilidade.

1.5.2. Desafios de Ciência de Dados: - Sistemas de Recomendação - Aprendizado de Máquina corporativo.

1.6. 2016: Zunnit -> Kunumi

1.6.1. Estruturação da equipe técnica

1.6.2. Dezenas de projetos utilizando Aprendizado de Máquina em clientes corporativos.

1.6.3. Alguns projetos acadêmicos e "cultural landmarks"

1.6.3.1. RZO e Sabotage - NEURAL (Audio Oficial) Part. Negra Li e Familia Sabotage - Prod. DJCIA

2. Engenharia de Software

2.1. Motivação

2.1.1. "Software is eating the world"

2.1.2. Criar e manter sistemas de software complexos que geram valor.

2.2. Foco

2.2.1. Estruturação

2.2.2. Gerenciamento da Complexidade

2.2.3. Colaboração

2.2.4. Agilidade

2.2.5. Qualidade

2.3. Para o Cientista de Dados

2.3.1. Academia: Pesquise, Publique, Próximo.

2.3.1.1. Resultado: nenhum incentivo em relação à qualidade de código

2.3.1.2. Exemplo

2.3.1.2.1. karpathy/char-rnn

2.3.2. Endereçando deficiências

2.3.2.1. Estruturação de Código

2.3.2.2. Testes Unitários / Funcionais

2.3.2.3. Metodologias Ágeis

2.3.2.4. Versionamento de Código

2.3.2.5. Algoritmos e Estruturas de Dados (além de Ciência de Dados)

2.3.2.6. Trabalho em Equipe

3. Ciência de Dados

3.1. Motivação

3.1.1. Tomar decisões embasadas em dados

3.1.2. Aprender soluções a partir de dados

3.2. Foco

3.2.1. Experimentação

3.2.2. Desenvolvimento e Adaptação de algoritmos

3.2.3. Encontrar Explicações

3.2.4. Apresentação e Argumentação

3.3. "Machine Learning is eating software"

3.4. Para o Engenheiro de Software

3.4.1. Ciência de Dados começa com "Ciência"

3.4.1.1. Mais do que fazer perguntas, a Ciência consiste em aplicar o Método Científico para encontrar respostas.

3.4.1.2. Vieses Cognitivos

3.4.1.2.1. Viés de Confirmação

3.4.1.2.2. Ancoragem

3.4.1.2.3. Viés de disponibilidade

3.4.1.2.4. Muitos outros

3.4.2. O grande desafio: Estatística e Probabilidades

3.4.2.1. Probability Rules

3.4.2.2. Bayes Theorem

3.4.2.3. The Monty Hall Problem - Explained

3.4.2.4. Moral: estatística é contra-intuitiva!!!

3.4.2.5. Jake Vanderplas - Statistics for Hackers - PyCon 2016.mp4

3.4.2.6. Seven Essential Machine Learning Equations: A Cribsheet (Really, the Précis)

3.4.3. Algoritmos específicos para Ciência de Dados

3.4.3.1. Lembre-se: não reinvente a roda!!!!

3.4.3.2. Tópicos

3.4.3.2.1. Algoritmos Supervisionados

3.4.3.2.2. Métricas de avaliação

3.4.3.2.3. Algoritmos não-supervisionados (Clustering)

3.4.3.3. Cursos

3.4.3.3.1. Machine Learning | Coursera

3.4.3.3.2. Deep Learning Specialization - deeplearning.ai

3.4.3.4. Apenas ler sobre estes algoritmos não vai te dar a intuição sobre como utiliza-los. Você precisa de prática.

3.4.3.4.1. Exercícios práticos dos cursos online

3.4.3.4.2. Kaggle (mas não entre no fetiche das métricas)

3.4.4. Ética!

3.4.4.1. Aprendizado de Máquina pode amplificar vieses sociais (ou criar novos vieses indesejaveis)

3.4.4.2. É possível ainda violar a privacidade de indivíduos, seja de forma proposital ou de forma acidental (vazamento)

3.4.4.3. Áreas de estudo

3.4.4.3.1. Anonimização

3.4.4.3.2. Fairness

3.4.4.3.3. Social Biases

3.4.4.4. Keynote - Some Healthy Principles About Ethics & Bias In AI | Rachel Thomas @ PyBay2018