Python Developer Data Science e IA

Começar. É Gratuito
ou inscrever-se com seu endereço de e-mail
Python Developer Data Science e IA por Mind Map: Python Developer Data Science e IA

1. Panorama da Carreira

1.1. Linguagens de Programação

1.1.1. Spark

1.1.2. Scala

1.1.3. Julia

1.1.4. C/C++

1.1.5. R

1.1.6. Python

1.1.7. Bash

1.1.8. Java

1.1.9. SQL

1.1.10. Hadoop

1.2. Pré-processamento de dados

1.2.1. Obtenção de dados

1.2.2. Limpeza de dados

1.2.3. FeatureEnginnering

1.2.4. Handling Missing Data

1.3. Estatística

1.3.1. Estatísticas inferenciais

1.3.2. Teste de hipóteses

1.3.3. Projeto experimental

1.3.4. Estatística Descritiva

1.4. Aprendizado de Máquina

1.4.1. Unsupervised Learning

1.4.2. Clustering

1.4.3. Regressão

1.4.4. Principal component analysis

1.4.5. K-means

1.4.6. Classification

1.4.7. Supervised Learning

1.4.8. Redes neurais

1.4.9. Back propagation

1.4.10. Deep Learning (GAN/CNN)

1.4.11. Support Vector Machine

1.5. Comece o desenvolvimento

1.5.1. Quando os designs de UX/UI forem aprovados, dê um pontapé inicial no processo de desenvolvimento

1.6. Matemática

1.6.1. Discrete mathematics

1.6.2. Álgebra Linear

1.6.3. Matrizes

1.6.4. Otimização

1.6.5. RealAnalysis

1.6.6. Cálculo

1.6.7. Geometria

1.6.8. Teoria da probabilidade

1.7. Engenharia de Software

1.7.1. Model Deployment

1.7.2. Tidy Code

1.7.3. Parallel Computing

1.7.4. Melhoras práticas

1.7.5. Estruturas de Dados

1.7.6. Web Development

1.7.7. Optimize Code

1.8. Visualização de Dados

1.8.1. Análise de dados exploratória

1.8.2. Tipos (comparação, composição, relacionamento, distribuição)

1.9. Soft skills

1.9.1. Escrita

1.9.2. Resolução de problemas

1.9.3. Curiosidade

1.9.4. Comunicativo

1.9.5. Pensamento crítico

1.9.6. Storytelling

1.9.7. Criatividade

2. Abertura

2.1. funções descrevem o mundo, logo descobrir funções é algo muito poderoso.

2.1.1. Modelos matemáticos e ou algoritmos

2.1.1.1. capturar padrões

2.1.1.2. relacionamento dos dados no mundo real

2.1.1.2.1. youtubers (influenciadores)

2.2. O aprendizado de máquina (Machine Learning) nos dá ferramentas que nos permite estimar e aproximar essas funções quaisquer.

2.2.1. Avalanche digital

2.2.1.1. Big Data

2.2.2. Previsões estratosféricas de bytes para os próximos anos

2.2.2.1. dia a dia, meses anos

2.2.2.1.1. Inteligência Artificial

2.2.2.1.2. Inteligência Artificial Generativa

2.2.3. Acessar e interpretar dados tornou-se estratégia para as industrias

2.2.3.1. Data Driven

2.2.4. 2015: Chief Data Scientist, Cientista-Chefe de Dados do governo norte americano (Gestão Barack Obama)

2.2.4.1. Aprox. 138 mil bases de dados do governo federal dos EUA.

2.2.4.1.1. econômia

2.2.4.1.2. política

2.2.4.1.3. ciências sociais

2.2.4.1.4. guerra

2.2.5. Evolução das ferramentas de Dados

2.2.5.1. Data Science (ciência de dados)

2.2.5.1.1. Os conhecimentos não são tão novos assim!

2.2.5.1.2. A revolução , esse estouro na bolha e a popularização deve-se ao surgimento do Big Data e uma nova visão mundial sobre essa grande quantidade dados.

2.2.5.1.3. Limpeza de Dados

2.3. Precisamos de bons dados representativos do problema

2.3.1. introdução

2.3.1.1. ciência de dados em síntese é a matemática e estatística aplicada a uma linguagem de programação para resolver problema de negócio.

2.3.1.1.1. Manoel vai explicar para o Barack Obama

2.3.1.1.2. William: Banco Central

2.3.1.2. Vamos montar um projeto de ciência de dados é preciso conhecer a área de negócios

2.3.1.2.1. entender o negócio (especialista de domínio)

2.3.1.3. Algoritmo: uma sequência de passos para realizar uma determinada tarefa.

2.3.1.4. A ciência de dados vai alavancar o negócio de uma determinada organização

2.3.1.5. Empresas da Data Driven não necessariamente são empresas de tecnologia.

2.3.1.6. Empresas de diversas áreas contratam ciêntista de dados para usar os dados (como barras de ouro)

2.3.1.7. Data Driven é uma metodologia utilizada por empresas que querem se antecipar e vencer em um mercado competitivo. (quem se antecipa governa)

2.3.1.8. Netflix matou o próprio negócio, migrando para o mundo digital. (ela usou os dados para tomada de decisão) : Netflix (Data Driven)

2.3.1.9. Itaú: batalha de dados (hackaton) - criar soluções inovadoras com startups - potêncializar

2.3.1.10. Spotify : monta playlists com atende com particularidades seus clientes (focado em dados)

2.3.1.11. Olha que legal! Você pode montar a sua startup ( e ela já nascer Data Driven .... uau)

2.3.2. questionário

2.3.2.1. vamos entrar no Google Sala de Aula

2.3.2.1.1. links da aula anterior

2.4. Precisamos de uma boa técnica de ML

2.4.1. Principais Definições

2.4.1.1. Inteligência Artificial

2.4.1.1.1. Cultura Pop

2.4.1.1.2. Stuart Russel e Peter Norvig: "Denominamos nossa espécie Homo Sapiens - homem sábio - porque nossa inteligência é muito importante para nós."

2.4.1.1.3. Como pensamos, como agimos?

2.4.1.1.4. Um dos campos mais interessantes e mais rápido crescimento

2.4.1.1.5. subcampos

2.4.1.1.6. jogar xadrez

2.4.1.1.7. teoremas matemáticos

2.4.1.1.8. criar poesia

2.4.1.1.9. dirigir um carro

2.4.1.1.10. diagnosticar doenças

2.4.1.1.11. Tarefas intelectuais

2.4.1.1.12. Campo Universal , um grande guarda chuva...

2.4.1.1.13. Agir de forma humana: abordagem do teste de turing

2.4.1.1.14. Processamento de linguagem natural

2.4.1.1.15. Visão Computacional

2.4.1.1.16. Robótica: manipular objetos e mover-se

2.4.1.1.17. Luciano: Laboratórios Azure (vários recursos de I.A)

2.4.1.2. Machine Learning

2.4.1.2.1. Métodos matemáticos usados para treinar algoritmos que identificam padrões

2.4.1.3. Data Analysis

2.4.1.3.1. Coleta e Interpretação de Dados ( depende do autor)

2.4.1.4. Data Science

2.4.1.4.1. É um termo ao uso de dados com a finalidade de prever comportamentos, realizando análises exploratórias para fornecer recomendações baseadas em modelos identificados por dados presentes e passados.

2.5. Reflexões

2.5.1. Desafio é modelar o problema matemáticamente, colocar num forma que faça sentido para ajustar um modelo, com uma função objetivo (loss) bem definida

2.5.2. Diferenciar os tipos de variáveis e e construir todas as variáveis para resolver o problema que é o desafio.

2.5.3. Apenas estimar a função é moleza, as ferramentas de IA fazem isso pra gente.

2.5.4. O desafio maior é chegar na formulação do problema cuja função estimada é de fato a função que você precisa.

3. Definições Gerais

3.1. Inteligência Artificial

3.1.1. Inteligência artificial (IA) é um campo da ciência da computação que se concentra no desenvolvimento de sistemas e algoritmos capazes de realizar tarefas que normalmente requerem inteligência humana. (Grande Guarda-Chuva Conceitual da Computação)

3.1.2. Dados (DataSet)

3.1.2.1. Machine Learning (Aprendizado de Máquina) é uma subcategoria da inteligência artificial (IA) que se concentra no desenvolvimento de algoritmos e técnicas que permitem aos computadores aprenderem a partir de dados

3.1.2.1.1. Deep Learning

3.1.2.2. Diversas fontes

3.1.2.2.1. .xml

3.1.2.2.2. .csv

3.1.2.2.3. .xlsx

3.1.2.2.4. .json

3.1.2.2.5. .sql

3.1.2.2.6. Modelagem dos Dados

3.2. Machine Learning

3.3. Deep Learning

3.4. Todo ML é IA mas nem toda IA é ML

3.5. Todo DL é um ML mas nem todo ML é UM DL.

3.6. Máquina vai aprender

3.6.1. Deep - Programador

3.7. ML - algoritmos (modelos) - estátistica e matemática

3.7.1. Redes Neurais (DP)

3.8. Visão Computacional (Alex)

3.8.1. covid

3.8.1.1. Machine Learning (toda DL é ML)

3.8.1.1.1. camêra pegava a temperatura, estimava sobre a pessoa ter covid ou não. ( >=38º graus)

3.8.1.1.2. Reconhecer cachorros e diferenciar de gatos

4. Introdução Nuvem

4.1. O que é Nuvem pra Você?

4.1.1. Segundo meus alunos do InovaTech (Turma 01 de I.A 2024)

4.1.1.1. Armazenamento

4.1.1.1.1. fotinha do casamento (nuvem)

4.1.1.2. Pago para armazenar

4.1.1.2.1. muitas fotinhas (pagar)

4.1.1.3. Armazenar vários dados na Nuvem

4.1.1.3.1. guardar trabalhos acadêmicos

4.1.1.4. Algum lugar online

4.1.1.4.1. Google Drive

4.1.1.4.2. One Drive

4.1.1.4.3. Amazon S3

4.1.1.4.4. iCloud

4.1.1.4.5. Megasync

4.1.1.4.6. XBox Cloud Gaming

4.1.1.4.7. DropBox

4.2. Já entrou alguma vez na nuvem da Microsoft?

4.2.1. no email pessoal , verificar se chegou um email : @sesi.org.br

4.3. Vamos fazer um Alô Mundo na Nuvem

4.3.1. IaaS - Infraestrutura

4.3.1.1. Alô Mundo de IaaS (Criar uma Máquina Virtual)

4.3.1.1.1. Recurso

4.3.1.1.2. Grupo de Recursos

4.3.2. PaaS - Plataforma

4.3.2.1. Alô Mundo de Paas (Criar um recurso: SGBD - MySQL e ou outros)

4.3.2.1.1. Grupo de Recursos de Banco de Dados

4.3.3. SaaS - Software

4.3.3.1. Alô Mundo de SaaS (Usar um recurso do Office 365)

4.4. Laboratório de Machine Learning (ML)

4.4.1. Dataset - Bike

5. Microsoft Azure

5.1. Datacenters

5.1.1. https://datacenters.microsoft.com/globe/explore

5.2. tags

5.2.1. grupo de recursos

5.2.1.1. recurso

5.3. Laboratórios

5.3.1. Criar uma máquina virtual

5.3.1.1. Laboratório 01

5.3.1.1.1. https://www.youtube.com/watch?v=hzCw_NzmxQU&lc=UgwzbtBIm5C-aFJVPfd4AaABAg

5.4. Explorar o Azure AI Studio

5.4.1. Terminologia de estatística

5.4.1.1. estimar (baseia-se em dados históricos para tomada de decisão)

5.4.1.2. prever (baseia-se em dados do futuro para tomada de decisão)

5.4.1.3. população (conjunto de índividuos ou objetos que apresentam pelo menos uma caracterísitica em comum)

5.4.1.4. amostra (a amostragem requer menos recursos , pois a população inteira requer um esforço maior)

5.4.2. Terminologia de Aprendizado de Máquina

5.4.2.1. Deve-se respeitar as etapas de um projeto de aprendizado de máquina

5.4.2.1.1. Definição do problema

5.4.2.1.2. Preparação dos Dados

5.4.2.1.3. Extração e Carga dos Dados

5.4.2.1.4. Exploração e visualização dos dados

5.4.2.1.5. Variáveis

5.4.2.1.6. Transformação dos dados

5.4.2.1.7. Escolha do Algoritmo

5.4.2.1.8. Visualização e Interpretação

5.4.3. Notebook na Nuvem (Azure Notebooks)

5.4.3.1. Para um cientista de dados, um notebook refere-se a um ambiente de trabalho interativo que permite criar e compartilhar documentos que contêm código, texto, equações, visualizações e outros conteúdos. É uma ferramenta essencial para a análise de dados, pois facilita a execução de código em blocos separados, a visualização de resultados em tempo real e a documentação do processo de análise para referência futura ou colaboração1. Notebooks populares incluem o Jupyter Notebook, que suporta várias linguagens de programação como Python, R e Julia, e plataformas como o Google Colab, que oferece um ambiente de notebook em nuvem com recursos de computação gratuitos e colaboração em tempo real1.

5.4.4. Laboratórios Microsoft

5.4.4.1. Laboratório 01 - Alugueis de Bicicletas

5.4.4.1.1. O que é inteligência artificial

5.4.4.1.2. Cargas de Trabalho

5.4.4.1.3. AI Responsável

5.4.4.1.4. Princípios básicos de aprendizado de máquina

5.4.5. Azure

5.4.5.1. provisionar

6. Filmes

6.1. O homem que virou o jogo!

6.2. O dilema das redes