1. 2 pontos importantes:
1.1. Devemos parar de usar o Excel?
1.1.1. Não, ele tem sua utilidade. Devemos saber quando usar um ou outro.
1.2. Curva de aprendizado no Python.
1.2.1. Apesar de ser menor que de muitas linguagens ela certamente é maior que o Excel, no entanto temos:
1.2.1.1. Tempo.
1.2.1.2. Grande oferta de material.
1.2.1.3. Comunidade prática para crescer junto e apoiar.
2. Por quê?
2.1. Por que uma Linguagem de Programação?
2.1.1. Ferramenta mais usada hoje: Excel
2.1.1.1. Limitação em quantidade de registros e capacidade de processamento.
2.1.1.2. Quanto mais complexa a planilha mais sujeita a erros e mais difícil será sua revisão.
2.1.1.3. Data Hackers: "Quanto maior a relevância e complexidade do que avaliamos, menos apropriado é o Excel."
2.1.2. Diferenciais de uma Linguagem de Programação:
2.1.2.1. Liberdade em desenvolvimento, as possibilidades são muito maiores.
2.1.2.2. Capacidade e tempo de processamento também.
2.1.2.3. Revisão do processo é mais simples.
2.1.2.4. Possibilidade de reproduzir exatamente o que foi feito por outra pessoa.
2.1.2.5. Reproducible Research: Apresentar não só resultados e conclusões, mas colocar todo o caminho traçado em evidência, diminuindo consideravelmente a possibilidade de erros e abrindo um canal de diálogo com outros interessados
2.2. Por que Python?
2.2.1. O que é Python?
2.2.1.1. Linguagem de Alto Nível criada nos anos 90.
2.2.1.2. Criada com o objetivo de otimizar a leitura de código e impulsionar a produtividade.
2.2.1.3. Orientada a Objetos.
2.2.1.4. Por usar o conceito de orientação a objetos possibilita criação de bibliotecas por outras pessoas.
2.2.2. Vantagens do Python:
2.2.2.1. Grande número de bibliotecas nativas e de terceiros.
2.2.2.2. Sintaxe simples e de fácil compreensão.
2.2.2.3. Curva de aprendizado mais baixa que de outras linguagens.
2.2.2.4. Gratuito.
2.2.2.5. Grande comunidade por trás da linguagem: constante evolução e grande oferta de material.
2.2.3. O que posso fazer com Python?
2.2.3.1. Análise de dados.
2.2.3.2. Apresentação de resultados.
2.2.3.3. ETL.
2.2.3.4. Automatização de processos.
2.2.3.5. Modelos matemáticos.
2.2.4. Bibliotecas mais usadas para análise de dados:
2.2.4.1. Pandas:
2.2.4.1.1. Análise e manipulação de dados.
2.2.4.1.2. Arquivos do tipo csv, xlsx, txt, etc.
2.2.4.2. Numpy:
2.2.4.2.1. Computação científica.
2.2.4.2.2. Álgebra linear: vetores e matrizes.
2.2.4.3. Matplotlib:
2.2.4.3.1. Visualização de dados.
2.2.4.3.2. Gráficos 2D.
2.2.4.4. Scikit Learn:
2.2.4.4.1. Aprendizado de máquina.
2.2.4.4.2. Pré-processamento de dados, seleção de variáveis, construção de modelos.
2.2.4.5. Tensor Flow:
2.2.4.5.1. Redes neurais artificiais.
2.2.5. Interfaces:
2.2.5.1. Visual Studio Code.
2.2.5.2. Jupyter Notebook.
3. Como?
3.1. Estudar:
3.1.1. Vídeo Aulas:
3.1.1.1. DSA - Python Fundamentos para Ciência de Dados.
3.1.1.2. Gustavo Guanabara - Python 3.
3.1.1.3. Udemy - Python para Finanças: Investimentos & Análise de Dados.
3.1.2. Livros:
3.1.2.1. Python Fluente: Programação Clara, Concisa e Eficaz
3.1.2.2. Python Para Análise de Dados: Tratamento de Dados com Pandas, Numpy e IPython
3.1.2.3. Mãos à Obra: Aprendizado de Máquina com Scikit-Learn & TensorFlow
3.1.3. Sites:
3.1.3.1. Medium.
3.1.3.2. Minerando Dados.
3.1.4. Canais:
3.1.4.1. Minerando Dados.
3.1.4.2. EstaTiDados
3.2. Praticar:
3.2.1. DataCamp.
3.2.2. Hackerank.
3.2.3. Kaggle.
3.2.4. Realizando alguma rotina em Python.
3.3. Consultar:
3.3.1. Documentação do Python/Biblioteca.
3.3.2. Stackoverflow.
3.3.3. Comunidade prática.