Python para Análise de Dados

Lancez-Vous. C'est gratuit
ou s'inscrire avec votre adresse e-mail
Python para Análise de Dados par Mind Map: Python para Análise de Dados

1. 2 pontos importantes:

1.1. Devemos parar de usar o Excel?

1.1.1. Não, ele tem sua utilidade. Devemos saber quando usar um ou outro.

1.2. Curva de aprendizado no Python.

1.2.1. Apesar de ser menor que de muitas linguagens ela certamente é maior que o Excel, no entanto temos:

1.2.1.1. Tempo.

1.2.1.2. Grande oferta de material.

1.2.1.3. Comunidade prática para crescer junto e apoiar.

2. Por quê?

2.1. Por que uma Linguagem de Programação?

2.1.1. Ferramenta mais usada hoje: Excel

2.1.1.1. Limitação em quantidade de registros e capacidade de processamento.

2.1.1.2. Quanto mais complexa a planilha mais sujeita a erros e mais difícil será sua revisão.

2.1.1.3. Data Hackers: "Quanto maior a relevância e complexidade do que avaliamos, menos apropriado é o Excel."

2.1.2. Diferenciais de uma Linguagem de Programação:

2.1.2.1. Liberdade em desenvolvimento, as possibilidades são muito maiores.

2.1.2.2. Capacidade e tempo de processamento também.

2.1.2.3. Revisão do processo é mais simples.

2.1.2.4. Possibilidade de reproduzir exatamente o que foi feito por outra pessoa.

2.1.2.5. Reproducible Research: Apresentar não só resultados e conclusões, mas colocar todo o caminho traçado em evidência, diminuindo consideravelmente a possibilidade de erros e abrindo um canal de diálogo com outros interessados

2.2. Por que Python?

2.2.1. O que é Python?

2.2.1.1. Linguagem de Alto Nível criada nos anos 90.

2.2.1.2. Criada com o objetivo de otimizar a leitura de código e impulsionar a produtividade.

2.2.1.3. Orientada a Objetos.

2.2.1.4. Por usar o conceito de orientação a objetos possibilita criação de bibliotecas por outras pessoas.

2.2.2. Vantagens do Python:

2.2.2.1. Grande número de bibliotecas nativas e de terceiros.

2.2.2.2. Sintaxe simples e de fácil compreensão.

2.2.2.3. Curva de aprendizado mais baixa que de outras linguagens.

2.2.2.4. Gratuito.

2.2.2.5. Grande comunidade por trás da linguagem: constante evolução e grande oferta de material.

2.2.3. O que posso fazer com Python?

2.2.3.1. Análise de dados.

2.2.3.2. Apresentação de resultados.

2.2.3.3. ETL.

2.2.3.4. Automatização de processos.

2.2.3.5. Modelos matemáticos.

2.2.4. Bibliotecas mais usadas para análise de dados:

2.2.4.1. Pandas:

2.2.4.1.1. Análise e manipulação de dados.

2.2.4.1.2. Arquivos do tipo csv, xlsx, txt, etc.

2.2.4.2. Numpy:

2.2.4.2.1. Computação científica.

2.2.4.2.2. Álgebra linear: vetores e matrizes.

2.2.4.3. Matplotlib:

2.2.4.3.1. Visualização de dados.

2.2.4.3.2. Gráficos 2D.

2.2.4.4. Scikit Learn:

2.2.4.4.1. Aprendizado de máquina.

2.2.4.4.2. Pré-processamento de dados, seleção de variáveis, construção de modelos.

2.2.4.5. Tensor Flow:

2.2.4.5.1. Redes neurais artificiais.

2.2.5. Interfaces:

2.2.5.1. Visual Studio Code.

2.2.5.2. Jupyter Notebook.

3. Como?

3.1. Estudar:

3.1.1. Vídeo Aulas:

3.1.1.1. DSA - Python Fundamentos para Ciência de Dados.

3.1.1.2. Gustavo Guanabara - Python 3.

3.1.1.3. Udemy - Python para Finanças: Investimentos & Análise de Dados.

3.1.2. Livros:

3.1.2.1. Python Fluente: Programação Clara, Concisa e Eficaz

3.1.2.2. Python Para Análise de Dados: Tratamento de Dados com Pandas, Numpy e IPython

3.1.2.3. Mãos à Obra: Aprendizado de Máquina com Scikit-Learn & TensorFlow

3.1.3. Sites:

3.1.3.1. Medium.

3.1.3.2. Minerando Dados.

3.1.4. Canais:

3.1.4.1. Minerando Dados.

3.1.4.2. EstaTiDados

3.2. Praticar:

3.2.1. DataCamp.

3.2.2. Hackerank.

3.2.3. Kaggle.

3.2.4. Realizando alguma rotina em Python.

3.3. Consultar:

3.3.1. Documentação do Python/Biblioteca.

3.3.2. Stackoverflow.

3.3.3. Comunidade prática.