Aprendizado de Máquina

Começar. É Gratuito
ou inscrever-se com seu endereço de e-mail
Rocket clouds
Aprendizado de Máquina por Mind Map: Aprendizado de Máquina

1. Baseline

1.1. Base de comparação para a eficácia de um algoritmo

2. Ruído

2.1. Dados indesejados presentes na coleção que podem gerar efeitos inesperados para o modelo

3. Generalização

3.1. É a habilidade do modelo de predizer corretamente instâncias ainda não vistas

4. Underfitting

4.1. Ocorre quando um modelo é muito simples e não consegue generalizar todas as características dos dados

5. Overfitting

5.1. Modelo excessivamente complexo para um dado conjunto de dados

5.2. Faz com que a entrada de treino seja memorizada ao invés de aprendida

6. Erro de treino (Erro empírico)

6.1. Erro do modelo nos dados de treino

7. Erro de teste (Erro de validação)

7.1. Erro do modelo nos dados de teste

8. Viés

8.1. é relacionado à habilidade do modelo de generalizar os dados, portanto, um viés alto é relacionado ao underfitting

9. Variância

9.1. Como o modelo reage a novas entradas de treino

9.2. Modelos com alta variância podem mudar suas predições em resposta à nova composição da entrada de treino

9.3. Alta variância é relacionada ao overfitting

10. Tipos de Algoritmos de Aprendizado de Máquina

10.1. Aprendizado Supervisionado

10.1.1. O modelo aprende a executar uma dada tarefa a partir de exemplos rotulados

10.1.2. Algoritmos que aprendem uma função de mapeamento de variáveis de entrada (x) para a saída (Y)

10.1.2.1. Y = f(X)

10.1.3. Objetivo

10.1.3.1. Aproximar a função de mapeamento tão bem que, quando você tem novos dados de entrada (x), é possível prever as variáveis de saída (Y)

10.1.4. O conjunto de dados de treinamento possui rótulos com as respostas certas

10.1.5. Interativamente, o algoritmo faz previsões e aprimora sua função até atingir um nível aceitável de acerto

10.1.6. Exemplos de Algoritmos

10.1.6.1. Regressão Linear

10.1.6.1.1. usar uma reta

10.1.6.1.2. a análise de regressão gera uma equação para descrever a relação estatística entre uma ou mais variáveis preditoras e a variável resposta.

10.1.6.1.3. Assume que a relação entre a variável y e as features x (ou regressores) é linear + um erro

10.1.6.1.4. Problemas de Regressão são problemas de previsão de dados.

10.1.6.1.5. Avaliando o Modelo de Regressão Linear

10.1.6.2. Decision Tree

10.1.6.2.1. Modelo de árvore

10.1.6.2.2. Árvores de Decisão

10.1.6.2.3. “As possíveis soluções para um determinado problema emergem como as folhas de uma árvore, cada nó representando um ponto de deliberação e decisão.”

10.1.6.2.4. Termos comuns

10.1.6.2.5. se encaixa facilmente em uma estrutura programática.

10.1.6.2.6. adequados para problemas de categorização em que atributos ou recursos são sistematicamente verificados para determinar uma categoria final.

10.1.6.2.7. tipos de árvore de decisão

10.1.6.2.8. Vantagens

10.1.6.2.9. Desvantagens

10.1.6.2.10. Árvores de regressão vs árvores de classificação

10.1.6.3. Random Forest

10.1.6.3.1. é um algoritmo de aprendizagem de máquina flexível e fácil de usar que produz excelentes resultados a maioria das vezes, mesmo sem ajuste de hiperparâmetros.

10.1.6.3.2. é uma ferramenta de modelagem preditiva e não descritiva.

10.1.6.4. Gradiente Boosting Machines

10.1.6.4.1. Quando tentamos prever a variável de destino usando qualquer técnica de aprendizado de máquina, as principais causas de diferença nos valores reais e previstos são ruído, variação e tendência .

10.1.6.4.2. reduzir esses fatores (exceto ruído, que é um erro irredutível)

10.1.6.4.3. técnicas de montagem

10.1.6.4.4. Algoritmo de aumento de gradiente

10.1.6.5. Support Vector Machines (SVM)

10.1.6.5.1. Produz uma precisão significativa com menos poder de computação.

10.1.6.5.2. pode ser usado para tarefas de regressão e classificação

10.1.6.5.3. O objetivo do algoritmo de máquina de vetores de suporte é encontrar um hiperplano em um espaço N-dimensional (N - o número de feições) que distintamente classifica os pontos de dados.

10.1.6.5.4. Hiperplanes e vetores de suporte

10.1.6.5.5. No algoritmo SVM, procuramos maximizar a margem entre os pontos de dados e o hiperplano.

10.1.6.5.6. Quando há um erro de classificação, ou seja, nosso modelo comete um erro na previsão da classe do nosso ponto de dados, incluímos a perda juntamente com o parâmetro de regularização para executar a atualização do gradiente.

10.2. Aprendizado Não Supervisionado

10.2.1. O algoritmo utiliza dados não rotulados para aprender suas características a partir de padrões semelhantes

10.2.2. Tarefa que envolve a inferência de uma função para descrever uma estrutura escondida ou “não rotulada”

10.2.3. Clássica definição de clustering

10.2.4. Visualização de Dados

10.2.4.1. Encontrar padrões visuais em uma coleção contendo 1.000 observações e 500 características diferentes

10.2.5. Agrupar dados

10.2.5.1. Reconhecimento automático de grupos com características semelhantes

10.2.6. Pré-processamento

10.2.6.1. Como encontrar características relevantes sobre o dado para melhorar a classificação/regressão?

10.2.7. Detecção de Anomalias

10.2.7.1. Reconhecimento automático de valores que destoam dos dados.

10.2.7.1.1. Outliers

10.3. Aprendizado Semi-Supervisionado

10.3.1. Utiliza dados rotulados e não rotulados

10.4. Aprendizado por Reforço

10.4.1. O modelo aprende executando ações e avaliando recompensas

10.5. Aprendizado Ativo

10.5.1. Algoritmo “pergunta” os rótulos de instâncias desejadas durante o aprendizado

11. Classes de Algoritmos

11.1. Classificação

11.1.1. Trata-se do problema de identificar a qual categoria (sub-população) pertence uma dada amostra do problema

11.2. Regressão

11.2.1. Identificar, em uma escala contínua (não discreta), a qual categoria pertence uma dada amostra do problema