Aprendizado de Máquina

Começar. É Gratuito
ou inscrever-se com seu endereço de e-mail
Aprendizado de Máquina por Mind Map: Aprendizado de Máquina

1. Tipos de Algoritmos de Aprendizado de Máquina

1.1. Aprendizado Supervisionado

1.1.1. O modelo aprende a executar uma dada tarefa a partir de exemplos rotulados

1.1.2. Algoritmos que aprendem uma função de mapeamento de variáveis de entrada (x) para a saída (Y)

1.1.2.1. Y = f(X)

1.1.3. Objetivo

1.1.3.1. Aproximar a função de mapeamento tão bem que, quando você tem novos dados de entrada (x), é possível prever as variáveis de saída (Y)

1.1.4. O conjunto de dados de treinamento possui rótulos com as respostas certas

1.1.5. Interativamente, o algoritmo faz previsões e aprimora sua função até atingir um nível aceitável de acerto

1.1.6. Exemplos de Algoritmos

1.1.6.1. Regressão Linear

1.1.6.1.1. usar uma reta

1.1.6.1.2. a análise de regressão gera uma equação para descrever a relação estatística entre uma ou mais variáveis preditoras e a variável resposta.

1.1.6.1.3. Assume que a relação entre a variável y e as features x (ou regressores) é linear + um erro

1.1.6.1.4. Problemas de Regressão são problemas de previsão de dados.

1.1.6.1.5. Avaliando o Modelo de Regressão Linear

1.1.6.2. Decision Tree

1.1.6.2.1. Modelo de árvore

1.1.6.2.2. Árvores de Decisão

1.1.6.2.3. “As possíveis soluções para um determinado problema emergem como as folhas de uma árvore, cada nó representando um ponto de deliberação e decisão.”

1.1.6.2.4. Termos comuns

1.1.6.2.5. se encaixa facilmente em uma estrutura programática.

1.1.6.2.6. adequados para problemas de categorização em que atributos ou recursos são sistematicamente verificados para determinar uma categoria final.

1.1.6.2.7. tipos de árvore de decisão

1.1.6.2.8. Vantagens

1.1.6.2.9. Desvantagens

1.1.6.2.10. Árvores de regressão vs árvores de classificação

1.1.6.3. Random Forest

1.1.6.3.1. é um algoritmo de aprendizagem de máquina flexível e fácil de usar que produz excelentes resultados a maioria das vezes, mesmo sem ajuste de hiperparâmetros.

1.1.6.3.2. é uma ferramenta de modelagem preditiva e não descritiva.

1.1.6.4. Gradiente Boosting Machines

1.1.6.4.1. Quando tentamos prever a variável de destino usando qualquer técnica de aprendizado de máquina, as principais causas de diferença nos valores reais e previstos são ruído, variação e tendência .

1.1.6.4.2. reduzir esses fatores (exceto ruído, que é um erro irredutível)

1.1.6.4.3. técnicas de montagem

1.1.6.4.4. Algoritmo de aumento de gradiente

1.1.6.5. Support Vector Machines (SVM)

1.1.6.5.1. Produz uma precisão significativa com menos poder de computação.

1.1.6.5.2. pode ser usado para tarefas de regressão e classificação

1.1.6.5.3. O objetivo do algoritmo de máquina de vetores de suporte é encontrar um hiperplano em um espaço N-dimensional (N - o número de feições) que distintamente classifica os pontos de dados.

1.1.6.5.4. Hiperplanes e vetores de suporte

1.1.6.5.5. No algoritmo SVM, procuramos maximizar a margem entre os pontos de dados e o hiperplano.

1.1.6.5.6. Quando há um erro de classificação, ou seja, nosso modelo comete um erro na previsão da classe do nosso ponto de dados, incluímos a perda juntamente com o parâmetro de regularização para executar a atualização do gradiente.

1.2. Aprendizado Não Supervisionado

1.2.1. O algoritmo utiliza dados não rotulados para aprender suas características a partir de padrões semelhantes

1.2.2. Tarefa que envolve a inferência de uma função para descrever uma estrutura escondida ou “não rotulada”

1.2.3. Clássica definição de clustering

1.2.4. Visualização de Dados

1.2.4.1. Encontrar padrões visuais em uma coleção contendo 1.000 observações e 500 características diferentes

1.2.5. Agrupar dados

1.2.5.1. Reconhecimento automático de grupos com características semelhantes

1.2.6. Pré-processamento

1.2.6.1. Como encontrar características relevantes sobre o dado para melhorar a classificação/regressão?

1.2.7. Detecção de Anomalias

1.2.7.1. Reconhecimento automático de valores que destoam dos dados.

1.2.7.1.1. Outliers

1.3. Aprendizado Semi-Supervisionado

1.3.1. Utiliza dados rotulados e não rotulados

1.4. Aprendizado por Reforço

1.4.1. O modelo aprende executando ações e avaliando recompensas

1.5. Aprendizado Ativo

1.5.1. Algoritmo “pergunta” os rótulos de instâncias desejadas durante o aprendizado

2. Classes de Algoritmos

2.1. Classificação

2.1.1. Trata-se do problema de identificar a qual categoria (sub-população) pertence uma dada amostra do problema

2.2. Regressão

2.2.1. Identificar, em uma escala contínua (não discreta), a qual categoria pertence uma dada amostra do problema

3. Baseline

3.1. Base de comparação para a eficácia de um algoritmo

4. Ruído

4.1. Dados indesejados presentes na coleção que podem gerar efeitos inesperados para o modelo

5. Generalização

5.1. É a habilidade do modelo de predizer corretamente instâncias ainda não vistas

6. Underfitting

6.1. Ocorre quando um modelo é muito simples e não consegue generalizar todas as características dos dados

7. Overfitting

7.1. Modelo excessivamente complexo para um dado conjunto de dados

7.2. Faz com que a entrada de treino seja memorizada ao invés de aprendida

8. Erro de treino (Erro empírico)

8.1. Erro do modelo nos dados de treino

9. Erro de teste (Erro de validação)

9.1. Erro do modelo nos dados de teste

10. Viés

10.1. é relacionado à habilidade do modelo de generalizar os dados, portanto, um viés alto é relacionado ao underfitting

11. Variância

11.1. Como o modelo reage a novas entradas de treino

11.2. Modelos com alta variância podem mudar suas predições em resposta à nova composição da entrada de treino

11.3. Alta variância é relacionada ao overfitting