
1. Tipos de Algoritmos de Aprendizado de Máquina
1.1. Aprendizado Supervisionado
1.1.1. O modelo aprende a executar uma dada tarefa a partir de exemplos rotulados
1.1.2. Algoritmos que aprendem uma função de mapeamento de variáveis de entrada (x) para a saída (Y)
1.1.2.1. Y = f(X)
1.1.3. Objetivo
1.1.3.1. Aproximar a função de mapeamento tão bem que, quando você tem novos dados de entrada (x), é possível prever as variáveis de saída (Y)
1.1.4. O conjunto de dados de treinamento possui rótulos com as respostas certas
1.1.5. Interativamente, o algoritmo faz previsões e aprimora sua função até atingir um nível aceitável de acerto
1.1.6. Exemplos de Algoritmos
1.1.6.1. Regressão Linear
1.1.6.1.1. usar uma reta
1.1.6.1.2. a análise de regressão gera uma equação para descrever a relação estatística entre uma ou mais variáveis preditoras e a variável resposta.
1.1.6.1.3. Assume que a relação entre a variável y e as features x (ou regressores) é linear + um erro
1.1.6.1.4. Problemas de Regressão são problemas de previsão de dados.
1.1.6.1.5. Avaliando o Modelo de Regressão Linear
1.1.6.2. Decision Tree
1.1.6.2.1. Modelo de árvore
1.1.6.2.2. Árvores de Decisão
1.1.6.2.3. “As possíveis soluções para um determinado problema emergem como as folhas de uma árvore, cada nó representando um ponto de deliberação e decisão.”
1.1.6.2.4. Termos comuns
1.1.6.2.5. se encaixa facilmente em uma estrutura programática.
1.1.6.2.6. adequados para problemas de categorização em que atributos ou recursos são sistematicamente verificados para determinar uma categoria final.
1.1.6.2.7. tipos de árvore de decisão
1.1.6.2.8. Vantagens
1.1.6.2.9. Desvantagens
1.1.6.2.10. Árvores de regressão vs árvores de classificação
1.1.6.3. Random Forest
1.1.6.3.1. é um algoritmo de aprendizagem de máquina flexível e fácil de usar que produz excelentes resultados a maioria das vezes, mesmo sem ajuste de hiperparâmetros.
1.1.6.3.2. é uma ferramenta de modelagem preditiva e não descritiva.
1.1.6.4. Gradiente Boosting Machines
1.1.6.4.1. Quando tentamos prever a variável de destino usando qualquer técnica de aprendizado de máquina, as principais causas de diferença nos valores reais e previstos são ruído, variação e tendência .
1.1.6.4.2. reduzir esses fatores (exceto ruído, que é um erro irredutível)
1.1.6.4.3. técnicas de montagem
1.1.6.4.4. Algoritmo de aumento de gradiente
1.1.6.5. Support Vector Machines (SVM)
1.1.6.5.1. Produz uma precisão significativa com menos poder de computação.
1.1.6.5.2. pode ser usado para tarefas de regressão e classificação
1.1.6.5.3. O objetivo do algoritmo de máquina de vetores de suporte é encontrar um hiperplano em um espaço N-dimensional (N - o número de feições) que distintamente classifica os pontos de dados.
1.1.6.5.4. Hiperplanes e vetores de suporte
1.1.6.5.5. No algoritmo SVM, procuramos maximizar a margem entre os pontos de dados e o hiperplano.
1.1.6.5.6. Quando há um erro de classificação, ou seja, nosso modelo comete um erro na previsão da classe do nosso ponto de dados, incluímos a perda juntamente com o parâmetro de regularização para executar a atualização do gradiente.
1.2. Aprendizado Não Supervisionado
1.2.1. O algoritmo utiliza dados não rotulados para aprender suas características a partir de padrões semelhantes
1.2.2. Tarefa que envolve a inferência de uma função para descrever uma estrutura escondida ou “não rotulada”
1.2.3. Clássica definição de clustering
1.2.4. Visualização de Dados
1.2.4.1. Encontrar padrões visuais em uma coleção contendo 1.000 observações e 500 características diferentes
1.2.5. Agrupar dados
1.2.5.1. Reconhecimento automático de grupos com características semelhantes
1.2.6. Pré-processamento
1.2.6.1. Como encontrar características relevantes sobre o dado para melhorar a classificação/regressão?
1.2.7. Detecção de Anomalias
1.2.7.1. Reconhecimento automático de valores que destoam dos dados.
1.2.7.1.1. Outliers
1.3. Aprendizado Semi-Supervisionado
1.3.1. Utiliza dados rotulados e não rotulados
1.4. Aprendizado por Reforço
1.4.1. O modelo aprende executando ações e avaliando recompensas
1.5. Aprendizado Ativo
1.5.1. Algoritmo “pergunta” os rótulos de instâncias desejadas durante o aprendizado
2. Classes de Algoritmos
2.1. Classificação
2.1.1. Trata-se do problema de identificar a qual categoria (sub-população) pertence uma dada amostra do problema
2.2. Regressão
2.2.1. Identificar, em uma escala contínua (não discreta), a qual categoria pertence uma dada amostra do problema