1. Metodologias de Mineração
1.1. Coleta de Dados
1.1.1. APIs
1.1.1.1. GitHub REST APIs - "What Do Users Ask in Open-Source AI Repositories?" (Artigo 4)
1.1.1.2. Coleta de issues, PRs e commits - "The State of the ML-universe" (Artigo 13)
1.1.2. Datasets Específicos
1.1.2.1. DevGPT - "Quality Assessment of ChatGPT Generated Code" (Artigo 12)
1.1.2.2. AOJ - "Big Coding Data" (Artigo 5)
1.1.2.3. LeetCode - "An Empirical Evaluation of GitHub Copilot’s Code Suggestions" (Artigo 11)
1.1.3. Web Scraping
1.1.3.1. Sina Weibo e CNKI - "How Generative AI Was Mentioned" (Artigo 7)
1.2. Análise Qualitativa
1.2.1. Open Coding
1.2.1.1. Taxonomia de issues - "What Do Users Ask in Open-Source AI Repositories?" (Artigo 4)
1.2.1.2. Taxonomia de prompts - "How Do Software Developers Use ChatGPT?" (Artigo 14)
1.2.2. Análise Temática
1.2.2.1. Comparação social/acadêmica - "How Generative AI Was Mentioned" (Artigo 7)
1.3. Análise Quantitativa
1.3.1. Estatísticas de Uso
1.3.1.1. Percentual de código integrado - "Analyzing Developer Use of ChatGPT Generated Code" (Artigo 6)
1.3.1.2. Métricas de PRs - "How Do Software Developers Use ChatGPT?" (Artigo 14)
1.3.2. Métricas de Qualidade
1.3.2.1. Complexidade - "An Empirical Evaluation of GitHub Copilot’s Code Suggestions" (Artigo 11)
1.3.2.2. Erros e segurança - "AI Writes, We Analyze" (Artigo 10)
2. Ferramentas de IA
2.1. ChatGPT
2.1.1. Uso em PRs - "How Do Software Developers Use ChatGPT?" (Artigo 14)
2.1.2. Geração de código - "Analyzing Developer Use of ChatGPT Generated Code" (Artigo 6)
2.1.3. Qualidade e segurança - "AI Writes, We Analyze" (Artigo 10)
2.1.4. Integração em desenvolvimento - "Accelerating Software Development with AI" (Artigo 9)
2.1.5. Qualidade em repositórios - "Quality Assessment of ChatGPT Generated Code" (Artigo 12)
2.2. GitHub Copilot
2.2.1. Avaliação de sugestões - "An Empirical Evaluation of GitHub Copilot’s Code Suggestions" (Artigo 11)
2.2.2. Impacto na produtividade - "Accelerating Software Development with AI" (Artigo 9)
2.3. Outras Ferramentas
2.3.1. Codex - "The Potential of Artificial Intelligence" (Artigo 2)
2.3.2. TensorFlow e frameworks - "The State of the ML-universe" (Artigo 13)
3. Aplicações e Insights
3.1. Educação
3.1.1. Detecção de plágio - "Whodunit" (Artigo 8 )
3.1.2. Implicações pedagógicas - "Assessing AI Detectors in Identifying AI-Generated Code" (Artigo 15)
3.1.3. Plataformas de aprendizado - "Big Coding Data" (Artigo 5)
3.2. Produtividade
3.2.1. Aumento de eficiência - "The Potential of Artificial Intelligence" (Artigo 2)
3.2.2. Aceleração do desenvolvimento - "Accelerating Software Development with AI" (Artigo 9)
3.2.3. Ferramentas de suporte - "An Empirical Evaluation of GitHub Copilot’s Code Suggestions" (Artigo 11)
3.3. Tendências
3.3.1. Boom de IA/ML - "The State of the ML-universe" (Artigo 13)
3.3.2. Percepções sociais/acadêmicas - "How Generative AI Was Mentioned" (Artigo 7)
4. Identificação de IA
4.1. Stylometry
4.1.1. Classificação humano vs. GPT-4 - "Whodunit" (Artigo 8 )
4.2. Detecção de Prompts
4.2.1. Links de ChatGPT em PRs - "How Do Software Developers Use ChatGPT?" (Artigo 14)
4.2.2. Variantes de prompts - "Assessing AI Detectors in Identifying AI-Generated Code" (Artigo 15)
4.3. Modelos de Linguagem
4.3.1. Vocabulário aberto - "Open-Vocabulary Models for Source Code" (Artigo 3)
4.3.2. Classificadores ML (XGBoost) - "Whodunit" (Artigo 8 )
4.4. Detectores de AIGC
4.4.1. Avaliação de desempenho - "Assessing AI Detectors in Identifying AI-Generated Code" (Artigo 15)
5. Desafios e Problemas
5.1. Qualidade do Código
5.1.1. Variáveis indefinidas - "Quality Assessment of ChatGPT Generated Code" (Artigo 12)
5.1.2. Código ineficiente - "AI Writes, We Analyze" (Artigo 10)
5.1.3. Documentação insuficiente - "What Do Users Ask in Open-Source AI Repositories?" (Artigo 4)
5.2. Segurança
5.2.1. Vulnerabilidades - "Quality Assessment of ChatGPT Generated Code" (Artigo 12)
5.2.2. Credenciais hardcoded - "AI Writes, We Analyze" (Artigo 10)
5.3. Escalabilidade
5.3.1. Vocabulário grande - "Open-Vocabulary Models for Source Code" (Artigo 3)
5.4. Generalização
5.4.1. Dados limitados - "On Software Engineering Repositories and Their Open Problems" (Artigo 1)