Mineração de Repositórios Open-Source no GitHub para Identificar o Uso de IA

Começar. É Gratuito
ou inscrever-se com seu endereço de e-mail
Mineração de Repositórios Open-Source no GitHub para Identificar o Uso de IA por Mind Map: Mineração de Repositórios  Open-Source no GitHub para  Identificar o Uso de IA

1. Metodologias de Mineração

1.1. Coleta de Dados

1.1.1. APIs

1.1.1.1. GitHub REST APIs - "What Do Users Ask in Open-Source AI Repositories?" (Artigo 4)

1.1.1.2. Coleta de issues, PRs e commits - "The State of the ML-universe" (Artigo 13)

1.1.2. Datasets Específicos

1.1.2.1. DevGPT - "Quality Assessment of ChatGPT Generated Code" (Artigo 12)

1.1.2.2. AOJ - "Big Coding Data" (Artigo 5)

1.1.2.3. LeetCode - "An Empirical Evaluation of GitHub Copilot’s Code Suggestions" (Artigo 11)

1.1.3. Web Scraping

1.1.3.1. Sina Weibo e CNKI - "How Generative AI Was Mentioned" (Artigo 7)

1.2. Análise Qualitativa

1.2.1. Open Coding

1.2.1.1. Taxonomia de issues - "What Do Users Ask in Open-Source AI Repositories?" (Artigo 4)

1.2.1.2. Taxonomia de prompts - "How Do Software Developers Use ChatGPT?" (Artigo 14)

1.2.2. Análise Temática

1.2.2.1. Comparação social/acadêmica - "How Generative AI Was Mentioned" (Artigo 7)

1.3. Análise Quantitativa

1.3.1. Estatísticas de Uso

1.3.1.1. Percentual de código integrado - "Analyzing Developer Use of ChatGPT Generated Code" (Artigo 6)

1.3.1.2. Métricas de PRs - "How Do Software Developers Use ChatGPT?" (Artigo 14)

1.3.2. Métricas de Qualidade

1.3.2.1. Complexidade - "An Empirical Evaluation of GitHub Copilot’s Code Suggestions" (Artigo 11)

1.3.2.2. Erros e segurança - "AI Writes, We Analyze" (Artigo 10)

2. Ferramentas de IA

2.1. ChatGPT

2.1.1. Uso em PRs - "How Do Software Developers Use ChatGPT?" (Artigo 14)

2.1.2. Geração de código - "Analyzing Developer Use of ChatGPT Generated Code" (Artigo 6)

2.1.3. Qualidade e segurança - "AI Writes, We Analyze" (Artigo 10)

2.1.4. Integração em desenvolvimento - "Accelerating Software Development with AI" (Artigo 9)

2.1.5. Qualidade em repositórios - "Quality Assessment of ChatGPT Generated Code" (Artigo 12)

2.2. GitHub Copilot

2.2.1. Avaliação de sugestões - "An Empirical Evaluation of GitHub Copilot’s Code Suggestions" (Artigo 11)

2.2.2. Impacto na produtividade - "Accelerating Software Development with AI" (Artigo 9)

2.3. Outras Ferramentas

2.3.1. Codex - "The Potential of Artificial Intelligence" (Artigo 2)

2.3.2. TensorFlow e frameworks - "The State of the ML-universe" (Artigo 13)

3. Aplicações e Insights

3.1. Educação

3.1.1. Detecção de plágio - "Whodunit" (Artigo 8 )

3.1.2. Implicações pedagógicas - "Assessing AI Detectors in Identifying AI-Generated Code" (Artigo 15)

3.1.3. Plataformas de aprendizado - "Big Coding Data" (Artigo 5)

3.2. Produtividade

3.2.1. Aumento de eficiência - "The Potential of Artificial Intelligence" (Artigo 2)

3.2.2. Aceleração do desenvolvimento - "Accelerating Software Development with AI" (Artigo 9)

3.2.3. Ferramentas de suporte - "An Empirical Evaluation of GitHub Copilot’s Code Suggestions" (Artigo 11)

3.3. Tendências

3.3.1. Boom de IA/ML - "The State of the ML-universe" (Artigo 13)

3.3.2. Percepções sociais/acadêmicas - "How Generative AI Was Mentioned" (Artigo 7)

4. Identificação de IA

4.1. Stylometry

4.1.1. Classificação humano vs. GPT-4 - "Whodunit" (Artigo 8 )

4.2. Detecção de Prompts

4.2.1. Links de ChatGPT em PRs - "How Do Software Developers Use ChatGPT?" (Artigo 14)

4.2.2. Variantes de prompts - "Assessing AI Detectors in Identifying AI-Generated Code" (Artigo 15)

4.3. Modelos de Linguagem

4.3.1. Vocabulário aberto - "Open-Vocabulary Models for Source Code" (Artigo 3)

4.3.2. Classificadores ML (XGBoost) - "Whodunit" (Artigo 8 )

4.4. Detectores de AIGC

4.4.1. Avaliação de desempenho - "Assessing AI Detectors in Identifying AI-Generated Code" (Artigo 15)

5. Desafios e Problemas

5.1. Qualidade do Código

5.1.1. Variáveis indefinidas - "Quality Assessment of ChatGPT Generated Code" (Artigo 12)

5.1.2. Código ineficiente - "AI Writes, We Analyze" (Artigo 10)

5.1.3. Documentação insuficiente - "What Do Users Ask in Open-Source AI Repositories?" (Artigo 4)

5.2. Segurança

5.2.1. Vulnerabilidades - "Quality Assessment of ChatGPT Generated Code" (Artigo 12)

5.2.2. Credenciais hardcoded - "AI Writes, We Analyze" (Artigo 10)

5.3. Escalabilidade

5.3.1. Vocabulário grande - "Open-Vocabulary Models for Source Code" (Artigo 3)

5.4. Generalização

5.4.1. Dados limitados - "On Software Engineering Repositories and Their Open Problems" (Artigo 1)