Processo de aplicação de mineração de processos em dados governamentais abertos

Este mapa descreve as etapas metodológica para o desenvolvimento do processo para aplicação de ferramentas de mineração de processos em dados governamentasi abertos (DGA). Tal processo inclui métodos para análise comparativa dos resultados obtidos das ferramentas de mineração de processos, tanto quantitativas quanto qualitativas. Também ilustra um método para mapear objetivamente os atributos-chave.

Começar. É Gratuito
ou inscrever-se com seu endereço de e-mail
Processo de aplicação de mineração de processos em dados governamentais abertos por Mind Map: Processo de aplicação de mineração de processos em dados governamentais abertos

1. Etapa 1: Coleta

1.1. 4.2 Definindo o portal e a amostra

1.1.1. Mapeamento dos portais DGA

1.1.1.1. string de busca

1.1.2. Definição do portal escolhido

1.1.2.1. dados.gov

1.1.3. Definição da amostra

1.1.4. Coleta dos datasets

1.2. 4.3 Catalogando os dados obtidos

1.2.1. Organização dos datasets

1.2.1.1. (i) Conjunto de dados (ii) Órgão originador dos dados (iii) Link dos dados no portal dados.br (iv) Nome do arquivo (v) Categorização para o conjunto de dados obtido

1.2.2. Categorização

1.2.2.1. (i) Logs de eventos (ii) Tabela de dados com data (iii) Tabela de dados (lista) (iv) Documentos (v) Arquivo inexistente (vi) Arquivo inexistente - link externo

1.2.3. Classificação quanto a relevância

1.2.3.1. (i) Logs de eventos (ii) Tabela de dados com data

2. Etapa 2: Seleção

2.1. 4.4 Seleção preliminar dos datasets

2.1.1. Avaliação da relevância

2.1.1.1. Logs de eventos

2.1.1.1.1. Todos encontrados

2.1.1.2. Tabela de dados com data

2.1.1.2.1. (i) Tema (ii) Data de atualização (iii) Origem

2.1.2. Definição dos critérios de ranqueamento

2.1.2.1. Informativos (In)

2.1.2.1.1. (i) Quantidade de registros (ii) Quantidade de colunas (iii) Quantidade de colunas com datas

2.1.2.2. Importância (I)

2.1.2.2.1. (i) Parte dos 17 objetivos do desenvolvimento sustentável da ONU (ii) Políticas Públicas prioritárias do PPA

2.1.2.3. Dificuldade (D)

2.1.2.3.1. (i) Dificuldade pela quantidade de registros (ii) Dificuldade pela quantidade de colunas (iii) Dificuldade para identificar processos (iv) Registros com problemas perceptíveis (v) Necessidade de transformar o dado (colunas para linha)

2.1.2.4. Facilidade (F)

2.1.2.4.1. (i) Log de eventos (ii) Padronização nos dados

2.2. 4.5 Cálculo para normalização dos critérios

2.3. 5.1 Classificação final dos datasets

2.3.1. Seleção final dos datasets para testes nas ferramentas de mineração de processos

3. Etapa 3: Avaliação

3.1. 4.6 Definição das ferramentas e algoritmos utilizados

3.1.1. Definição de critérios para escolha

3.1.2. Delimitação no processo de descoberta (dados sem contexto)

3.2. 4.7 Definição do método para análise comparativa dos resultados (MC)

3.2.1. Padronizar o fluxo nas ferramentas

3.2.2. Análise padrão: quando baseada nos recursos visivelmente sugeridos ou disponíveis

3.2.3. Análise avançada: com uso aprofundado da ferramenta

3.3. 4.8 Definição do método para mapeamento dos datasets (MM)

3.3.1. Padronizar os passos desde a pergunta até a escolha dos atributos-chave

3.3.2. Transformar os dados quando necessário

3.3.3. Analisar os resultados

3.3.4. Reavaliar quando necessário

3.3.5. Observações

3.3.5.1. Etapa com impacto direto no resultado

3.3.5.2. Mapeamentos dependem do contexto e da pergunta ao dataset

3.4. 5.2 Mapeamento inicial

3.4.1. Aplicação do método para mapeamento, seção 4.8 (MM)

3.4.1.1. Teste 1 (258)

3.4.1.1.1. caseid

3.4.1.1.2. timestamp

3.4.1.1.3. activity

3.4.1.2. Teste 2 (137)

3.4.1.2.1. caseid

3.4.1.2.2. timestamp

3.4.1.2.3. activity

3.4.1.3. Teste 3 (356)

3.4.1.3.1. caseid

3.4.1.3.2. timestamp

3.4.1.3.3. activity

3.4.2. caseid

3.4.3. timestamp

3.4.4. activity

3.5. 5.3 Execução dos testes

3.5.1. Aplicação do método para análise comparativa, seção 4.7 (MC)

3.6. 5.4 Análise comparativa dos resultados

3.6.1. Análise comparativa conforme o conteúdo (acc)

3.6.1.1. Tempo de preparação e análise do dado em minutos (acc1)

3.6.1.2. Total de eventos (acc2)

3.6.1.3. Quantidade de casos (acc3)

3.6.1.4. Quantidade de atividades principais (acc4)

3.6.1.5. Ocorrência de loop (acc5)

3.6.1.6. Data de início do log (acc6)

3.6.1.7. Data de fim do log (acc7)

3.6.1.8. Maior tempo médio em dias (acc8)

3.6.1.9. Duração média dos casos em dias (acc9)

3.6.2. Análise comparativa conforme o uso (acu)

3.6.2.1. Tipo de análise (acu1)

3.6.2.1.1. Análise padrão, quando utilizado os recursos visivelmente sugeridos

3.6.2.1.2. Análise avançada, devido à necessidade do uso aprofundado da ferramenta

3.6.2.2. Tempo para carregamento dos dados em minutos (acu2)

3.6.2.3. Etapas para apresentação do grafico DFG ou correspondente (acu3)