Começar. É Gratuito
ou inscrever-se com seu endereço de e-mail
DADOS ABERTOS por Mind Map: DADOS ABERTOS

1. Informações geradas por empresas e que estejam à disposição

1.1. São dados que podem ser livremente usados, reutilizados e redistribuídos por qualquer pessoa. Estão sujeitos, no máximo, à exigência de atribuição da fonte e compartilhamento pelas mesmas regras.

1.2. São dados públicos representados em meio digital, estruturados em formato aberto, processáveis por máquina, referenciados na internet e disponibilizados sob licença aberta que permita sua livre utilização, consumo ou cruzamento.

2. 3 premissas básicas

2.1. Estar indexado na web

2.1.1. google, por exemplo

2.2. Formato acessível (não proprietário)

2.2.1. xml, por exemplo

2.3. Sem impedimento legal para uso

2.4. Um dado para ser aberto deve NECESSARIAMENTE seguir três condições básicas, sendo elas: ser indexado por serviços web, ter formato não proprietário, ser facilmente passível de automação, assim como não possuir dispositivos legais que impeçam seu uso.

3. Princípios dos dados abertos

3.1. Dados completos

3.1.1. Não devem ser dados consolidados.

3.2. Dados primários

3.2.1. Dado direto da fonte

3.3. Dados atuais

3.3.1. Dados disponíveis o quão rapidamente seja necessário para preservar o seu valor.

3.4. Dados acessíveis por toda população

3.4.1. Disponíveis com o objetivo de aumentar a participação de grupos ativistas de dados cívicos.

3.5. Dados processados por máquinas

3.5.1. Devem estar razoavelmente estruturados para possibilitar o seu processamento automatizado.

3.6. Acesso aberto (não discriminatório)

3.6.1. Devem estar disponíveis para TODOS, sem que seja necessária identificação ou registro (porém com certos limites).

3.7. Dados em formatos legíveis (não proprietários)

3.8. Dados livres de licença

3.8.1. Sem copyright

4. 5 motivos para utilização dos dados (para o TCU)

4.1. Transparência

4.2. Controle social

4.3. Qualidade dos órgãos

4.4. Novos negócios

4.5. Cumprimento da lei

4.5.1. LAI (lei de Acesso à Informação)

5. Ciclo de vida dos dados

5.1. Coleta

5.1.1. Etapa de obtenção dos dados

5.2. Tratamento

5.2.1. Transformar os dados de acordo com as regras de negócio, para que possam ser analisadas pelos usuários responsáveis.

5.2.2. A etapa de tratamento buscará tratar, transformar, processar, limpar, padronizar e sanitizar os dados obtidos de diferentes fontes de acordo com o padrão de qualidade pré-definido.

5.3. Armazenamento

5.3.1. Essa etapa busca processar, transformar, inserir, modificar, carregar, migrar, transmitir ou qualquer ação semelhante que vise persistir os dados em um dispositivo.

5.4. Integração

5.4.1. A etapa de integração busca integrar dados de diferentes fontes em uma base de dados unificada.

5.5. Recuperação

5.5.1. Extrair a informação e tornar os dados disponíveis para acesso e uso.

5.6. Descarte

6. O Portal Brasileiro de Dados Abertos é o ponto central para a busca e o acesso aos dados públicos no Brasil.

6.1. Cada órgão é responsável pela catalogação e consolidação no portal dos dados dos órgãos que terão informações publicadas na internet.

6.2. Os dados devem ser estruturados em formato aberto, processáveis por máquinas, disponibilizados sob licença aberta, de modo que permita livre utilização, consumo ou cruzamento, limitando-se a creditar a autoria ou a fonte.

7. DADOS ESTRUTURADOS, NÃO ESTRUTURADOS E METADADOS

7.1. DADOS ESTRUTURADOS

7.1.1. Organizados, por exemplo, como tabela de banco de dados

7.1.2. Dados estão rígidos

7.1.3. Previamente progetizada

7.1.4. Dados Estruturados: possuem uma estrutura pré-definida, logo ela pode ser descrita de forma explícita (você bate o olho e identifica um padrão definido).

7.2. DADOS NÃO ESTRUTURADOS

7.2.1. Dados em mídias sociais (videos do youtube, áudios em whatsapp)

7.2.2. Não seguem uma estrutura rígida

7.2.3. São produzidos a todo momento

7.2.4. Difícil extração de informação

7.2.5. Dados não estruturados podem ser caracterizados por arquivos de diversos tipos (textos, imagens, vídeos, entre outros), cujas estruturas não são descritas implicitamente.

7.3. DADOS SEMIESTRUTURADOS

7.3.1. Estão em um arquivo, mas não de maneira solta

7.3.2. Um XML, por exemplo

7.4. METADADO

7.4.1. É um dado sobre determinado dado.

7.4.2. As informações de uma imagem, por exemplo, são metadados (dados sobre um dado)

7.4.3. Permite uma melhor utilização dos dados.

7.4.4. Informações que descrevem um determinado ativo.

7.4.5. CESPE 2013 - Os dados estruturados que descrevem e permitem encontrar, gerenciar, compreender e (ou) preservar documentos arquivísticos ao longo do tempo são conhecidos como metadados.

8. Processo ETL

8.1. O desafio nos ambientes de Data Warehouse é integrar, reorganizar e consolidar grandes volumes de dados de muitos sistemas, fornecendo assim uma nova base de informações unificada para análise de dados.

8.2. O processo de extrair dados de sistemas de origem e trazê-los para o Data Warehouse é comumente chamado de ETL (Extract, Transform e Load).

8.3. Ele é o processo mais crítico e demorado na construção de um Data Warehouse, uma vez que consiste na extração dos dados de fontes homogêneas ou heterogêneas; na transformação e limpeza destes dados; e na carga dos dados no DW.