Repositórios para dados localizáveis, acessíveis, interoperáveis e reutilizáveis (FAIR): adaptando um repositório de dados para se comportar como um FAIR Data Point

Autores

  • João Luiz Rebelo Moreira Universidade Federal de Minas Gerais (UFMG)
  • Luiz Bonino Universidade de Twente (Holanda)
  • Luís Ferreira Pires Universidade de Twente (Holanda) https://orcid.org/0000-0001-7432-7653
  • Marten van Sinderen Universidade de Twente (Holanda)
  • Patricia Henning Universidade Federal do Estado do Rio de Janeiro (UNIRIO)

Resumo

É necessário um esforço significativo para encontrar, entender e reutilizar dados da pesquisa. Para endereçar esse problema, os princípios de dados Localizáveis, Acessíveis, Reutilizáveis e Interoperáveis (FAIR em inglês) foram criados, e descrevem um conjunto mínimo de requisitos para gerenciamento e administração de dados, considerados a base tecnológica para a Nuvem Europeia de Ciência Aberta. O FAIR Data Point (FDP) utiliza dados ligados (LD) para expor dados e metadados aderentes aos princípios de dados FAIR, especificando um conjunto de metadados padronizados que um repositório de dados deve implementar. Os proprietários de dados podem expor conjuntos de dados e os usuários de dados podem reutilizar conjuntos de dados por meio de serviços RESTful, permitindo a interoperabilidade em escala na web. Os repositórios de dados e o software subjacente apenas recentemente começaram a oferecer suporte à LD, e seus metadados estão disponíveis apenas como pares de valores-chave. Uma questão em aberto neste contexto é como permitir que um software de repositório de dados existente seja compatível com a especificação do FDP, ou seja, como adicionar descrições semânticas aos repositórios de dados para garantir a interoperabilidade semântica entre dados de diferentes repositórios. Este artigo descreve uma solução não invasiva e não intrusiva de proxy semântico que permite que um software de repositório de dados, o serviço EUDAT B2share, se comporte como um FDP, permitindo a interoperabilidade semântica por meio de traduções semânticas. A solução inclui uma metodologia para o mapeamento de metadados com base em transformações endógenas de modelos léxicos para modelos semânticos. Mostramos como os metadados nos pares de valores-chave de um repositório de uso geral podem ser compatíveis com a tecnologia LD sem alterar o software do repositório. A validação da solução inclui testes funcionais das camadas de metadados do FDP e uma análise de desempenho do impacto do proxy semântico na troca de dados. Os resultados mostram que o B2share pode ser compatível com as especificações do FDP, tendo impacto reduzido no desempenho da troca de dados. Portanto, a validação mostra que a solução é viável e adequada para transformar um software de repositório de dados de uso geral em um FDP.

Palavras-chave: Dados FAIR.Reusabilidade de Dados.Software de Repositório de Dados.FAIR Data Point.

Link: http://revista.ibict.br/liinc/article/view/4817

Biografia do Autor

  • João Luiz Rebelo Moreira, Universidade Federal de Minas Gerais (UFMG)
    Doutor em Ciência da Computação pela Universidade de Twente (Holanda). Pesquisador de pós-doutorado em ciência da computação pelas universidades VU Amsterdam e Twente.
  • Luiz Bonino, Universidade de Twente (Holanda)
    Doutor em Ciência da Computação pela Universidade de Twente (Holanda). Diretor de tecnologia do escritório GO FAIR.
  • Luís Ferreira Pires , Universidade de Twente (Holanda)
    Doutor em Ciência da Computação pela Universidade de Twente (Holanda). Professor associado da Universidade de Twente.
  • Marten van Sinderen, Universidade de Twente (Holanda)
    Doutor em Ciência da Computação pela Universidade de Twente (Holanda). Professor associado da Universidade de Twente e chefe do grupo SCS.
  • Patricia Henning, Universidade Federal do Estado do Rio de Janeiro (UNIRIO)
    Doutora em Informação e Comunicação em Saúde pelo Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (ICICT / FIOCRUZ). Professora Associada da Universidade Federal do Estado do Rio de Janeiro (UNIRIO).

Publicado

2020-09-11

Edição

Seção

Resumos de artigos científicos

Como Citar

Repositórios para dados localizáveis, acessíveis, interoperáveis e reutilizáveis (FAIR): adaptando um repositório de dados para se comportar como um FAIR Data Point. (2020). Pesquisa Brasileira Em Ciência Da Informação E Biblioteconomia, 15(3). https://www.pbcib.com/pbcib/article/view/55059