Integração de bases de dados nacionais acadêmicas na Europa

Por Ernesto Spinak

Introdução

Imagem: Shane Rounce.

A necessidade de uma infraestrutura abrangente para publicações acadêmicas está na agenda da União Europeia (UE) há muito tempo. Em particular, a política de ciência aberta da Comissão Europeia destaca a necessidade de uma boa base de dados para monitorizar as publicações em acesso aberto na Europa. Esta necessidade é a base do informe “Integration of national publication databases“1 que comentamos.

Para poder avaliar as atividades de pesquisa, qualidade e desenvolvimento da ciência aberta, é necessário ter uma infraestrutura completa de publicações acadêmicas das nações envolvidas. Esta questão tem estado na agenda de vários documentos de política da UE reiteradamente.

O apelo ao acesso aberto total nos estados membros da UE em particular, e de modo geral promovido pela Unesco, além da iniciativa do Plano S, destacam a necessidade de ter informação completa e comparável para monitorar o desenvolvimento das publicações em acesso aberto na Europa.

No entanto, ainda falta uma infraestrutura de informação abrangente sobre publicações de pesquisa. Uma comparação dos principais motores de busca acadêmica e bases de dados bibliográficas mais comumente utilizados chegou à conclusão de que o Google Acadêmico, com 389 milhões de registros, é atualmente o motor de busca acadêmico mais abrangente.

Os coletores de agregação, como Google Acadêmico e Microsoft Academic, usam algoritmos bem desenvolvidos para coletar de forma inclusiva todas as fontes disponíveis. Eles têm ampla cobertura e, ademais, incluem amplamente livros e publicações nacionais.

Uma pesquisa recente descobriu que 20 países europeus têm uma base de dados nacional para resultados de pesquisas. Muitas destas bases de dados cobrem todas as áreas da ciência. Um ponto forte particular das bases de dados nacionais reside na sua integridade e alto nível de garantia de qualidade, visto que muitas vezes tem caráter obrigatório.

Figura 1. Google Acadêmico, Microsoft Academic, Scopus, Dimensions, Web of Science e COCI de OpenCitations: uma comparação multidisciplinar da cobertura por meio de citações. Como pode ver, o Google Acadêmico cobre 88% de todo o conjunto agregado, enquanto o concorrente mais próximo, Microsoft Academic, cobre apenas 60%. Fonte: MARTÍN-MARTÍN, A., et al.2

Rumo a uma infraestrutura europeia de publicação de informação

A pesquisa em bases de dados nacionais indica que o principal desafio para a interoperabilidade da informação de publicação entre países é a variedade de modelos de dados, vocabulários e classificações, bem como os procedimentos de coleta e validação dos dados. As bases de dados de publicações nacionais são as fontes de dados mais abrangentes para publicações acadêmicas em nível nacional. Nas comparações entre países, no entanto, elas são subutilizadas. Sua integração proporcionaria uma base de informação completa e bem estruturada de publicações académicas europeias e um grande potencial para a avaliação da pesquisa a nível europeu.

O que ocorre na América Latina

Na América Latina, temos três grandes repositórios multinacionais de periódicos, a maioria deles em acesso aberto, o que torna este problema mais administrável.

Estes repositórios são

SciELO – Compreende mais de 1.200 periódicos ativos, de acesso aberto e com texto completo de 17 países. Possui mais de 900.000 artigos. O SciELO Livros, ademais, disponibiliza 1.300 livros.
Redalyc – 26 países participam, tem mais de 700.000 artigos.
Redib (Rede Ibero-americana de Inovação e Conhecimento Científico) – 37 países, 3.564 periódicos, mais de 1.280.000 documentos

É fato que há uma duplicação de fontes (sobreposição) em grande medida, mas também é verdade que a maioria dos trabalhos acadêmicos de valor estão registrados em uma destas fontes.

Minha reflexão

A situação parece que seria mais simples de organizar nesta região do mundo, pois a maioria das publicações acadêmicas são de Acesso Aberto, e são canalizadas por meio de dois ou três grandes repositórios de periódicos de qualidade controlada e utilizam um sistema compatível de registro de dados e metadados (JATS).

No entanto, a possibilidade de intercambio, comparação e avaliação ainda é limitada, pois estes sistemas não possuem interfaces que permitam a busca, recuperação e exportação de seus dados, da mesma forma que os sistemas comerciais ou não comerciais oferecem (Scopus, PubMed etc.) que permitem a exportação seletiva dos dados usando formatos padrão como .ris, .mrc, EndNote, ou qualquer outro disponível.

Este é um assunto pendente.

Notas

1. PUUSKA, H.-M., et al. Integration of national publication databases – towards a high-quality and comprehensive information base on scholarly publications in Europe. ITM Web of Conferences [online]. 2020, vol.33, 02001 [viewed 11 February 2020]. https://doi.org/10.1051/itmconf/20203302001. Available from: https://www.itm-conferences.org/articles/itmconf/abs/2020/03/itmconf_ictessh2020_02001/itmconf_ictessh2020_02001.html

2. MARTÍN-MARTÍN, A., et al. Google Scholar, Microsoft Academic, Scopus, Dimensions, Web of Science, and OpenCitations’ COCI: a multidisciplinary comparison of coverage via citations. Scientometrics [online]. 2021, vol. 126, pp. 871–906 [viewed 11 February 2020]. https://doi.org/10.1007/s11192-020-03690-4. Available from: https://link.springer.com/article/10.1007%2Fs11192-020-03690-4

Referências

MARTÍN-MARTÍN, A., et al. Google Scholar, Microsoft Academic, Scopus, Dimensions, Web of Science, and OpenCitations’ COCI: a multidisciplinary comparison of coverage via citations. Scientometrics [online]. 2021, vol. 126, pp. 871–906 [viewed 11 February 2020]. https://doi.org/10.1007/s11192-020-03690-4. Available from: https://link.springer.com/article/10.1007%2Fs11192-020-03690-4

PUUSKA, H.-M., et al. Integration of national publication databases – towards a high-quality and comprehensive information base on scholarly publications in Europe. ITM Web of Conferences [online]. 2020, vol.33, 02001 [viewed 11 February 2020]. https://doi.org/10.1051/itmconf/20203302001. Available from: https://www.itm-conferences.org/articles/itmconf/abs/2020/03/itmconf_ictessh2020_02001/itmconf_ictessh2020_02001.html

Un llamamiento conjunto en pro de la ciencia abierta [online]. UNESCO. 2020 [viewed 11 February 2021]. Available from: https://es.unesco.org/news/llamamiento-conjunto-pro-ciencia-abierta

Links externos

ANSI/NISO Z39.96-2019, JATS: Journal Article Tag Suite, version 1.2: https://www.niso.org/publications/z3996-2019-jats

Google Académico: https://scholar.google.com

Plan S and cOAlition S – Accelerating the transition to full and immediate Open Access to scientific publications: https://www.coalition-s.org/

Redalyc (Red de Revistas Científicas de América Latina, el Caribe, España y Portugal): https://www.redalyc.org

Redib (Red Iberoamericana de Innovación y Conocimiento Científico): https://www.redib.org

SciELO (Scientific Electronic Library Online): https://scielo.org

 

Sobre Ernesto Spinak

Colaborador do SciELO, engenheiro de Sistemas e licenciado em Biblioteconomia, com diploma de Estudos Avançados pela Universitat Oberta de Catalunya e Mestre em “Sociedad de la Información” pela Universidad Oberta de Catalunya, Barcelona – Espanha. Atualmente tem uma empresa de consultoria que atende a 14 instituições do governo e universidades do Uruguai com projetos de informação.

Traduzido do original em espanhol por Lilian Nassi-Calò.

Fonte: SciELO
Licença deste conteúdo: