Bioinfo Brasil

Mapeando bioinformatas brasileiros na Wikidata

View project on GitHub

Adicionando cientistas ao sistema Wikidata/Scholia

(Se já conhecer o Wikidata e o Scholia, pule direto para o Passo 1)

Antes de tudo, por que adicionar alguém ao Wikidata/Scholia?

O Wikidata é a base de conhecimento da Wikimedia, a fundação que gere a Wikipédia. No Wikidata, o conhecimento enciclopédico está organizado em uma estrutura de hiperlinks que permite acesso tanto visual quanto computacional a esse conhecimento.

Na prática, o Wikidata torna fácil para pesquisadores e desenvolvedores usarem as informações que estão lá. Não vou entrar em detalhes técnicos, mas é muito mais fácil que lidar com tabelas, ou sistemas como o Lattes e o ORCID.

O Scholia é um projeto que visa mapear e toda a pesquisa biomédica usando o Wikidata. Uma série de scripts automáticos puxam metadados de artigos pa partir do PubMed e informações de autores a partir do ORCID. Esses bots rodam dia e noite, melhorando o alcance da plataforma.

Bebendo da estrutura do Wikidata, o Scholia gera visualizações automáticas,que compilam informações de diversas esferas, como:

Número de publicações por ano do [Helder Nakaya](https://scholia.toolforge.org/author/Q42614737)

Número de publicações por ano do Helder Nakaya

Artigos mais recentes publicados por pessoas do [Programa de pós em bioinformática da USP](https://scholia.toolforge.org/organization/Q102292035)

Artigos mais recentes publicados por pessoas do Programa de pós em bioinformática da USP

O desafio é que os scripts não conseguem puxar tudo. Muitos autores tem nomes parecido e informações como afiliação a programas de pós-graduação nem sempre são fáceis de achar.

Sendo assim, o sistema depende de nós todos para atingir seu potencial. Todo mundo pode editar o Wikidata, incluindo a página sobre mim ou a página sobre você. Pode parecer assustador, mas esse modelo “wikipédico” é o que permite o sistema Scholia/Wikidata lidar com a tsunami de informações que existe hoje. Quanto mais gente boa vendo, mais justo o sistema fica.

“Bacana, mas eu só quero fazer um troço desse pra minha orientadora”

A notícia boa é que dá pra fazer isso rapidinho.

Antes de tudo, uma regra: a Wikidata não é a casa da mãe joana. Existem certos critérios de notoriedade do Wikidata, e para a pesquisa, a regra é: se a pessoa for autor/autora de um artigo revisado por pares, pode entrar.

Passo 1: Criando uma conta

Passo a passo:

  • Entre em wikidata.org

  • Clique no canto superior direito em “Create account” ou “Criar uma conta”

  • Crie uma conta, é rápido e fácil

  • Agora que você criou uma conta, vai aparecer um monte de coisa introdutória. Pode ignorar tudo e ler depois se quiser, vamos direto ao ponto.

O Wikidata gira em torno de items. Um item no Wikidata pode ser um indivíduo real ou uma organização, ou coisas mais abstratas (como “mitocondria” ou “envelhecimento”). Todas as páginas da Wikipédia têm um item no Wikidata.

Se nosso objetivo é adicionar um pesquisador, o primeiro passo é ver se ele já está no Wikidata. Vá na caixinha de busca por Wikidata e busque pelo nome da pessoa. Por exemplo, para ver se já há um item para o Helder Nakaya, eu procuraria “Helder Nakaya”, “Helder Imoto Takashi Nakaya” e “Helder I Nakaya” antes de criar um novo item.

Obs: Aperte um enter para fazer uma busca com mais profundidade.

achou

achou

  • Se achar um item para sua pessoa de interesse, pode pular o passo 2 e ir direto para o passo 3. Se não achar, sem problemas, vamos adicionar no passo 2.

Passo 2: Adicionando um novo item ao Wikidata

Para criar um novo item, vá na barra lateral esquerda (abaixo do símbolo do Wikidata) e clique em “criar um novo item” ou “create a new item”.

Mude o idioma para ingles, adicione algumas informaçõe básicas e clique em “Criar”. Aqui um exemplo real, criando o item para a Jaqueline Wang, uma colega que fez o mestrado no programa de Bioinformática da USP:

Ela ganhou um identificador Q, que aparece ao lado do nome e da URL: https://www.wikidata.org/wiki/Q106212027

Passo 3: Adicionando informações básicas ao item

No Wikidata, as informações são armazenadas por meio de declarações. São como campos em um formulário que falam algumas coisas sobre esse item.

O item criado agora ainda não tem nenhuma informação ligada. Caso seja um item pré existente, ele vai ter algumas conexões listadas abaixo do cabeçalho de Declarações.

  • De qualquer forma, no fim dessa lista, há um botão escrito “+ adicionar declaração”/ “+add statement”. Clique nele:

(pode ser + add statement)

(pode ser + add statement)

O botão abre um formulário genérico para inserir as informações. A primeira informação é que a Jaque é um ser humano. Para isso, começamos a digitar “instancia de” na sessão de propriedades e selecionamos a propriedade “instancia de”. Agora fazemos o mesmo no campo de valores, na direita, digitamos “humano” e selecionamos o item “ser humano”.

Ao clicar em “publicar”, a declaração é publicada automaticamente no Wikidata, e está disponível em todas as línguas ao mesmo tempo! Esse é um dos benefícios dessa estrutura do Wikidata em comparação com formulários de texto:

Vamos adicionar outras informações agora:

  • sexo ou genero (sex or gender): feminino

  • ocupação (occupation): pesquisador(a)

  • afiliação (affiliation): Instituto de Biociências da Universidade de São Paulo

Contudo, colocar só uma declaração é um pouco frágil: como sabemos que uma declaração é verdadeira? Como verificar isso?

O Wikidata auxilia nessa tarefa permitindo a inserção de referências a cada uma das declarações feitas no site. Basta clicar no botão de adicionar referência, e um novo subformulário vai aparecer:

Nele podemos adicionar uma referência.

Exatamente o que significa ser “afiliado” a alguma coisa é um tanto quanto subjetivo. No Wikidata, é um termo bem amplo não significa que alguém é professor, ou tem um vínculo empregatício, um contrato, ou algo do tipo: qualquer coisa que alguém puder considerar uma afiliação, está valendo. Por isso é ainda mais importante ter uma referência.

Se tiver mais de uma afiliação, dá pra adicionar clicando em “+ add value”.

Para completar o básico desse item, vou adicionar mais 2 coisas:

  • campo de trabalho (field of work): bioinformática

  • número na Plataforma Lattes (Lattes ID): 4694329724121206

Vamos ignorar esse ponto de exclamação por enquanto (detalhes técnicos) e seguir adiante. Dá para adicionar muitas outras informações: ORCID, ID do Google Scholar, ID do Publons e por aí vai. Mas para termos a visualização bonita do Scholia, precisamos conectar os artigos com a pessoa. Para isso, no passo 4, usaremos mais uma ferramenta, o Author Disambiguator.

Passo 4: Ligando artigos ao seus autores

O Author Disambiguator é uma ferramentinha inteligente que ajuda a trocar as autorias que estão na forma de texto bruto para a forma de links que o Scholia consegue usar.

  • A estrutura de organização dessas informações fica mais clara com um exemplo de artigo:

Nele temos dois autores que já foram desambiguados: Helder Nakaya e Mayana Zatz. Há mais 14 autores nesse artigo, mas nem o script (nem ninguém) ligou com items específicos:

Entre eles está a Jaqueline Wang, que acabamos de adicionar ao Wikidata. Poderíamos corrigir na mão, mas isso ficaria rapidamente entediante e é bem passível de erros. Por sorte, o “Author Disambiguator” faz todo o trabalho duro para a gente, bastando escolhermos visualmente quais artigos são de um certo autor.

  • Na página do Author Disambiguator, a primeira coisa a fazer é o login de novo na conta Wikimedia (que criamos no passo 1).

só clicar em Permitir

só clicar em Permitir

Agora vou buscar por “Jaqueline Wang”, clicar em “Look for author” e ver o que aparece. É comum o sistema demorar *bastante *nas primeiras vezes (aproveite para ajeitar a coluna ou pegar uma água).

O Author Disambiguator vai agrupar os artigos de forma automática e arbitrária baseado nos temas e coautorias. No caso, a busca de agora retornou apenas 1 resultado. Para cada artigo, posso marcar os autores que realmente são a pessoa que eu quero adicionar (e não pessoas com nomes parecidos).

Tem uma caixa embaixo de cada grupo escrito “Check all” e “Uncheck all”, que permite marcar vários artigos de uma vez, para facilitar:

Após ter selecionado todos os artigos do autor de interesse, basta selecionar esse autor na lista de nomes e clicar em “Link selected works to author”. Caso o autor não apareça, dá para adicionar o identificador Q manualmente.

O sistema vai agora trabalhar para você e fazer todas as alterações em batelada:

Se der uns erros, é normal. Dá para tentar rodar de novo e geralmente funcionad da segunda vez.

Para exemplificar (não precisa fazer isso) vou ao artigo no Wikidata. Se quiser, escolha um artigo que você conectou o autor e veja por lá. Veja aqui que o artigo está ajustado:

Em paralelo, fiz o mesmo para os artigos que estavam descritos como “Jaqueline Yu Ting Wang”, exatamente do mesmo jeito.

Agora o Scholia já puxa essas informações e gera visualizações ricas, como a rede de coautorias e o mapa de coautores:

Mapa dos coautores da [Jaqueline Wang](https://scholia.toolforge.org/author/Q106212027)

Mapa dos coautores da Jaqueline Wang

Rede dos coautores da [Jaqueline Wang](https://scholia.toolforge.org/author/Q106212027)

Rede dos coautores da Jaqueline Wang

Passo 5: Aproveite os dados ligados

Pronto, já fizemos tudo necessário para conectar uma pesquisadora nova ao sistema Scholia/Wikidata. Caso você tenha feito por aí também, parabéns e bem vinda/o ao Wikidata!

Agora você pode conhecer mais sobre a pessoa que você colocou lá no Wikidata, seus colaboradores e tudo mais. Se essa pessoa for você, melhor ainda! Eu descobri coisas sobre minhas coautorias que eu mesmo não sabia.

Com o crescimento da rede interconectada, vários projetos de pesquisa são possíveis: como a rede de pesquisadores mudou ao longo do tempo? Quais áreas do mundo colaboram mais com uma dada instituição? Conseguimos puxar e analisar todas as informações lá, do mesmo jeito que o Scholia faz.

Gostou? Quer contribuir ou saber mais sobre o projeto? Temos um grupo público em https://t.me/scholiabrasil para dúvidas e ideias de como avançar o projeto, e adoraríamos ver você por lá!