IA ligada à explosão de trabalhos de pesquisa biomédica de baixa qualidade


Os dados de saúde de milhares de pessoas estão disponíveis ao público e prontos para se conectar aos sistemas de IA para análise.Crédito: BSIP/UIG via Getty
A literatura científica corre o risco de ser inundado com trabalhos que fazem reivindicações de saúde enganosas com base em dados disponíveis abertamente que são fáceis de processar usando ferramentas de inteligência artificial (AI), alertaram os pesquisadores.
Em um estudo publicado em PLoS Biology em 8 de maio1os cientistas analisaram mais de 300 artigos que usaram dados da Pesquisa Nacional de Exames de Saúde e Nutrição dos EUA (NHANES), um conjunto de dados abertos de registros de saúde. Todos os trabalhos pareciam seguir um modelo semelhante, associando uma variável – por exemplo, níveis de vitamina D ou qualidade do sono – com um distúrbio complexo, como depressão ou doença cardíaca, ignorando o fato de que essas condições têm muitos fatores que contribuem.
Scieuth Sleuths sinaliza centenas de papéis que usam IA sem divulgá -lo
“Temos uma explosão repentina nas taxas de publicação (de trabalhos) que são extremamente formulados que poderiam ter sido facilmente gerados por grandes modelos de idiomas”, diz o co-autor do estudo, Matt Spick, cientista biomédico da Universidade de Surrey em Guildford, Reino Unido.
Spick e seus colegas descobriram que as associações em muitos dos documentos não se sustentavam ao escrutínio estatístico e que alguns estudos pareciam ter dados escolhidos por cerejeira.
“Imagine que você está tentando passar em um exame que tenha uma taxa de aprovação específica e acrescenta quantas perguntas quiser. Você vê quais acertou e remove as que entendeu. É basicamente o que eles estão fazendo”, explica Charlie Harrison, biólogo computacional da Universidade Aberystwyth em Ceredigion, Reino Unido, que também trabalhou no estudo.
Ioana Alina Cristea, psicóloga clínica e meta-pesquisadora da Universidade de Pádua, Itália, concorda que os trabalhos “parecem estar escritos com uma receita”.
“Precisamos dessas avaliações sistemáticas para obter uma maneira de avaliar a extensão do problema”, diz ela.
Surto de estudos
O NHANES é uma pesquisa de longa duração que coleta dados de milhares de pessoas nos Estados Unidos sobre sua saúde, dieta e estilo de vida. O conjunto de dados está disponível ao público e pronto para conectar os sistemas de codificação ou IA para análise, o que levou a um aumento de estudos com base nos dados do NHANES nos últimos dois anos, diz Spick. Somente em 2024, foram publicados mais de 2.200 estudos de associação usando dados do NHANES e mais de 1.200 foram publicados até agora este ano, de acordo com o índice do PubMed de literatura biomédica.
Harrison, Spick e seus colegas se concentraram em uma amostra de 341 estudos publicados entre 2014 e 2024, baseados nos dados do NHANES. Os trabalhos apareceram em 147 periódicos produzidos por uma variedade de editores, incluindo a Frontiers Media, Elsevier e Springer Nature (NaturezaA equipe de notícias é editorialmente independente de seu editor).
Tudo bem para a IA escrever documentos de ciências? Natureza Pesquisa mostra que os pesquisadores estão divididos