|
五大數(shù)據(jù)庫 “灌水論文”激增 !多本知名國際期刊緊急暫停收稿!據(jù)Science報道的研究發(fā)現(xiàn):近 3 年來,大量低質(zhì)論文正在借公共數(shù)據(jù)庫和AI技術之便,涌入學術期刊,其中超過 90% 的論文由中國研究人員貢獻。 統(tǒng)計學家Matt Spick在擔任Scientific Reports副主編時發(fā)現(xiàn),大量利用美國國家健康與營養(yǎng)調(diào)查(NHANES)等公開數(shù)據(jù)的低質(zhì)論文,正在涌入評審流程。 這些論文模式高度雷同:選取某種健康問題、關聯(lián)的環(huán)境或生理因素,以及特定人群的已公開數(shù)據(jù),通過簡單替換變量生成所謂的“新發(fā)現(xiàn)”。 Nature也在近期的報道中指出,除了NHANES,其他生物醫(yī)學數(shù)據(jù)庫(UK Biobank、FAERS、GBD和FinnGen)也頻繁被這些低質(zhì)論文利用。 FAERS——FDA的不良事件報告系統(tǒng),這個我們藥物警戒(PV)人最熟悉的數(shù)據(jù)“金礦”,最近,卻被推上了一場前所未有的學術風暴的風口浪尖。大約從2023年開始,關于單個藥品與特定不良事件關聯(lián)的論文數(shù)量,出現(xiàn)了“巨型尖峰”(a huge spike)。 這些論文的主要代表刊物——Frontiers in Pharmacology和Expert Opinion on Drug Safety。 面對這場論文“洪水”,兩家期刊終于出手了。 1)Frontiers in Pharmacology 自2025年5月起,要求所有基于健康數(shù)據(jù)集的研究,都需要進行獨立的外部驗證。期刊的研究誠信負責人表示:“我們擔心的不是使用FAERS本身,而是那些幾乎沒有增加新科學見解的冗余分析的風險! 2)Expert Opinion on Drug Safety 行動更為決絕。該期刊在7月下旬,決定完全停止接受使用FAERS數(shù)據(jù)庫進行此類研究的主動投稿。其網(wǎng)站現(xiàn)在明確聲明:“此類研究,只有在受到編輯團隊特別邀請的情況下,才會被考慮! 應對“數(shù)據(jù)庫論文”收緊標準 面對這一問題,Journal of Global Health已經(jīng)率先采取行動,收緊了對基于這些數(shù)據(jù)庫的論文的審核標準,F(xiàn)在,使用開放數(shù)據(jù)集投稿的作者必須聲明過去三年內(nèi)使用類似數(shù)據(jù)集發(fā)表過多少篇論文,披露是否使用人工智能撰寫手稿,并解釋其如何排除結果中的假陽性。 為應對“濫用數(shù)據(jù)集”的趨勢,其他期刊和出版商或?qū)⑿Х?em>Journal of Global Health,引入類似的嚴格審核機制。 根據(jù)Matt Spick、Anthony Onoja等人的研究,2021年-2025年間,有六個數(shù)據(jù)集的論文數(shù)量遠超預期增長,其中NHANES、UK Biobank、FAERS、GBD和FinnGen這五個數(shù)據(jù)源的“模板化”論文爆發(fā)式增長。 與ARIMA預測相比的六個數(shù)據(jù)源實際出版數(shù)量 2021年至2024年PubMed中編入索引的論文增加的國家/地區(qū) 六個數(shù)據(jù)庫的中國論文增長情況 |