全球熱頭條丨Nature發(fā)文:全球知名數(shù)據(jù)庫(kù)中超34萬(wàn)篇論文涉嫌造假

2022-10-11 20:45:33

說(shuō)起PubMed,很多小伙伴都非常熟悉,這應(yīng)該算是國(guó)內(nèi)最常用的生物醫(yī)學(xué)相關(guān)SCI文獻(xiàn)檢索數(shù)據(jù)庫(kù),實(shí)驗(yàn)室的小白們一開(kāi)始用的基本都是它。

最近,Nature的一篇報(bào)道文章稱,就是這樣一個(gè)廣受好評(píng)的文獻(xiàn)檢索集大成者,被一款名為Papermill Alarm的軟件工具查出,至少有1%的論文可能出自論文工廠。


(資料圖片僅供參考)

1%是個(gè)什么概念呢?根據(jù)PubMed官網(wǎng)顯示,該數(shù)據(jù)庫(kù)收錄了超過(guò)3400萬(wàn)篇生物醫(yī)學(xué)文獻(xiàn),“至少1%”就意味著有超過(guò)34萬(wàn)篇論文可能涉嫌造假。

“這個(gè)數(shù)據(jù)太高了,令人擔(dān)憂。”學(xué)術(shù)打假人Smut Clyde感嘆道,“這些垃圾論文確實(shí)會(huì)被引用,人們利用它們來(lái)支持自己沒(méi)有出路的研究項(xiàng)目。”

另一位學(xué)術(shù)打假人Elisabeth Bik則認(rèn)為,PubMed上出自論文工廠的文章真實(shí)數(shù)量可能更高,“這些論文會(huì)損害科學(xué)的聲譽(yù)和我們對(duì)研究論文的信任。”

近年來(lái),被期刊撤銷的論文數(shù)量不斷增加,這些撤稿數(shù)據(jù)背后,論文工廠扮演了重要角色。日漸規(guī)?;?、工業(yè)化的學(xué)術(shù)作假手段正在侵襲科學(xué)界,打擊論文工廠迫在眉睫。

與“論文工廠”的持久戰(zhàn)

有學(xué)術(shù)造假行為,就有打假人的出現(xiàn)。他們與論文工廠之間展開(kāi)了一場(chǎng)持久戰(zhàn)。

多年來(lái),Clyde一直在追蹤學(xué)術(shù)不端行為的證據(jù)。與其他學(xué)術(shù)打假人一起,他標(biāo)記了數(shù)百篇可能是論文工廠生產(chǎn)的文章。這些論文工廠大量生產(chǎn)假學(xué)術(shù)論文,然后賣(mài)給有需要的研究人員。

出版商已經(jīng)撤回了許多可疑論文,并采取措施阻止期刊接收論文工廠生產(chǎn)的投稿。但問(wèn)題仍然存在。

Clyde只是從事這種打假工作的眾多研究人員中的一員。他們通常是把學(xué)術(shù)打假作為主要工作之外的一種消遣,所以喜歡用化名進(jìn)行打假。而有些人則不同,比如Bik和分子腫瘤學(xué)家Jennifer Byrne,他們選擇實(shí)名打假。

今年4月,Clyde的電子郵件地址出現(xiàn)在Research Square服務(wù)器上的一篇預(yù)印文章中,文章描述了一家論文工廠。這篇文章的作者名叫David Bimler,他是一名退休的心理學(xué)家,曾在新西蘭梅西大學(xué)工作。

在確認(rèn)Clyde和Bimler是同一個(gè)人后,Nature采訪了此人,談?wù)撽P(guān)于論文工廠等問(wèn)題。

這篇發(fā)表在預(yù)印本的文章引起了軒然大波。Bimler在文中指出,從2015年到2022年間,有800多篇可疑的化學(xué)領(lǐng)域的論文出自同一家論文工廠,這些論文有圖像重復(fù)、奇怪的措辭、可疑的電郵地址、無(wú)意義的引用等特點(diǎn),并且都聲稱金屬有機(jī)框架材料具有殺滅癌細(xì)胞或抑制炎癥等作用。

“我很驚訝,居然有那么多論文都是關(guān)于高級(jí)化學(xué)和醫(yī)學(xué)應(yīng)用交叉的。”Bimler表示,金屬有機(jī)框架確實(shí)有一些奇妙的物理特性,所以人們才會(huì)對(duì)它們?nèi)绱藷嶂浴5?,認(rèn)為它們可能具有醫(yī)學(xué)特性的想法是極其牽強(qiáng)的,而這些期刊卻接收了數(shù)百篇關(guān)于它們的論文。

近年來(lái),大規(guī)模學(xué)術(shù)造假事件正在影響著出版商。

比如2021年初,Royal Society of Chemistry Advance期刊撤回了69篇涉嫌學(xué)術(shù)造假的論文,這些論文都沒(méi)有共同的作者或機(jī)構(gòu),但是文中的圖標(biāo)和標(biāo)題卻驚人地相似。官方聲明表示,該期刊也是這場(chǎng)“規(guī)模學(xué)術(shù)造假”騙局中的受害者。

該期刊執(zhí)行主編Laura Fisher意識(shí)到,一些論文工廠正在大量生產(chǎn)偽科學(xué)文章。

Nature的一項(xiàng)分析發(fā)現(xiàn),自2020年1月以來(lái),各大期刊已經(jīng)撤回了至少370篇與論文工廠有關(guān)的論文,預(yù)計(jì)未來(lái)還會(huì)有更多的論文被撤回。

之所以出現(xiàn)這種文獻(xiàn)清理行動(dòng),很大程度上是因?yàn)閷W(xué)術(shù)打假人公開(kāi)標(biāo)記了他們認(rèn)為來(lái)自論文工廠的可疑論文。

編輯們非常重視這一問(wèn)題。以至于2020年9月,倫敦的出版?zhèn)惱砦瘑T會(huì)(COPE)舉辦了一個(gè)論壇,專門(mén)討論關(guān)于“論文工廠系統(tǒng)性地操縱出版過(guò)程”這一話題。

Bik是論壇主講嘉賓,她曾在美國(guó)斯坦福大學(xué)醫(yī)學(xué)院工作了15年,后來(lái)成了一名職業(yè)學(xué)術(shù)打假人,專門(mén)調(diào)查各類論文圖像重復(fù)問(wèn)題以及可能存在的學(xué)術(shù)不端行為。Bik認(rèn)為,在文獻(xiàn)中還有數(shù)千篇這樣的論文。“這么多論文都是假的,太令人嘆息了。”

根據(jù)Nature的統(tǒng)計(jì),到2021年3月,被這些學(xué)術(shù)打假人列為可疑論文的名單加起來(lái)總共有1300多篇。大概約有26%的文章已被撤回或貼上了密切關(guān)注的標(biāo)簽,還有許多依然在被調(diào)查中。

醫(yī)學(xué)是論文代寫(xiě)的重災(zāi)區(qū)

在大多數(shù)撤回的論文中,醫(yī)學(xué)領(lǐng)域是重災(zāi)區(qū)。

Nature統(tǒng)計(jì),2020年1月以來(lái),被學(xué)術(shù)打假人聲稱出自論文工廠的370多篇撤稿,其作者都來(lái)自醫(yī)院。

2021年7月,Journal of Cellular Biochemistry撤回了129篇來(lái)自中國(guó)的論文,甚至還專門(mén)出了一期增刊Supplement Retraction Issue——一本撤稿論文的合集。尤其令人震驚的是,這里面的所有論文都來(lái)自醫(yī)院群體。

該期刊主編、德國(guó)美因茨大學(xué)教授Christian Behl甚至還特意寫(xiě)了一篇社論,來(lái)解釋這次的增刊行為,并對(duì)論文工廠表示譴責(zé)。“最近,論文工廠成了熱議話題,出版商、編輯、評(píng)審人等都對(duì)這個(gè)話題非常關(guān)注。論文工廠已對(duì)科研誠(chéng)信造成巨大的威脅。”

美國(guó)布拉德利大學(xué)的圖書(shū)管理員Xiaotian Chen說(shuō),醫(yī)生是一個(gè)特殊的目標(biāo)市場(chǎng),因?yàn)樗麄兺ǔP枰l(fā)表研究論文來(lái)獲得晉升,但他們?cè)卺t(yī)院太忙了,真的沒(méi)有太多時(shí)間做科學(xué)研究和寫(xiě)文章。

這也是為什么醫(yī)學(xué)領(lǐng)域成了論文造假的重災(zāi)區(qū)。

問(wèn)題論文的普遍存在,導(dǎo)致一些期刊編輯懷疑中國(guó)醫(yī)學(xué)研究人員提交的論文。2021年2月,Molecular Therapy的一篇社論說(shuō),“這種‘問(wèn)題論文’的數(shù)量不斷增加,正在嚴(yán)重破壞中國(guó)學(xué)者從事科研的可信度,并日益使人們對(duì)該地區(qū)的科學(xué)規(guī)范性產(chǎn)生懷疑。”

全球最大的科學(xué)出版商Elsevier出版服務(wù)部門(mén)負(fù)責(zé)人Catriona Fennell指出,出版行業(yè)有組織的造假問(wèn)題并不新鮮,也不僅僅局限于中國(guó)。

她對(duì)Nature說(shuō),“我們?cè)谄渌麕讉€(gè)國(guó)家也發(fā)現(xiàn)了工業(yè)化造假的證據(jù),包括伊朗和俄羅斯。這已經(jīng)是一個(gè)全球性的問(wèn)題。”

造假“克星”來(lái)了

出版商一直在與學(xué)術(shù)造假作斗爭(zhēng)。許多出版商也會(huì)使用軟件和其他方法來(lái)幫助檢測(cè)欺詐行為和發(fā)現(xiàn)造假論文。例如,用一些手稿處理系統(tǒng)就可以檢測(cè)并標(biāo)記出來(lái)自同一臺(tái)計(jì)算機(jī)的許多投稿。

Papermill Alarm的開(kāi)發(fā)者、英國(guó)倫敦學(xué)術(shù)數(shù)據(jù)服務(wù)公司Clear Skies的主管Adam Day則表示,“它分析文本的方法是最新的。”

Papermill Alarm可以海量分析科學(xué)論文的標(biāo)題和摘要,并檢測(cè)出與造假文章中相似的文本內(nèi)容,簡(jiǎn)直就是造假“克星”。

該工具使用一種深度學(xué)習(xí)算法,將所投文章標(biāo)題和摘要中使用的語(yǔ)言與已知來(lái)自論文工廠的文章進(jìn)行比較。這一比較是基于由Bik和Bimler(也以化名Smut Clyde聞名)等研究科研誠(chéng)信的人匯編的論文工廠文章列表。該工具使用交通信號(hào)燈模式,給與已知論文工廠文章有很多相似之處的論文分配紅色旗,給那些有個(gè)別相似之處的論文分配橙色旗,給那些沒(méi)有相似之處的論文分配綠色旗。

“它不是釣魚(yú)竿,而是像一張漁網(wǎng)。”Day如此評(píng)價(jià)這款文本分析工具。

其出色功能引起了一些出版商的注意。目前有六家出版商表示,有興趣使用Papermill Alarm來(lái)篩選提交的投稿,其中就包括知名獨(dú)立學(xué)術(shù)出版公司SAGE,Day在那里擔(dān)任數(shù)據(jù)科學(xué)家。

輕松將潛在的造假論文“一網(wǎng)打盡”正在變成現(xiàn)實(shí)。這樣一款論文檢測(cè)工具的確讓期刊編輯受益,但要說(shuō)明的是,該軟件并不能明確指出一篇論文是否造假,但能夠篩選出需要進(jìn)一步調(diào)查的有問(wèn)題的文章。

參考鏈接:

https://www.nature.com/articles/d41586-022-02997-x

https://www.nature.com/articles/d41586-022-02099-8

https://www.nature.com/articles/d41586-021-00733-5

https://www.nature.com/articles/d41586-020-01363-z

標(biāo)簽: PubMed 文獻(xiàn)檢索 論文造假 學(xué)術(shù)不端

關(guān)閉
新聞速遞