微生物識別癌癥:里程碑式研究被指重大數(shù)據(jù)錯誤

2023-08-07 10:24:08

·據(jù)《科學(xué)》雜志8月2日的文章報道,時至今日,這項研究已經(jīng)獲得了數(shù)百次引用,為其他十幾項研究提供了數(shù)據(jù),并支持孵化了至少一個商業(yè)項目,該商業(yè)項目旨在利用人體血液中的微生物序列來揭示癌癥的存在。

當(dāng)?shù)貢r間8月2日,《科學(xué)》(Science)雜志的一篇文章講述了近期科學(xué)領(lǐng)域的一場激烈辯論,稱一項里程碑式的研究可能存在“重大錯誤”,但被指存在錯誤的科學(xué)家表示不同意。


【資料圖】

當(dāng)?shù)貢r間2020年3月11日,《自然》(Nature)雜志刊登一篇名為《血液和組織的微生物組分析提示癌癥診斷方法》(Microbiome analyses of blood and tissues suggest cancer diagnostic approach)的論文,美國加州大學(xué)圣地亞哥分校(University of California San Diego)羅伯·奈特(Rob Knight)等科學(xué)家表明,不同類型的癌癥與不同的微生物群落有關(guān)。他們使用人工智能梳理出可以提示特定癌癥的微生物DNA,并提出了“一類基于微生物組的新型癌癥診斷工具”。

據(jù)《科學(xué)》雜志8月2日的文章報道,時至今日,這項研究已經(jīng)獲得了數(shù)百次引用,為其他十幾項研究提供了數(shù)據(jù),并支持孵化了至少一個商業(yè)項目,該商業(yè)項目旨在利用人體血液中的微生物序列來提示癌癥的存在。

然而,當(dāng)?shù)貢r間2023年7月31日,美國約翰霍普金斯大學(xué)(Johns Hopkins University)史蒂文· 薩爾茨伯格(Steven L. Salzberg)等人在論文預(yù)印本平臺上發(fā)表了一篇文章,聲稱奈特等人2020年的論文存在“重大數(shù)據(jù)分析錯誤”。薩爾茨伯格等人指出,奈特等人未能正確地從測序的癌癥組織數(shù)據(jù)庫中過濾出人類DNA,這導(dǎo)致數(shù)以百萬計的人類基因序列被錯誤地歸類為微生物。“這篇論文的主要結(jié)論是完全錯誤的?!?薩爾茨伯格說。

奈特不認可這些批評,并指出,2023年1月也曾有一些科學(xué)家對其2020年的論文提出質(zhì)疑,他的實驗室已經(jīng)在2023年2月發(fā)表的預(yù)印本中作出回應(yīng)。“這個新的預(yù)印本指出的問題真的沒有什么是尚未公開解決的?!蹦翁卣f,他于2019年共同創(chuàng)立了Micronoma公司,以開發(fā)基于微生物組的癌癥診斷方法。他強調(diào),2022年9月,他的團隊在《細胞》(Cell)雜志上發(fā)表了一篇名為《泛癌癥分析揭示了癌癥類型特異性真菌生態(tài)和細菌組相互作用》的論文,使用了更新的方法來分析腫瘤中的真菌和細菌,并得出了與此前《自然》雜志上論文相似的結(jié)論。

盡管如此,旁觀的研究人員表示,這次薩爾茨伯格等人針對奈特團隊2020年的論文提出了更多缺陷,而且論點令人信服。英國劍橋大學(xué)(the University of Cambridge)的細菌遺傳學(xué)家朱利安·帕克希爾(Julian Parkhill)說:“這是對原始論文錯誤之處的精準(zhǔn)拆解。”

據(jù)《科學(xué)》雜志報道,多位研究人員告訴《科學(xué)》雜志,微生物組科學(xué)無疑具有生物醫(yī)學(xué)的前景,許多其他研究小組已經(jīng)將微生物與特定的癌癥聯(lián)系起來。英國諾丁漢特倫特大學(xué)(Nottingham Trent University)的微生物學(xué)家和生物信息學(xué)家萊斯莉·霍伊爾斯(Lesley Hoyles)說:“這場辯論為嚴(yán)重依賴計算方法的微生物組研究提供了一個警示。人們對出版物的內(nèi)容缺乏質(zhì)疑,我們需要有人做這類分析。”

癌癥組織中出現(xiàn)了意外的細菌

奈特等人的論文使用了一個名為“癌癥基因組圖譜”(TCGA)的數(shù)據(jù)庫,該數(shù)據(jù)庫存儲了來自人類癌癥樣本的大量DNA序列。數(shù)據(jù)庫根據(jù)序列是否與人類參考基因組相匹配,將序列分類為人類或非人類(盡管這種分類不完善)。

奈特等人將TCGA的“非人類”序列,以及來自幾十名無癌癥患者和100名癌癥患者的序列,與細菌、病毒和其他微生物的DNA數(shù)據(jù)庫進行了比較,表明不同類型的癌癥有特定的常駐微生物群落。然后他們將數(shù)據(jù)輸入機器學(xué)習(xí)算法,可以僅從樣本的微生物組成中預(yù)測癌癥的類型或癌癥是否存在,并稱,其準(zhǔn)確率有時接近100%。

然而,一些科學(xué)家注意到,奈特等人的實驗結(jié)果中存在一些令人費解的發(fā)現(xiàn)。雖然這項工作在癌組織中發(fā)現(xiàn)了許多人類細菌,但除了神秘的海藻細菌外,還有一種與前列腺癌有關(guān)的海洋熱液噴口細菌,以及一種與黑色素瘤有關(guān)的珊瑚細菌。

在2023年1月的預(yù)印本中,英國東英吉利大學(xué)(the University of East Anglia)的研究人員表示,這可能表明該研究的方法存在問題。他們特別指出,癌癥組織中意想不到的微生物的存在可能是數(shù)據(jù)庫錯誤的結(jié)果,其中一個物種的序列被錯誤地標(biāo)記為另一個物種的序列。

帕克希爾解釋說,人類DNA不小心進入微生物數(shù)據(jù)庫是很常見的,它被錯誤地列在微生物物種名稱下。除非研究人員在將其與微生物數(shù)據(jù)庫進行比較之前,從人體組織測序數(shù)據(jù)中過濾掉人類DNA,否則他們有可能檢測到并不真正存在于組織中的生物體。

在一篇27頁的回應(yīng)中,奈特和他的同事們對這些觀察的重要性提出了質(zhì)疑,他們稱,他們在2022年發(fā)表于《細胞》雜志的論文中使用了新的方法,復(fù)制了2020年發(fā)表于《自然》雜志的論文的結(jié)論。

但這個回答并未讓薩爾茨伯格信服,他開發(fā)了奈特等人2020年論文中使用的一些計算工具。薩爾茨伯格與東英吉利大學(xué)的研究人員合作,下載并重新分析了奈特等人研究數(shù)據(jù)中的一個子集。他們的分析發(fā)現(xiàn),奈特等人認為是微生物的數(shù)百萬序列實際上是人類的。最新的預(yù)印本認為,研究中發(fā)現(xiàn)的許多微生物根本不在TCGA的癌癥樣本中。

奈特表示,特定癌癥中發(fā)現(xiàn)的序列的確切身份并沒有改變他的研究團隊的結(jié)論,“(分析)可以通過技術(shù)和數(shù)據(jù)來源進行改進。”他還指出,其他研究,以及他和他的同事進行的一項小型分析表明,即使更嚴(yán)格地排除了人類序列,微生物的差異仍然存在。

應(yīng)謹慎對待嚴(yán)重依賴計算方法的研究

在2020年的論文中,由于組織樣本來自多個不同的醫(yī)療中心和不同的時間,奈特等人使用了“標(biāo)準(zhǔn)化”的技術(shù)來試圖消除可變性。但新的預(yù)印本稱,這一過程是有問題的,它為每種癌癥類型的數(shù)據(jù)引入了不同的電子標(biāo)簽,當(dāng)研究小組將標(biāo)準(zhǔn)化數(shù)據(jù)輸入他們的算法時,計算機可以偷偷地使用標(biāo)簽,而不是微生物數(shù)據(jù),來確定樣本來自哪種癌癥類型。

奈特說,他的團隊不同意最新預(yù)印本的分析,并再次強調(diào),他們以不同的方式處理數(shù)據(jù),得出了同樣的結(jié)論。他補充說,他的團隊沒有特別的動力來梳理預(yù)印本的冗長分析或在社交媒體上解決它,即使它已經(jīng)引起了轟動?!叭绻麄円谕性u審的期刊上發(fā)表這篇文章,我們會解決(它)。我認為這是做科學(xué)研究的適當(dāng)方式,就像過去幾個世紀(jì)一樣?!?/p>

Micronoma首席執(zhí)行官桑德琳·米勒-蒙哥馬利(Sandrine Miller-Montgomery)在一份聲明中說:“我們開發(fā)了額外的人體過濾和質(zhì)量控制方法,將人類基因組DNA污染降到最低,發(fā)現(xiàn)這樣做并不妨礙診斷癌癥存在或類型的能力?!睂τ谄湔谶M行的肺癌血液檢測,Micronoma已經(jīng)基于非人類的宏基因組組裝生成了一個獨立的、專有的微生物數(shù)據(jù)庫。

目前,使用奈特等人2020年論文數(shù)據(jù)的其他學(xué)術(shù)團隊的研究是否受到影響尚不清楚?!斑@些都是非常早期的階段,這是一個相當(dāng)復(fù)雜的問題?!泵绹鴩野┌Y研究所的 Eytan Ruppin 說,他依靠前述數(shù)據(jù)集撰寫了一篇名為《預(yù)測腫瘤微生物組的癌癥預(yù)后和藥物反應(yīng)》(Predicting cancer prognosis and drug response from the tumor microbiome)論文,于2022年5月發(fā)表于《自然-通訊》(Nature Communications)。

“現(xiàn)在應(yīng)該聽取《自然》論文的原作者的意見,如果他們選擇回應(yīng),就可以在這個重要話題上獲得一個可能更加平衡和公平的觀點?!?Eytan Ruppin說。

一些科學(xué)家說,學(xué)術(shù)期刊應(yīng)該對嚴(yán)重依賴計算方法的研究更加謹慎。美國雪松-西奈醫(yī)學(xué)中心(Cedars-Sinai Medical Center)的微生物組科學(xué)家Ivan Vujkovic-Cvijin說:“在微生物組科學(xué)中使用機器學(xué)習(xí)缺乏標(biāo)準(zhǔn)。我認為這種科學(xué)分歧強調(diào)了開發(fā)它們的必要性?!?/p>

也有一些科學(xué)家希望有更多的討論來解決原始論文中的問題。 “作為科學(xué)家,我們應(yīng)該接受挑戰(zhàn)。”帕克希爾說,“我們應(yīng)該能夠客觀地處理它,并在必要時加以糾正?!?/p>

參考資料:

https://www.science.org/content/article/major-errors-alleged-landmark-study-used-microbes-identify-cancers

(原標(biāo)題:微生物識別癌癥:里程碑式研究被指重大數(shù)據(jù)錯誤,原作者不服)

標(biāo)簽:

關(guān)閉
新聞速遞