來自中國博士生的奇跡:72小時寫稿,32小時過審,被引近萬次

2023-02-21 08:55:15
中國科學報 發(fā)布時間:2023/2/20 20:45:34
選擇字號:
來自中國博士生的奇跡:72小時寫稿,32小時過審,被引近萬次

 

當?shù)弥聜€月就要告別親手創(chuàng)建的新冠疫情儀表盤,董恩盛五味雜陳,他在朋友圈寫道:感謝大家的關注與支持!愿全球疫情早日完全結束!

疫情該翻頁了。就在2月,美國約翰·霍普金斯大學(JHU)通告稱,該校于2020年1月開發(fā)的用于跟蹤新冠疫情的儀表盤將于3月10日終止運作。

深黑底色點綴著或大或小的紅圈,左右兩側是各國確診病例、死亡和接種疫苗的數(shù)目,以及綠色、紅色或白色曲線,這個醒目的儀表盤讓全球在3年里實時看到了詳盡的、可視化的疫情地圖數(shù)據(jù)。2260億點擊,超過36億次瀏覽,這半年前的數(shù)據(jù)足以說明其影響力。

  ?

JHU新冠疫情儀表盤(圖源:官網(wǎng)截圖)

因為這項工作,董恩盛的導師、JHU土木和系統(tǒng)工程系教授Lauren Gardner入選了《時代》雜志2020年全球最具影響力百人榜,她還獲得了有“諾獎風向標”之稱的2022年拉斯克獎。

導師殊榮屢獲的背后,有著2個中國博士生董恩盛和杜鴻儒的極大付出。董恩盛也略帶調(diào)侃地自稱是導師“背后的男人”。

這兩個“背后的男人”也得到了回饋,董恩盛以第一作者署名的文章已有4篇,杜鴻儒以第一作者署名的文章有1篇。尤其是其中一篇由他們與導師3人署名的文章,2020年2月發(fā)在《柳葉刀-傳染病》上,引用次數(shù)超過9500次。而按照湯森路透在2014年的統(tǒng)計,有史以來排名第100位的論文引用次數(shù)是12000多次。

這篇文章正是介紹新冠疫情數(shù)據(jù)儀表盤創(chuàng)建的。這只是一篇讀者來信(correspondence),且僅有一頁多一點。更神的是,“72個小時寫稿,32個小時過審”。如果這是研究論文的話,這個引用次數(shù)的價值會更大。

按照谷歌學術的統(tǒng)計,董恩盛、杜鴻儒二人的引用次數(shù)都已經(jīng)超過1萬。

這一切,卻是歷史的偶然。

  ?

2020年2月《柳葉刀-傳染病》文章截圖

  ?

 董恩盛的Google Scholar數(shù)據(jù)

“一不小心做成了一件大事”

“一不小心做成了一件大事”,2020年上半年,美國達特茅斯學院地理系教授施迅跟董恩盛有一次對話,他給出了這句由衷的評價。

讓我們把時鐘撥回到2020年1月21日上午,董恩盛和導師Gardner如約來到圖書館喝咖啡交流課題。

彼時30歲的董恩盛作為一年級博士生,進入JHU僅10個月;而35歲的Gardner也是剛剛從澳大利亞新南威爾士大學悉尼分校跳槽過來,董恩盛、杜鴻儒是她唯二的博士生。

因為更早進入師門,董恩盛也就跟導師有更多交流,可謂Gardner在JHU的開山大弟子。值得一提的是,早在2019年5、6月份的時候,董恩盛與Gardner就針對美國麻疹暴發(fā)風險做了一份可視化地圖,得到了《紐約時報》等美國主流媒體的關注。

他本科畢業(yè)于重慶的西南大學地理系,期間交換到中國臺灣“中央大學”地球科學系,于2012年赴美,在愛達荷大學拿了地理與統(tǒng)計雙碩士。期間他在地理信息系統(tǒng)公司Esri實習過,儀表盤技術就是在那里接觸到的。在之后美國電力領域和電信領域工作的3年中,他用該技術做了一些項目。董恩盛看中了Gardner從事傳染病數(shù)字建模的學術背景,這跟他地理信息系統(tǒng)、計算機和統(tǒng)計學的技術背景非常匹配,有助于他將來從事建模研究。

這次跟導師見面談新學期計劃,董恩盛是有所準備的。彼時新冠疫情主要在中國,泰國、韓國和日本出現(xiàn)了少量病例,美國也剛剛確診了第一例。出于對中國疫情的關注和擔憂,也出于對自己博士課題的早做準備,他已經(jīng)把疫情數(shù)據(jù)收集好,做了一個小樣。不料想當Gardner買了咖啡端過來的時候,她告訴董恩盛,“要不咱們做一個儀表盤疫情地圖吧”。

一拍即合!影響人類應對新冠疫情的重要一環(huán)就此開啟。

Gardner后來坦承,這個決定是一時沖動。他們最初的想法是通過數(shù)據(jù)收集,把一種傳染病從發(fā)生到被消滅的全過程記錄下來。

當天晚上,董恩盛熬夜奮戰(zhàn)8、9個小時構建了一個儀表盤。最初,這個流程并不復雜:收集、翻譯并整合全球來自各式各樣渠道的數(shù)據(jù),原始數(shù)據(jù)公布在Google Sheet上(后改為GitHub),之后使用地理信息技術和Esri的平臺對疫情數(shù)據(jù)進行空間可視化渲染。

杜鴻儒于2月1日加入了進來,負責數(shù)據(jù)的自動抓取、更新,并編寫了自動更新的代碼。當時25歲的杜鴻儒本科畢業(yè)于天津大學化工學院,在威斯康星大學麥迪遜分校獲得工業(yè)工程及運籌學專業(yè)碩士學位,他擅長數(shù)學模型和優(yōu)化。

董、杜就此開始了聯(lián)手奮戰(zhàn)。到后來隨著數(shù)據(jù)陡增,人手再度增加,有4、5個人一起寫代碼,等一周后自動地圖上線已是凌晨3、4點。

  ?

董恩盛和杜鴻儒(圖源:JHU官網(wǎng))

他們得到了來自本校學生、圖書館、JHU應用物理實驗室,以及Esri公司的幫助。很快團隊擴大到了近40人。到當年4月,該儀表盤的日均點擊量超過10億次,最高達到了46億次。

在回顧這段經(jīng)歷的時候,Gardner說了一句,“不要等待許可, 坐下來并采取行動”(Don't wait for permission. Take your seat and take action)。

作為旁觀者的施迅,對他們這段頗具傳奇性的開端很是感慨:要有這種開創(chuàng)性的勇氣,不要覺得自己只是一個學生就做不成大事,而是應該大膽去想,大膽去做,去跟導師、同事請教,去獲得支持,“在很多情況下,你會得到可能比你預想的要多的支持”。

流量取勝

紛至沓來的關注和榮譽遠遠超出了他們的預期。

董恩盛的朋友圈記錄下了一些激動的時刻:

2020年:1月29日,他做的圖被BBC引用;2月29日,他們的儀表盤成了美國副總統(tǒng)、意大利總理決策的重要參考;3月12日,2013年諾貝爾化學獎得主、斯坦福大學結構生物學系教授Michael Levitt來信對其工作點名鼓勵,董恩盛“頓感信心滿滿、干勁兒十足”;3月20日,JHU校長來看望疫情數(shù)據(jù)團隊,“結果我以為他是高級清潔工,囧”;4月7日,《科學》雜志點名報道;5月,被《華爾街日報》采訪;6月,同一天有2篇《柳葉刀》系列文章被接受。

2021年:5月,儀表盤數(shù)據(jù)成為美國疾控中心的指定來源。7月,德國時任總理默克爾來到JHU接受榮譽博士學位時,贊揚了新冠疫情地圖的工作。

2022年:3月,《自然》雜志以新聞特寫報道了包括他們團隊在內(nèi)的新冠疫情數(shù)據(jù)工作;7月,《自然》雜志再次報道了各個疫情地圖團隊的技術特色。

他們的工作早已出圈。據(jù)說從制藥公司測試疫苗到好萊塢的電影拍攝,都會參考他們的儀表盤來安排工作,以至于JHU被人們叫成了 “map school”(地圖大學)。

隨之而來的,導師有了更多的研究經(jīng)費,董恩盛也不用再為自己的學費和生活費發(fā)愁了,他們的辦公室也翻新了,可謂喜事連連。

他們是以流量取勝的,但他們并非只靠流量。

開展新冠疫情數(shù)據(jù)收集并可視化的機構還有多家,包括美國疾控中心、世衛(wèi)組織、《紐約時報》等。而JHU的疫情儀表盤之所以拔得頭籌,有眾多因素:由于數(shù)據(jù)收集和可視化做得專業(yè)且最早,也因此獲得了先發(fā)優(yōu)勢;其數(shù)據(jù)抓取和更新也更加及時、準確,一些國家地區(qū)用戶會主動聯(lián)系他們更新數(shù)據(jù);JHU醫(yī)學與公共衛(wèi)生專業(yè)盛名的加持。

除了天時、地利、人和的種種因素,在董恩盛眼里,出于對祖國疫情的關注和擔憂從而開始盤算這個項目,才是第一推動力。

  ?

日常工作場景,左三為Lauren Gardner,左二為董恩盛,右二為杜鴻儒(圖片來源:JHU官網(wǎng))

新的游戲規(guī)則制定者

他們受到的關注度以及得到的榮譽是當之無愧的。

讓世界上每一個人都能實時追蹤疫情是他們最大、最重要的創(chuàng)新。

拉斯克獎給出的獲獎理由是,他們?yōu)閷崟r傳播權威公共衛(wèi)生數(shù)據(jù)設定了新標準。換言之,他們制定了新的游戲規(guī)則。

并不是所有疫情地圖制作者都始終秉持數(shù)據(jù)的公開、透明,以及非商業(yè)化。董恩盛還對施迅“抱怨”過:《紐約時報》用了JHU那么多無償?shù)臄?shù)據(jù),當董恩盛找《紐約時報》要數(shù)據(jù)時卻遭拒。到了2020年3月,《紐約時報》才開始公布全部數(shù)據(jù)。

公開、透明以及非商業(yè)化,也是Gardner更為看重的。她在拉斯克獎的獲獎感言中談及,這項工作更重要的意義是實現(xiàn)了“數(shù)據(jù)民主化”(data democratization)和科學傳播,這有助于公眾的知情決策,并促進以證據(jù)為基礎的公共衛(wèi)生政策。

換個角度看,當JHU的儀表盤成為流量霸主的時候,它自然就成了標準。法國的態(tài)度就是典型。疫情初期,董恩盛找法國要數(shù)據(jù),對方完全無視;然而到了后期,法國衛(wèi)生部發(fā)現(xiàn)JHU數(shù)據(jù)與其要公布的數(shù)據(jù)有偏差,就主動聯(lián)系溝通。

作為專業(yè)同行,施迅長期從事地理信息技術在健康領域應用,他深深感受到了這次全球大流行對傳染病研究的顛覆:在上世紀的西班牙大流感時代,診斷技術和信息技術過于原始,遑論數(shù)據(jù)準確;而這次全球大流行也是一次史無前例的數(shù)據(jù)收集和整理的過程,這個過程本身就有巨大的科學價值。人們發(fā)現(xiàn),需要一些非常革命性的手段,重新建立對傳染病的認識以及建模手段,而這些的基礎都是數(shù)據(jù)。

董恩盛更是對大數(shù)據(jù)的影響感同身受:只有量變,才會有質(zhì)變,才能有進一步的分析,才會帶來更多資金和人力資源的投入。他們的數(shù)據(jù)吸引的不僅僅只是公共衛(wèi)生專家、計算機科學專家、地理信息專家,還有政治學者、經(jīng)濟學者,每個人都能挖掘到自己的金礦。

儀表盤只是起點

榮譽再多,終有告別時。該和儀表盤說再見了。

這個背景是復雜的。JHU新冠資源中心(CRC)數(shù)據(jù)負責人Beth Blauer接受采訪時分析說,由于居家快速檢測已經(jīng)廣泛使用,世界各地發(fā)布病例數(shù)據(jù)的實用性和準確性已經(jīng)大大降低,那么儀表盤數(shù)據(jù)的準確性也就難以保障。另一方面,如美國聯(lián)邦政府的數(shù)據(jù)收集能力比之前已經(jīng)大大提高,尤其是其報告的住院數(shù)據(jù)成了如今最可靠和完整的決策依據(jù)。

還有一個原因是許多國家疫情趨于平穩(wěn),數(shù)據(jù)源的公布頻率和人們的關注度沒有以前那么高了。

Gardner用了“苦樂交織”來形容過去的3年。她說,經(jīng)過3年日夜不休的維護,是時候改變已有的響應模式了。

談起自己的導師,董恩盛和杜鴻儒都不吝稱贊。

最讓董恩盛欽佩不已的是Gardner對信息接受和對學生反饋的速度。她能很快理解他人想表達的意思,然后會給出她的意見。這在3年前兩人那次喝咖啡時表現(xiàn)得尤為明顯,當董恩盛剛提出自己深思熟慮了好幾天的意圖,Gardner馬上就給出了做儀表盤的計劃。

實際上,Gardner在儀表盤上的貢獻是關鍵的,她會指出哪些數(shù)據(jù)是更重要的,從而需要在儀表盤上展示。同時她需要把各種資源整合到這個項目中。

杜鴻儒感受更深刻的則是Gardner與學生的平等相處。她從來不會催著做任何事情,而是留更多時間給學生自由思考。

董恩盛的工作交叉性更強,他也更愿意做一些有實際應用的事情。接下來,董恩盛需要把精力投入到博士課題中來。課題當然繞不開新冠數(shù)據(jù),畢竟疫情儀表盤在一開始也是為了其博士課題而來,所以他會繼續(xù)進行數(shù)據(jù)的挖掘以及做一些網(wǎng)絡分析工作。

杜鴻儒的研究更偏理論,他已經(jīng)在利用收集的數(shù)據(jù)建立深度學習模型,尤其是關注那些人類行為數(shù)據(jù)和社會調(diào)查數(shù)據(jù)。他希望把人類行為對外界的反饋加入到傳統(tǒng)的流行病模型當中,他相信這種混合模型能對未來的疫情作出更準確的預測。

起點足夠高,壯闊的科學圖景正在他們面前徐徐展開,愿他們走得更遠。

參考:

https://www.esri.com/about/newsroom/blog/how-researchers-built-johns-hopkins-dashboard/ 

https://www.nature.com/news/the-top-100-papers-1.16224

https://www.nature.com/nature-index/news-blog/behind-the-johns-hopkins-university-coronavirus-dashboard

https://laskerfoundation.org/winners/covid-19-dashboard/

<script src="/html/js/share.js" type="text/javascript"></script>
 
 打印  發(fā)E-mail給: 
    
 


【資料圖】

當?shù)弥聜€月就要告別親手創(chuàng)建的新冠疫情儀表盤,董恩盛五味雜陳,他在朋友圈寫道:感謝大家的關注與支持!愿全球疫情早日完全結束!

疫情該翻頁了。就在2月,美國約翰·霍普金斯大學(JHU)通告稱,該校于2020年1月開發(fā)的用于跟蹤新冠疫情的儀表盤將于3月10日終止運作。

深黑底色點綴著或大或小的紅圈,左右兩側是各國確診病例、死亡和接種疫苗的數(shù)目,以及綠色、紅色或白色曲線,這個醒目的儀表盤讓全球在3年里實時看到了詳盡的、可視化的疫情地圖數(shù)據(jù)。2260億點擊,超過36億次瀏覽,這半年前的數(shù)據(jù)足以說明其影響力。

標簽: Lauren Gardner

關閉
新聞速遞