命運攸關的時刻充滿戲劇性,在個人的一生及歷史的進程中都是難得出現的;這種時刻可能集中在某一天、某一時,甚至常常發生在某一分鐘,但它們的決定性影響超越時間。對于許東來說,這一分鐘,可能在志愿填報單上、在出國的飛機上、在1995年的那一場會議上。 ? 許東在密蘇里大學哥倫比亞分校生活了二十年。 2003年,38歲的許東來到該校計算機科學系,開始了他第一份教職。這也是他近二十年來唯一一份教職。許東在這所學校安了家,做起科研,2007年成為了該校最年輕的系主任。 這所學校坐落在美國密蘇里州的第四大城市哥倫比亞。因為所處土地廣闊,農業發達,被稱為美國中部大農村,得名“哥村”。 許東總說,自己是被這座小城留住,研究了半輩子的生物信息學。
這些年里,許東主動投入到跨學科研究風潮中,先后為蛋白質結構預測、單細胞數據分析、DNA序列、蛋白序列分析、系統生物學建模、圖像文本分析、中醫舌相、分子動力學模擬等,做出了每個時期好用的算法工具。 2001年,許東憑借蛋白質結構預測工具——Prospect,與好友徐鷹(現任佐治亞大學校董事會教授)共同獲得《R&D》100獎。該獎項由《R&D Magazine》1963年創設,被國際科技領域譽為科技界的“創新奧斯卡獎”。 此后,許東又在2015年和2020年接連當選美國科學促進會(AAAS)會士和美國醫學與生物工程院(AIMBE)會士,并成為了密蘇里大學的校董事會教授。 ? 這些高光時刻,映射了他人生中的黃金三十年。 二十五年前,他趟過生物信息學泡沫期;十五年前,他成為密大最年輕的系主任;十年前,他先于大多數人換到深度學習賽道。 在那些時刻,許東大放異彩。正如茨威格在《人類群星閃耀時》的第一章“巴爾博亞發現太平洋” 中寫到:人生中最大的幸事,莫過于在富于創造力的壯年發現了自己的使命。
18歲的決定:
寧選北大,不去清華“教育是一個很特殊的行業,很難高質量地批量生產,培養一個人效率低、成才的確定性也不高?!?站在父母的高起點上,許東對這句話深有體會。 新中國成立后四五年里,許東父母考入清華,就讀于電子工程系。 隨后,父親留在了本校,在工程力學系(現航天航空學院)任教,并于1981年在國家支持下赴丹麥讀博,成為了中國最早出國研究流體力學的一批人。母親則去了北京燈泡二廠、燈泡總廠擔任廠長,并在八九十年代擔任了十多年的北京電光源研究所所長。 這是一個標準的知識分子家庭,許東稱,雖算不上大戶人家,倒有機會從小接觸到教授級的叔叔阿姨。 回憶起來,許東覺得那是一種無差別的人際交往,“絕想不到其中一個人就是某一領域的領軍人物?!?但許東沒去清華,而是選擇了北大。相比于清華的工程師氣息,北大要更加自由,尤其是北大沒有校訓,沒有校歌,甚至北大校園中的標志性湖泊,也被錢穆先生帶頭喚為“未名湖”。 在許東看來,這代表了北大上上下下的一種求學態度,要敢于不合群,不聽話、既要批判,也要兼容,做中國維新圖強的“先鋒者”。 1983年,十八歲的許東走進了北大物理系。
這是在中國高校中設立的第一個物理系。許東入校時,北大物理系已經走過70年歲月,期間還誕生了四個首創學科,如我國第一個原子能人才培養基地——物理研究室、我國第一個半導體專業、我國第一個地球物理專業、我國第一個計算機系微電子專業。 而與北大頗有淵源的西南聯合大學物理系,也走出了李政道、楊振寧、朱光亞、鄧稼先、黃昆等一大批杰出科學家。 這是許東第一次感受到國內學科的昂揚姿態,“原來中國人在物理方面做得很好,我也躍躍欲試?!?一進大學,許東被各種“奇奇怪怪”的研究吸引住。大一上學期快要結束時,他無意中看到學生宿舍里貼著一個告示——“自然之謎研究會,研究氣功、特異功能等人體科學現象”。 許東對這些神奇現象特別好奇,加上告示中寫到能夠去北京師范學院(現首都師范大學)做研究特異功能的實驗,當即報上了名。 大一寒假,許東都泡在了實驗室。盡管沒有研究出什么名堂,但許東卻產生了非常多的奇思妙想,還寫成了一份挺長的實驗報告,全文論證人體特異現象的真實性和其中的問題。
1983年寒假,許東(前排左二)在北京師范學院和部分研究人員及特異功能人士合影 為此,許東還擔任了一屆的自然之謎研究會會長。 80年代前后,人體特異現象研究方興未艾,時任國防科委科技委副主任的錢學森和主任張震寰兩位,都是特異功能現象的支持者與參與者。 尤其是錢學森,他認為,人還沒有能動地去發掘人體的潛在能力,今后應該用現代科學技術進行研究,對中醫理論、氣功、特異功能等,都要科學地進行研究。
那段時間,各種人體特異功能研究會成立,從科學界到醫學界,一場關于人類生命現象的研究開始風靡全國。北大加入了這場研究中,由許東所在的協會協助承辦了人體特異功能的表演,錢學森到場觀看。 這之后,許東對生命現象的研究熱情更加高漲,他對很多同學講到,“我跟錢學森握過手了,雖然沒說過話?!?/p>
1983年錢學森成立人體特異功能研究所,與90年代的氣功熱
但許東沒想到,到了90年代,“氣功熱”出現神論傾向,冒出了氣功治病、滅火、攔截核武器等言論,學術研究也受此波及,被視為偽科學研究。 1994年,國家下達《關于加強科學普及工作的若干意見》,一部分嘗試用現代科學做出解釋的科學家就此偃旗息鼓。 給許東講授固體物理課的嚴守勝教授,也曾勸大家不要研究這個方向。他講到,布賴恩·約瑟夫森三十歲出頭就拿了物理學諾貝爾獎,之后專注于超自然神秘現象研究,卻一生沒有實質性的進展。 這也讓許東決定留在北大繼續做物理研究。他被保送碩士研究生,選擇了固體物理方向,師從磁學研究的導師周文生教授。 在周教授的指導下,許東將研究放在了固體物理中一個基礎問題——自旋玻璃。
簡單來說,自旋玻璃理論研究的是物理學中的復雜系統,對于理解無序自旋相互作用系統發揮了非常重要的作用,近年來該理論框架為約束滿足、組合優化、統計推斷、神經網絡等理論研究提供了眾多啟發。 但在當時,自旋玻璃更多體現在陶瓷、高溫超導等應用領域,需要用到大量的實驗研究,記錄不同陶瓷所用的配方,測量陶瓷的屬性。
許東將其描述為“工匠型”研究,每天就是燒爐子、測材料屬性。他發現自己的動手能力不強,實驗做得不好,還把老師的儀器弄壞了。 回憶起那段經歷,許東稱,“我最大的實驗結論,就是我不適合做實驗?!?既然實驗不成功,許東也不再硬著頭皮做,他開始想著兌現自己的理論天賦,經常在碩士論文中順著幾個實驗結果自我發揮,寫出十幾張紙的理論猜想。 在導師看來,這些猜想毫無根據,多次提醒許東不需要寫進畢業論文,許東就在草稿上繼續寫。現在看來,盡管那些猜想稱不上科研,甚至沒什么價值,卻在無意中鍛煉了許東舉一反三、觸類旁通的能力。 這是一種天賦,冥冥之中決定了他將終生與理論研究打交道。
一生中最重要的導師
許東博士就讀于美國的伊利諾伊大學厄巴納—香檳分校(University of Illinois at Urbana-Champaign,UIUC),但前面還有段小序曲。 1990年,許東碩士畢業后,來到美國紐約市立大學皇后學院讀起了物理博士。但因為當時女朋友(現在的妻子)讀研選在了UIUC,許東果斷轉校。次年5月,許東向西出發,跨越千里與愛人會和。 他與妻子在北大結識,妻子就讀于化學系,比他小三屆,兩人從相戀時就約定去更遠的地方,從北大到UIUC,兩所學校成了二人從相識到婚姻的重要見證。 這段經歷有一位見證人——許東的博士導師Klaus J. Schulten教授,也是許東一生中最重要的一位導師。
Klaus J. Schulten教授
Klaus是一位理論物理學家、也是一位計算生物學家,博士師從諾貝獎獲得者Martin Karplus(從學術脈絡上看,現在深圳灣實驗室周耀旗的博士后導師也是Martin Karplus,與許東一脈相承)。 早在1978年,Klaus就較為完整地描述了磁感應和動物遷徙的Radical Pair假說(也稱為化學指南針假說),此后便投身到生物學領域。1991年許東加入時,Klaus實驗室已經非?;钴S,他本人是UIUC里最搶手的導師之一。
許東的導師首選是Klaus。但進入Klaus組里,許東覺得多少沾了些運氣。 UIUC有一個重要的導師雙選機制,學生可以和許多導師單獨見面,由學生提交5個導師的排序志愿,導師也排序選擇5個和他(她)見過面的學生交到系里,由系里協調分配。
所以,這份實力和運氣兼具的選擇機制總會伴隨意外和驚喜。 談到被選的原因,許東猜測,或許是自己初到UIUC時一次性通過了博士資格考試,一下子讓Klaus注意到了。但其他同學就沒有這么幸運了,很多美國同學在這場入學考試中表現吃力,或者沒有參加,兩次補考也有一半的博士生沒有通過考試,被降為了碩士。 時至今日,談起選擇導師時的經歷,許東還深有感慨,“我們是選擇了彼此,夸張點說,師生關系對職業的發展可能不亞于配偶關系?!?/p>
許東博士畢業時和Klaus J. Schulten教授的合影
進了Klaus組之后,許東在校內的貝克曼研究所(Beckman Institute)做研究。這是伊利諾伊大學里一棟專門為跨學科研究而建設的大樓,主要集中在工程和物理科學、生命和行為科學方面的研究,超越了當時眾多傳統大學在組織和結構方面所存在的眾多內在局限性,一切服務于跨學科交流。 在那里,許東第一次同時運用起“生物、計算機、物理”三門學科的知識。 對許東來講,最難的還是補上生物的背景。組里的同學一起成立了“學習小組”,一起讀沃森等人寫的《細胞分子生物學》一書,每人輪流負責主講一章,相互交流學習筆記。只用了半年,許東連同組的同學,都補上了生物知識。 從事交叉學科研究仍不輕松。那個年代的學術界有一種說法:只有在本領域做得不好的人,或者在本領域做到了天花板,才會轉向交叉學科。
90年代初,生物信息學甚至不能被看作一門學科,Klaus所領導的小組對外也是自稱為“理論生物物理研究組”。 許東談到,他所認識的物理系同學中,轉向生物物理的人并不多,甚至有人不理解許東的轉行。但許東相信自己的選擇,導師Klaus就是一顆定心丸。他也曾在父親多年的流體力學研究中,感受過交叉學科的魅力。 對于走上生物信息學這條路,他只做出過一次解釋,“就像在計算機上設計波音777飛機,可以先根據數據建立模型并預測結果,等確定設計無誤,再實際建構飛機,既省力、省時,也省錢。同樣的道理,生物信息學剛剛起步,主要結合生物、計算機、統計三門學科的知識,發展計算軟件,用來分析生物數據、建立模型、預測結果,從而輔助設計藥物,或者改良農作物。” 這種說法遭到嘲笑,許東確實遇到了一些問題。
他研究的是當時最火的蛋白質結構的分子動力學問題,簡而言之就是研究蛋白質怎么運動。由于蛋白質的生物功能與結構動力學特征緊密相關,并且其研究對象為蛋白質分子個體,所以也是一門與分子生物學互補的研究。 但在90年代初,計算機內存容量太小,用計算機模擬分子運動常常受限,算力局限導致能做的事情也不是特別多。許東稱,“當時最好的機器才一個G,學生們都要搶著用,這與現在用云平臺模擬出來的效果不能相提并論。” 在那個環境下,但他與導師做的第一個工作——《光合反應中心蛋白質運動與電子轉移的耦合:在自旋玻色子模型框架下研究低溫行為》,發揮理論研究優勢。 許東借鑒了系里另一位教授安東尼·萊格特(2003年諾貝爾物理獎得主)的自旋波色子理論,在量子力學的知識體系下做出了一個新的理論模型,細致解釋了光和反應中電子在蛋白質里電子傳遞的現象,在領域內得到了高度認可。 直到許東畢業十幾年后,Klaus還會經常提到許東的這項研究。
此后,在與導師的合作中,許東接連發出了9篇論文,其中6篇發布于1995年,與當時最火的分子動力學、活細胞中超分子系統等領域相關。 回憶起那段時光,許東稱,在學術上對他影響最大的人就是Klaus,在遇到Klaus之前,他的理論天賦被隱匿以來,甚至不能寫在論文中,他一度質疑什么才算是真正的科研。直到遇到Klaus,許東才有種找到了科研大門的感覺。 許東至今對一個場景印象深刻:半夜兩點鐘,Klaus為了一篇論文把許東叫到家里改稿,尖銳的點評與詳細的建議劈頭蓋臉般地過來,一直改到他滿意為止。 “我就是在批評中成長起來的。世界上有一些領域可以自無師自通,但在科研上,我還沒有見過誰是自學成才的,每一個真正會做科研的人,至少是被另一個科研高手口傳心授、精心調教,才能入得了科研的門?!?所以,Klaus屬于那種“嚴父型”的教授,但他對學生卻不乏真誠的關心和驕傲。在他的實驗室里有一面特殊的墻,上面掛滿了學生們的論文封面,一一做了裝裱。
在許東的印象中,Klaus每天只睡4個小時,從不鍛煉、從不養生,卻能每周高效率地工作上百小時。 2016年,Klaus去世。許東回到那所實驗室,對墻感嘆,“或許我一生都到不了Klaus那樣的高度,他完全是用生命做科研?!?葬禮那天,在西式的吊唁中,歡聲笑語與掩面拭淚同步進行。Klaus在遺言中留給大家的最后一句話——“我不喜歡你們這樣消沉,打起精神,還是像過去那樣想起我。” 回顧起與導師相處的那四年,許東說到,Klaus是最感染自己的是他對自然與生命之美的洞察與摯愛。 Klaus把自己大分子模擬的工作當成“分子顯微鏡”。他告訴朋友,生命之大美不僅僅在春天歡快的小鹿身上和秋天斑斕的落葉里面,也在我們肉眼看不到的生物大分子中間。他雖然不在了,他的學生們會繼續他的事業,去探索更多的生命之美。 直到現在,許東也堅信,Klaus是他人生中最重要的一位老師。
90年代的生信研究“寒武紀”
1990年10月,經美國國會批準的人類基因組計劃正式啟動。 這項大約耗資30億美元來測定30億個堿基對的國際計劃,從美國迅速席卷到英、日、法、德、中等國家。與此同時,這項研究也從多國政府間的合作小組,分散到諸多私營性質的基因研究機構中。 其中,最具代表性的就是文特爾(J. C. Venter)創立了塞萊拉基因公司,并用1991年提出的“散彈法”新型測序技術,多次走到“國際人類基因計劃”的前面。 一場公私之間的科研賽跑,在三十年前拉開帷幕。 1994年,由美國科學家約翰·莫爾特(John Moult)發起的全球蛋白質結構預測競賽(CASP),召集科研界所有人士,開始了真正的較量。 這個兩年舉辦一次的競賽,一亮相便吸引了計算機科學、生物物理學等不同領域的專家參與到蛋白質三維結構預測中。在那個年代,基因測序和蛋白質結構預測如火如荼,生物信息學(Bioinformatics)也成為了一門正式學科。
那是波詭云譎的90年代,一段即將進入生命科學時代的“寒武紀大爆發”。 許東所在的貝克曼研究所,就站在了浪潮最前沿。1993年,在那所大樓第五層的國家超級計算機應用中心(NCSA)中誕生的Mosaic瀏覽器,迅速在整棟大樓中傳開。 這樣一個純粹好玩兒的作品,成為點燃后來互聯網熱潮的火種之一。后來,網景導航者瀏覽器的開發工作,聘用了許多原有的Mosaic瀏覽器工程師,但是沒有采用Mosaic網頁瀏覽器的任何代碼。傳承網景瀏覽器代碼的后裔為Firefox瀏覽器。 在計算機技術的支持下,生物信息學迎來第一次黃金期,成為當時的前沿學科之一。 1995年,許東博士畢業。他來到美國國立衛生研究院的國家癌癥研究所,拿到了一份博士后工作。 “在美國走學術這條路必須要讀博士后,Ruth Nussinov做的是蛋白的相互作用,我就進了她的組?!?/p>
許東在博士后辦公室里工作
測序工作與生物信息學大火,帶動了工業界對人才的渴求。在拜師Ruth門下時,許東曾看到一個制藥公司一口氣招了80多個生物信息學背景的人——全職。 甚至一家公司獵頭打電話找到許東,開出了他博士后的三倍薪資,“會寫C(語言)就夠了,你還會用BLAST工具(生物大分子序列比對搜索工具),明天就來上班?!?許東至今仍對那段時期印象深刻,盡管已經走上進了學術的大門,但依舊有不少公司想讓他加入。 去公司拿高額薪水,還是只拿三分之一做博士后?這個問題,事關內心最真實的選擇。 幫許東做決定的,是一場會議。 這場會議由美國國立衛生研究院舉辦,邀請知名學者做分享,其中三位就是后來的2013年諾貝爾獎得主——Martin Karplus、Michael Levitt、Arieh Warshel。 當天,許東趕到現場。他忘了那三位學者說了什么,但他對臺上三個人侃侃而談的樣子記憶猶新。
那種感覺讓他心動,有幾秒鐘讓他好像看到自己未來的樣子。 那一晚從會議里走出來,許東心里有了答案。 許東把希望放在了新的研究領域。此前在分子動力學領域,他經常受限于動力學的模擬時間,只能做小部分的生物學問題。現在跳出來后,他想試試能不能做一些更廣譜的問題。 談起導師Ruth,許東稱她是一位極具科研情懷的科學家,并且身為一位以色列女性學者,科研道路十分奇妙:Ruth在碩士畢業后做了八年的全職母親,而后跟隨丈夫來美國伴讀,突然萌生了對生物化學的興趣,才再讀了博士、博士后,走上了學術道路。 許東表示,許多科學家對科研都有真愛,但Ruth對科研的鐘愛與專注程度相當罕見,她對RNA、毒物蛋白的工作精益求精,要求極高。
Ruth Nussinov教授
Ruth曾在1978年提出了用于RNA二級結構預測的動態規劃算法(Nussinov Algorithm),迄今該算法及其變種仍在業內廣泛使用,是生物信息學課程中常談到的方法。 另外,她挑戰了生物化學教科書中長達半個世紀倡導的生物大分子識別理論(誘導擬合機制),許東讀研究生時學的就是這一理論,那時被告知生物大分子就像變形金剛一樣可以粘到別的分子上,至于怎么變形及如何被驅動一直眾說紛紜,沒有靠譜的解釋。 直到九十年代后期,Ruth用構象分布與選擇替代的理論成功解釋了許多分子識別的現象,并得到同行越來越多的支持,一舉改寫了教科書。 回憶起和Ruth相處的那兩年,許東能想起很多場景。
一天,許東做了一個小工作,想找個低端點的雜志草草發了。但和Ruth討論好,并迅速寫好文章交給她后,Ruth并沒有像以往一樣馬上給許東改文章,而是直接退了回來。 Ruth找到許東說,不能因為低分雜志就不認真。接下來的日子,她和許東一起反復推敲科研細節,文章也是改了又改,最終那篇文章(《蛋白質相互作用界面的氫鍵和鹽橋》)沒有少花時間,卻成為了一篇高被引的論文(被引五百余次)。 還有一次,許東和Ruth一起到香港一所大學做大會主題報告,許東提議兩人出去轉一轉,以盡地主之誼,卻遭到了Ruth的一口回絕,“我沒時間,做完講座要馬上返程了,有太多的工作等著我呢。” 此后多年,許東慢慢跳出了分子動力學和生物大分子的研究范圍,與Klaus以及Ruth的研究漸行漸遠,但要說從Klaus和Ruth身上傳承到什么,那就是想象力和精益求精。
“他們從不想著自己要老了,無所謂了,總覺得還有非常多的未知要解開。你會看到,他們的學術生命都很長,一生都未退休。” 博士后結束的二十多年后,許東仍對導師充滿敬佩,他在朋友圈歷數Ruth過往,并在最后寫下了一段話: 對于基礎科學工作者來說,最高的成就莫過于把自己的學說寫在教科書上,或者將自己的姓氏冠名于某個定理、算法,能做到其中之一的在學術界都是鳳毛麟角,Ruth卻把兩件事都做到了。
1997年6月,許東博士后工作結束,注意到橡樹嶺國家實驗室的一份招人廣告——需要生物背景,從事蛋白質結構預測。 “這份工作很合適我,雖然不是一份教職,但也不是去了工業界,算是找到了一份折中又適合的工作?!?把許東招進來的,正是擔任蛋白質折疊項目組長的徐鷹。彼時,徐鷹剛剛從橡樹嶺的數學與計算機科學部轉到生命科學部。他們一拍即合,徐鷹偏數學計算背景,許東偏生物物理背景,而橡樹嶺的另一位研究員——俄國數學家Victor Olman博士,則具備統計學背景。 1997年,他們組成了橡樹嶺的“三劍客”,在此后的6年時間里,合作了40多篇論文,在蛋白質結構預測領域打出了名堂。
許東、徐鷹2001年在R&D100的領獎儀式上
那段時間里,許東和徐鷹還一起做出了那個時代中最好的蛋白三維結構預測工具——Prospect,在人類基因組測序中刻下了重要一筆。2001年,兩人以此拿下R&D100獎,在新世紀初拿下開頭彩。 橡樹嶺實驗室坐落在山溝溝里,偏僻冷清卻環境優美,是個安心做學問的好地方。 “在那里,收獲的不僅僅是科研論文,更是一種經歷,對國家實驗室如何運作,科研水平有了更深入的了解。實驗室提倡科研合作,也逐漸學會與他人相處、共同進步?!?2003年實驗室改組后,限于經費問題,原生命科學部大部分人去了工業界,許東和其他人也各自踏上了教職之路。
當最年輕的系主任遇上深度學習
許東一行人是幸運的,這群從橡樹嶺出來的人在美國高校大受歡迎。 新世紀初,幾乎所有高校都在建設生物信息研究所,徐鷹最終去到佐治亞大學,成為了該校生信研究所的首任所長,并拉去了Victor Olman,兩人繼續共事。 許東則去了密蘇里大學的哥倫比亞分校(University of Missouri,Columbia,下稱“密大”)。 2003年8月,許東以計算機科學系副教授、James C. Dowell講座副教授,以及Christopher S. Bond生命科學中心研究員的身份,被正式引進到該校。 而他將在這個被稱為“哥村”的地方,一待近二十年。 2007年底,42歲的許東擔任該校計算機科學系的系主任,成為了密大所有系主任中最年輕的一位。這是許東人生中的一個重要時刻,也是在美國高校管理人員中為數不多的華人面孔。
?
2007年,許東任職系主任時留影 在這個非母語環境中,許東不善言辭,但這次任職,卻收獲了全院的支持。 許東說到,“如果要說我有什么合適的地方,或許是我學問做得還不錯,文章比較多,更重要的是,大家覺得我不會借機給自己謀什么福利?!?上任第一件事,就是設計課程。許東在橡樹嶺這所千人實驗室的經歷派上了用場。他考慮了系內近20名教授的專長,準備將研究方向集中于三個領域,分別為網絡、多媒體、生物信息。 許東認為,計算機學科領域太廣,必須專精才能突出?!爱敃r的密大計算機系有50名博士生,人力資源豐富,如果善加整合,提供明確研究方向,必能協助教授,做出量多質佳的研究,提高計算機系的整體素質?!?許東將學術機構則比作私人企業,學術合作的關鍵在于最后的產值,而系主任就是拉拉隊鼓舞士氣,讓團隊有最好表現。 那些年里,許東也長期奔走在國內高校,一邊做學術講座,一邊推動國內大學與密蘇里大學3+2、2+2等聯合培養項目。許東回憶,他跑遍了中國幾十所雙一流高校,回國次數不計其數。 特別是吉林大學,他每年都去講學,并擔任過大約十年的唐敖慶客座教授,和許多的老師同學建立了深厚的友誼,合作發了幾十篇論文。比如,時任吉林大學計算機學院副院長的梁艷春教授,也有十年每年到密蘇里大學許東的實驗室訪問、合作。
2015年許東到西安電子科技大學訪問交流(右四),近年許東和梁艷春教授在密蘇里河畔 在擔任系主任的那段時間,許東參加了很多的領導培訓課程,看到課件上將領導人打上四類標簽:冒險型、守成型、改革型和善后型。 許東沒想那么多,“天底下很多東西都有專業,但做領導是沒有專業的,沒有誰見到哪個系科是專門培養領導的,就算是MBA,教的也是金融的東西?!?他反而覺得,不如從過去的經歷中找養分,看看能不能把一個系管理得井井有條。直到2016年,密大計算機系與電機系合并,許東十年的系主任正式卸任。
2022年8月的Digital Biology Lab
這十年里,學校資源沒有大幅擴大,許東所在的計算機系師資穩定在16~18人,學生人數卻增加了一倍(從2007年的279人到2016年的700多人),科研經費也增加了一倍。 而他自己的實驗室(Digital Biology Lab),也從2003成立初的七個人,到如今他直接指導13個博士生,還有一些職員和不少的碩士、本科生,在實驗室待過三個月以上的成員前后有兩百多人,其中三十幾位目前在中國國內任教職。
2018年,許東(右五)實驗室15周年慶?;顒恿粲?/p>
此外,許東的一個重要工作,是2012年密大的BS-CS課程通過了美國工程與技術認證委員會(ABET)的正式認證。如此一來,國內外的密大訪學人員便獲得了中美兩國的雙向學位認證。 去年,許東與兒子騎行到密蘇里州最大的毛刺橡樹那里,在那棵哥村的地標大橡樹下,許東回憶起過去的點點滴滴。 他對兒子講到,“過去十幾年,密大接待了很多國內的學生和學者,許多人在神樹下打卡紀念,這棵樹陪伴了他們的重要時刻??鋸堻c說,這棵樹就是中美友好的見證,我希望越來越多的人到這棵神樹下打卡?!?2012年,是許東學術生涯中的一個重要轉折。此時,距離Alphafold運用深度學習算法在生物信息學領域一炮而紅還有6年。 這一年,學術界發生了一件大事。
在李飛飛號召的ImageNet競賽中,多倫多大學的Geoffrey Hinton、Ilya Sutskever和Alex Krizhevsky提出了一種深度卷積神經網絡結構:AlexNet,奪得了ImageNet冠軍,成績比當時的第二名高出一大截。 競賽結束后,一場關于深度學習算法的討論在學術界傳開。 業內有種聲音,如果這種使用大規模數據集所做出的決策結果是真實的,那么它將走出計算機視覺、神經語言處理和語音識別等子領域的研究困境,就連生物信息學領域的蛋白質結構預測、基因測序等問題也都迎刃而解。 但在當時,大多數人對此持強烈的懷疑和批判態度,“深度學習無非是大號的神經網絡,換個馬甲而已,結果也是作弊來的。” 這種想法不無道理。許東稱,當時深度學習在決策準確度上一舉增加了10個點。在此之前,無數學者在十幾年的研究過程中,每年幾乎都是0.1%式的、非常微弱的進步。 因此,對于辛苦鉆研的學者來說,深度學習的碾壓式進步會讓他們產生一種深深的“無力感”,甚至會產生一種難以言說的憤怒。 兩股思潮的碰撞,許東身在密蘇里州也聽到各種聲音。 密蘇里州一直以來都因為“show me state”出名,意為“索證之州”。許東把所有的細節都看了一遍,也讓組里的人也測試深度學習。結果不出所料,深度學習在幾個生物信息學的問題上有很大的提高。
2012年,許東不顧所有人的質疑轉向了深度學習,這是他人生中第二個重要時刻。 此后,許東的課題組把深度學習在生物、醫學上的應用作為第一研究方向,合作對象也從本系擴大到美國、中國高校。在深度學習的影響下,許東關注到農業植物作物、中醫研究、單細胞數據分析、蛋白的分析、修飾、定位,結構預測等其他領域的課題。 過去三年,許東第一大合作對象是俄亥俄州立大學的馬勤教授,基于深度學習做單細胞基因測序的問題上發表了7篇有影響的文章。 許東的課題變化依然有,但主線已放在了深度學習上。
許東最直觀的感受是,跳出原有的分子動力學模擬的框架后,反而做的東西更多了,合作對象也更多了。一個顯著特點是,過去二十多年,許東所發表的論文中,作者少則四五人,多則十幾人,合著期刊論文近300篇,會議論文和著作章節共計超百篇。 在不同時刻,許東與不同人結成戰友,迅速沖到科研落地最前線,而他自己,也從一名物理學者,逐漸蛻變為生物物理學者、再到生物信息學者。 許東坦言,“我們做交叉學科,誰都無法把一個問題的方方面面都解決,所以需要很多合作,在我身上就非常明顯?!?許東的老友徐鷹也講過,許東做出了非常多的計算工具,如果沒有他的生物物理背景,是做不出來的。 在許東的理解里,他并不覺得自己成了“工具人”,而是在那些合作中,和別人一起成就更多的事,而不是把研究僅僅當作飯碗或工作量。 同是物理出身,后轉向理論生命科學研究的郝柏林院士也曾講過,“要想做生物,不能當票友,這是一個義無反顧、全心全意研究生物的“中心” ,而不是出身物理學的人參與一些生物學的問題?!?/p>
給18歲的許東一個答案
在密大做研究,許東已經不知不覺做了二十年了。 他每天七點起床,十二點前睡覺,每周都要審一篇稿,并且花大量的時間(包括周末和晚上)和組員及合作者討論科研,這是許東二十多年來的常態。 這些年來,許東好像沒什么變化,他也同樣對外界充滿新鮮感。 他愛拍照,出門時常帶著一臺相機,習慣將鏡頭對向自己之外的人。在他那里,好像隨時能將視角切換到其他人,永遠都有一種置身事外的能力。 對于許東個體和科研總體而言,時常的“局外人”身份具有重要的意義,科學研究不能總以自己的位置作為參照,要時不時跳出來,在復雜多變的現象中看清最深刻自然的本質。
正是如此,在過去三十多年的時間里,許東趟過了生物信息學的泡沫期,與導師在那棟交叉研究大樓一起拼搏、與橡樹嶺同事們組成了生物信息學三劍客、又在密大親身推動了交叉學科的建設、最后在漫長的科技長河中,找到了深度學習這對船槳。 人過半百,許東還在做著他最喜歡的交叉學科研究。或許這也是即將58歲的許東,要給18歲的自己的一個回答。 最后,許東談到自己,說到,“或許我永遠做不到Klaus、Martin Karplus、Ruth那樣的頂流?!?他停頓了一下,“但我會延續他們的學術熱情,抻長我的學術生命,始終站在科研的一線?!?/p>
作者注: 1993年,中國參與人類基因組計劃,生物信息學科迎來大爆發。 在近三十年的時間里,一大批生物、化學、物理、計算等專業的學者,前仆后繼加入到學科的產研建設,那是一個靈感迸發、情誼綿長的年代,也是一個走出質疑、迷茫的年代。 目前,雷峰網啟動《生物信息學的三十年往事》專題,將陸續推出徐鷹、潘毅、周耀旗、許東、唐建等新老學者的人物故事,記錄光輝歲月,以照后人之路。
編輯:黃飛
評論
查看更多