AI正在大爆發(fā),但總體而言,按單位成本投入和人均成果來看,科學發(fā)現(xiàn)的效率正在下降:諾獎獲得者的年齡提高了10歲、一個重要發(fā)現(xiàn)需要數(shù)十人的努力。究竟是哪里出了問題?
“科學發(fā)現(xiàn)才是唯一的新聞”。
這是作家斯圖爾特·布蘭德(Stewart Brand)的一句名言。
雖然新聞內容由政治、經濟和娛樂八卦主導,但科學和技術才是人類福祉和文明長期進步的基礎。現(xiàn)在,無論是科學家的數(shù)量、科學資助的規(guī)模,還是發(fā)表的科學論文數(shù)量,都比以前有大幅提升,因此也推動著人類各項事業(yè)的繁榮。
從表面上看,這無疑是令人鼓舞的。但是,在這些指標迅速增長的同時,我們對科學的理解是否取得了與之相應的進步?還是我們僅僅為了維持(甚至降低)科學進步的速度本身,投入了更多的資源?
《大西洋月刊》The Atlantic最近發(fā)布了一篇題為“Science Is Getting Less Bang for Its Buck”的文章,認為雖然像AI或者基因編輯這樣的科技正在大爆發(fā),但總體而言,科學發(fā)現(xiàn)的效率正在降低。
文章主要有幾個有趣的觀點:
自1990年以來的成果很少獲諾獎,自1990年以來的成果僅獲得三次諾貝爾獎。
在諾貝爾獎的早期,科學家獲獎的平均只有37歲,而現(xiàn)在則到了平均47歲。
原子核被發(fā)現(xiàn)的時候,論文作者只有一位;希格斯粒子在2012年被發(fā)現(xiàn)的時候,相關的兩篇論文各自擁有大約1000名作者。
AI和基因編輯技術大爆發(fā),但按單位成本或人均指標來看,科學研究的效率正在下降。
為什么科學發(fā)現(xiàn)會變得如此昂貴和“低效”?
諾貝爾獎有偏見?強烈偏向早期研究成果,1990年代獲獎較少
《大西洋月刊》進行了一項調查,要求科學家們比較其所在領域的諾貝爾獎獲獎成果,然后使用這些排名信息,來確定科學家們對諾貝爾獎獲獎成果的質量在過去幾十年中的變化情況。
對于物理學獎,《大西洋月刊》調查了來自世界頂級學術物理系的93位物理學家(根據(jù)上海世界大學排名),請他們判斷了1370對發(fā)現(xiàn)。
下圖中的條形圖顯示了每十年的諾獎發(fā)現(xiàn)的評分。得分越高,說明評分者認為這個時段的發(fā)現(xiàn)比其他時段的發(fā)現(xiàn)更重要的可能性越大。請注意,統(tǒng)計是按發(fā)現(xiàn)的年份,而不是獲獎年份。
20世紀的頭十年的表現(xiàn)不盡如人意。這十年中,諾貝爾獎委員會仍在探索這個獎項獎勵的是什么。比如現(xiàn)在有一個獎項,頒發(fā)給了能夠更好地照亮海面的燈塔和浮標。如果你在船上航行,這無疑是個好消息,但它與現(xiàn)代物理學的關系不大。在20世紀最初十年,諾貝爾物理獎大多獲獎成果符合現(xiàn)代物理的概念。
從1910年,到20世紀30年代是物理學發(fā)展的黃金時代。這是量子力學的時代,量子力學是有史以來最偉大的科學發(fā)現(xiàn)之一,從根本上改變了我們對現(xiàn)實的理解。量子力學還引發(fā)了了其他幾項革命:X射線晶體學的發(fā)明,讓我們得以探索原子世界。中子和反物質被發(fā)現(xiàn)。關于放射性和核力量的許多基本事實被發(fā)現(xiàn)。這是科學史上的最偉大的時期之一。
在此之后,評分出現(xiàn)了大幅下降,直到20世紀60年代出現(xiàn)部分回升。這主要是由于兩個發(fā)現(xiàn):宇宙 - 微波 - 背景輻射,以及粒子物理學的標準模型的建立,讓我們發(fā)現(xiàn)了構成宇宙的基本粒子和力的最佳理論。即使憑借這些發(fā)現(xiàn),從20世紀40年代到80年代,物理學家對這期間的諾獎成果的評價都要比從1910年代到1930年代中最低的十年評分更低。
圖表數(shù)據(jù)截止到在20世紀80年代末。原因在于,近年來,諾貝爾獎委員會更愿意為產生于上世紀70-80年代的成果頒獎。事實上,自1990年以來的成果僅獲得三次諾貝爾獎。這個數(shù)量太少了,無法對20世紀90年代的發(fā)現(xiàn)進行高質量的估計,因此我們沒有對這些成果進行調查。
然而,自1990年以來的成果很少獲獎這個事實本身就具有啟發(fā)性。諾貝爾獎委員會傾向于跳過這幾十年,為誕生時間更早的成果頒獎。鑒于20世紀70-80年代本身看起來就并不那么好,這對物理學來說是個壞消息。
物理學表現(xiàn)不佳,或許其他領域的情況好一些?《大西洋月刊》對諾貝爾化學獎和諾貝爾生理學或醫(yī)學獎進行了類似的調查。以下是評分:
可以看到,結果比物理學獎稍好,在20世紀下半葉的評分比物理學獎可能略有改善。但與物理學獎一樣,20世紀90年代和2000年以后的成果被省略了,因為諾貝爾獎委員會強烈偏向早期的研究成果:在20世紀90年代和2000年代完成的成果的獎勵少于之前任何一個年代。
這項調查描繪出了一幅黯淡的場景:在過去的一個世紀里,我們大大增加了投入科學研究的時間和金錢,但在科學家自己的判斷中,我們取得最重要的新突破的速度基本保持不變。按單位成本或人均指標來看,科學研究的效率正在下降。
當然,有人可能會說,諾貝爾獎成果的質量與科學進步的總體速度不是一回事!
這項調查當然有很多局限之處:諾貝爾獎沒有包含一部分科學門類,特別是計算機科學等新興領域;諾貝爾獎委員會偶爾也會錯過重要的成果;也許一些偏見意味著科學家們更有可能尊重年頭更長的成果;也許更重要的是更大量的科學成果,即構成大部分的普通科學發(fā)現(xiàn)。
這些局限確實存在,但是,我們很快就會看到有證據(jù)表明,全面的、重要的科學發(fā)現(xiàn)變得越來越困難。這需要更大規(guī)模的團隊協(xié)作和更廣泛的科學訓練。
總之,這些結果表明,我們在科學上付出的努力,其回報率正在大幅下降。
科學家獲獎年齡增加近10歲,過于關注已確立的領域導致科學進展困難
除了領域的維度,還有其他維度。
經濟學家本杰明?瓊斯(Benjamin Jones)和布魯斯?溫伯格(Bruce Weinberg)研究了科學家們在做出重大發(fā)現(xiàn)時的年齡。
他們發(fā)現(xiàn),在諾貝爾獎的早期,科學家在獲得諾貝爾獎的時候平均只有37歲。但最近這一數(shù)字上升到平均47年,相當于科學家職業(yè)生涯的四分之一。
也許今天的科學家需要懂得更多的知識才能做出重大發(fā)現(xiàn)。因此,他們需要學習更長的時間,所以在較為年長的年齡才能完成他們最重要的工作。也就是說,偉大的發(fā)現(xiàn)越來越難以實現(xiàn),這就意味著它們的數(shù)量會減少,或者需要更多的努力。
同樣的道理,現(xiàn)在的科學合作所涉及的人數(shù)比一個世紀前要多得多。當歐內斯特·盧瑟福在1911年發(fā)現(xiàn)原子核的時候,他所發(fā)表的論文中,作者只有一位,那就是他自己。相比之下,希格斯粒子在2012年宣布被發(fā)現(xiàn)的時候,相關的兩篇論文各自擁有大約1000名作者。
平均而言,在20世紀,研究團隊的規(guī)模幾乎翻了兩番,而且這種增長一直持續(xù)到今天。對于許多研究問題,它需要更多的技能、昂貴的設備和一支龐大的團隊才能在今天取得進展。
如果科學變得越來越難是真的,為什么會這樣呢?
假設我們認為科學,類似于對新大陸的探索。在早期,人們對此知之甚少,探索者很容易地開始并發(fā)現(xiàn)主要的新特性,但他們逐漸填補了新大陸的知識。
要想有重大發(fā)現(xiàn),探險者必須在更加困難的條件下去更加偏遠的地區(qū),探索變得困難。按照這種觀點,科學是一個有限的前沿領域,需要付出更多的努力才能“填滿地圖”。總有一天地圖將接近完整,科學將在很大程度上被耗盡。從這個觀點來看,任何發(fā)現(xiàn)困難的增加都是科學知識結構本身固有的。
但是有一種不同的觀點,一種認為科學是無止境的,在這種觀點中總是有新的現(xiàn)象要發(fā)現(xiàn),有重大的新問題要回答。無限邊界的可能性是一種被稱為“出現(xiàn)(emergence)”想法的結果。
以水為例。用方程來描述單個水分子的行為是一回事。要理解為什么天空中會形成彩虹,或者海浪的撞擊,或者彗星的起源,則完全是另一回事。所有這些都是“水”,但處于不同的復雜程度。
行為的“出現(xiàn)”程度這一事實并不一定意味著會有無窮無盡的新現(xiàn)象有待發(fā)現(xiàn)、新的問題有待解答。但在某些領域,這似乎是可能的。
例如,計算機科學始于1936年,當時圖靈發(fā)明了數(shù)學模型,我們現(xiàn)在稱之為圖靈機。那個模型非常簡陋,幾乎像一個孩子的玩具。然而,這個模型在數(shù)學上等同于今天的計算機:計算機科學實際上是從它的“萬物理論”開始的。盡管如此,自那以后,它還是看到了許多非凡的發(fā)現(xiàn):諸如構成互聯(lián)網(wǎng)商業(yè)和加密貨幣基礎的加密協(xié)議等想法;編程語言設計中無窮無盡的美妙想法;更奇怪的是,最好的電子游戲中也有一些富有想象力的想法。
這些是計算機科學中的彩虹、海浪和彗星。更重要的是,到目前為止,我們的計算經驗表明,它確實是取之不盡用之不竭的,總是有可能發(fā)現(xiàn)美麗的新現(xiàn)象,新層次的行為,這些行為構成了新的基本問題,并產生了新的探究領域。計算機科學似乎是開放式的。
以類似的方式,隨著我們獲得編輯基因組、合成新生物體的能力,以及更好地理解生物體基因組與其形態(tài)和行為之間的關系,生物學領域可能會繼續(xù)出現(xiàn)新的前沿。類似的事情也可能發(fā)生在物理和化學領域,比如可編程物質和新的物質設計階段。在每一種情況下,新的現(xiàn)象都會以一種開放式的方式提出新的問題。
因此,樂觀的觀點認為,科學是一個無止境的前沿領域,我們將繼續(xù)發(fā)現(xiàn)甚至創(chuàng)造全新的領域,并提出自己的基本問題。如果我們今天看到增長放緩,那是因為科學仍然過于關注已確立的領域,而在這些領域,取得進展變得越來越困難。我們希望未來會有更多的新領域出現(xiàn),產生新的重大問題。這是科學加速發(fā)展的機會。
最好的時代還是最差的時代?AI和基因編輯技術正在大爆發(fā)
《大西洋月刊》內部在討論上述研究發(fā)現(xiàn)時,有不少人堅持認為科學正在經歷一個黃金時代。他們拿希格斯粒子和引力波的發(fā)現(xiàn)為例,以此作為“科學比以往任何時候都更好”的證據(jù)。
這些發(fā)現(xiàn)確實是驚人的發(fā)現(xiàn)。但前幾代人的發(fā)現(xiàn)也同樣引人注目。例如,將引力波的發(fā)現(xiàn)與1915年愛因斯坦廣義相對論的發(fā)現(xiàn)相比較,廣義相對論不僅預測了引力波,而且從根本上改變了我們對空間、時間、質量、能量和重力的理解。引力波的發(fā)現(xiàn)雖然在技術上給人留下了深刻的印象,但對改變我們對宇宙的理解卻沒有多大幫助。
盡管希格斯粒子的發(fā)現(xiàn)是了不起的,但與20世紀30年代發(fā)現(xiàn)的眾多粒子相比,它就相形見絀了。這些粒子包括我們日常生活的主要組成部分之一中子,以及正電子,后者首次揭開了反物質的神秘世界。從某種意義上說,希格斯粒子的發(fā)現(xiàn)是非凡的,因為它體現(xiàn)了20世紀上半葉常見的一種狀態(tài),但近幾十年來很少見。
另一種普遍的反應是,人們說科學比以往任何時候都好,因為他們自己的領域正在取得巨大的進步。比如現(xiàn)在經常聽到人工智能(AI)和crispr基因編輯技術。
但是,雖然人工智能、crispr和類似的領域的確在快速發(fā)展,不過如果放在整個現(xiàn)代科學史上觀察,一直存在著熱門或者更受歡迎的領域。
想想從1924年到1928年之間物理學的進步。在這段時間里,物理學家了解到物質的基本成分既有粒子又有波的性質;他們制定了量子力學的定律,導致了海森堡的不確定性原理;他們預測了反物質的存在等等。正如保羅·狄拉克(Paul Dirac)所說,在那個時代,“即使是二流物理學家也能做出一流的發(fā)現(xiàn)”。
相比之下,過去幾年人工智能的主要發(fā)現(xiàn),包括在識別圖像和人類語言能力上的提高,以及玩圍棋等游戲的能力,將在未來幾十年產生巨大的影響。但要產生這些成果,需要付出更多的時間、金錢和努力,而且,目前尚不清楚,它們是否比20世紀20年代揭示的現(xiàn)實重組更重要。
同樣,crispr在過去幾年也取得了許多突破,包括修改人類胚胎以糾正一種遺傳性心臟疾病,以及制造出能夠在整個蚊子種群中傳播瘧疾抗性基因的蚊子。但是,盡管這樣的實驗室原理證明是顯著的,crispr的長期潛力是巨大的,但最近的結果并不比過去生物學快速進步時期的結果更令人印象深刻。
70年代以來除了計算機和互聯(lián)網(wǎng),其他許多技術只是在改進
如果科學的收益遞減,這對我們的長期未來意味著什么呢? 是否會有更少的新科學見解來激發(fā)在過去一個世紀中重塑我們世界的新技術呢? 事實上,經濟學家認為這種情況正在發(fā)生,他們稱之為生產率放緩。
生產率的增長是經濟健康社會的一個標志,人們不斷創(chuàng)造出能夠提高財富創(chuàng)造能力的想法。壞消息是美國的生產率增長正在下降。自上世紀50年代以來,這一數(shù)字一直在下降,當時大約是今天的六倍。這意味著,在過去10年里,我們看到的變化與上世紀50年代18個月里的變化差不多。
這聽起來可能令人驚訝。在過去的幾十年里,我們沒有看到很多發(fā)明嗎?今天不是加速技術變革的黃金時代嗎?
經濟學家泰勒?考恩(Tyler Cowen)和羅伯特?戈登(Robert Gordon)辯稱,事實并非如此。在他們的著作《大停滯和美國成長的興衰》中,他們指出,20世紀初使用了許多強大的通用技術:電力、內燃機、無線電、電話、航空旅行、裝配線、化肥等等。
相比之下,他們整理的經濟數(shù)據(jù)表明,自上世紀70年代以來,情況幾乎沒有什么變化。是的,我們已經取得了與兩種強大的通用技術相關的進展:計算機和互聯(lián)網(wǎng),但其他許多技術只是在逐步改進。
是什么導致了生產率的下降?經濟學家對這一問題存在爭議,并提出了許多不同的答案。一些人認為,這僅僅是因為現(xiàn)有的生產率衡量方法不能很好地衡量新技術的影響。
《大西洋月刊》提出了另一種解釋,即在科學上的支出回報的減少導致了真正的生產率放緩。
但即使很難評估科學工作的重要性,《大西洋月刊》認為,仍有必要進行這樣的評估。
并不是說科學家需要強制的KPI,但社會需要依靠這些評估結果來獎勵科學發(fā)現(xiàn),并決定應雇用或資助哪些科學家。
-
AI
+關注
關注
87文章
31262瀏覽量
269628 -
編程語言
+關注
關注
10文章
1947瀏覽量
34848 -
計算機科學
+關注
關注
1文章
144瀏覽量
11379
原文標題:科研最好的時代還是最差的時代?盡管AI一騎絕塵,但科學正放緩
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論