從核彈到早產嬰兒,人工智能技術已經最終成為足夠可靠的監視一切的手段。
在一個有血有肉的醫生和一個人工智能系統之間,兩者選擇其一來作出疾病診斷,佩德羅·多明戈斯更樂意把自己的生命押注到人工智能系統上。佩德羅·多明戈斯是西雅圖華盛頓大學的一名計算機科學家,“我寧愿相信機器也不要相信醫生,”他說。考慮到人工智能(AI)通常獲得的差勁口碑——過度炒作,乏善可陳——如此強烈的支持聲音確實鮮見。
回到二十世紀六十年代,AI系統在復制人腦的某些關鍵方面似乎大有前途。通過使用數理邏輯,科學家開始重現和推理現實世界的知識,但是,很快這種方法淪為AI的枷鎖。盡管數理邏輯在模擬人腦(解決問題)方面富有成效,但是它在本質上并不適合處理不確定性。
然而經過因自我枷鎖造成的漫長封殺之后,AI這個廣受詬病的領域卻重新興盛起來。多明戈斯并非唯一對其抱有全新信心的科學家。研究者希望通過成熟的電腦系統來檢測嬰兒疾病,把口頭語言翻譯成文本,甚至是找出惡意核爆。這些由成熟的電腦系統展現出來的早期能力就是最初在AI界引起人們廣泛興趣的東西:即使在紛繁復雜的世界,電腦仍具有像人類一樣的推理能力。
處于AI復興核心的是一種叫概率性程序的技術,它在舊有AI的邏輯基礎上加入統計概率的應用。“它是兩種最強大的理論的自然統一,這兩種理論已經被發展來理解和推導這個世界。”史都華·羅素說,他是加州大學伯克利校區現代人工智能方面的先驅。這套強大的綜合體終于開始驅散籠罩在AI漫長嚴冬上的迷霧。“這肯定會是一個(AI的)春天。”麻省理工學院的認知科學家約什·田納邦說。
“人工智能(artificial intelligence)”一詞于1956年由MIT的約翰·麥卡錫創造。那時,他提倡使用邏輯語言開發能進行推理的電腦系統。該方法隨著所謂的一階邏輯的應用趨于成熟。在一階邏輯中,現實世界的知識通過使用正式的數學運算符號和標記進行模化。它為客觀體世界和客觀體間相互關系而設,能夠用來解析他們之間的聯系并得出有用的結論。例如,如果X(某人)患有高傳染性的疾病Y,患者X與某人Z近距離接觸,那么用這種邏輯便可推導Z患有Y疾病。
然而,一階邏輯最大的功勞是它允許越來越復雜的模型由最小的結構模塊構建起來。例如,上述情況可以輕易地延伸到建立流行病學的致死傳染病模型,以及對其發展進行結論性推導。這種把微小概念不斷擴展成概念集合的邏輯功能意味著人類大腦中也存在類似的思維模式。
這個好消息并沒有存在得太久。“不幸的是,最終,邏輯沒能實現我們的期待。”加州斯坦福大學的認知科學家諾阿·古德曼說。由于使用邏輯來表現知識并進行推理的過程要求我們對現實世界的實際知識有精確的掌握,容不得半點模糊。要么“真”要么“假”,不存在“也許”。而不幸的是,現實世界,幾乎每一條規則都充滿了不確定性、干擾和例外情況。簡單地用一階邏輯構建的AI系統不能處理這些問題。舉例來說,你想分辨某人Z是否有疾病Y,這里的規則是清晰明白的:如果Z與X接觸,那么Z患病。但是一階邏輯不能處理Z在或者已經感染或者沒有之下的情況。另一個嚴重的問題是,一階邏輯不能逆向推導。例如,如果你知道Z患有疾病Y,你不可能完全確定Z的疾病是從X那里感染的。這是有醫學診斷系統面臨的典型問題。邏輯規則能夠將疾病和癥狀聯系起來,而一個醫生面對癥狀卻能逆推出其病因。 “這需要轉變邏輯公式,而且演繹邏輯并不適合處理這種問題,”田納邦說。
這些問題意味著到了二十世紀八十年代中葉,AI的冬天到來了。當時流行的看法是:AI毫無發展可言。然而,古德曼私下相信,人們不會放棄AI,“AI轉入地下發展了,”他說。
1980年代末神經網絡的到來讓AI的解凍露出第一線曙光。神經網絡的想法之簡單讓人驚嘆。神經系統科學的發展帶來了神經元的簡單模型,加上算法的改進,研究者構建了人工神經網絡(ANNs)。表面上,它能夠像真正的大腦一樣學習。受到鼓舞的計算機科學家開始夢想有上百萬或者上萬億神經元的ANNs。可是很快地,事實證明我們的神經元模型顯然過于簡單,研究者都分不清神經元的哪些方面的性質是重要的,更不用說模仿它們了。
不過,神經網絡為新的AI領域構筑了一部分基礎。一些繼續在ANNs上奮斗的研究者終于意識到這些網絡可以被認為是在統計和概率方面對外部世界的重現。與“突觸”和“動作電位”這些生理學上的稱呼不同,他們稱之為“參數化”和“隨機變量”。田納邦說,“現在,ANNs聽起來更像一個龐大的概率模型而不是一顆大腦。”
然后在1988年,加州大學洛杉磯校區的朱迪亞·珀兒寫了一本里程碑式的書《智能系統的或然性推理》,里面詳細地描述了AI的全新方案。支持這本書的理論是湯瑪斯·貝葉斯提出的一個原理。湯瑪斯·貝葉斯 是18世紀的一名英國數學家和牧師,他把以事件Q發生為前提下事件P發生的條件概率和以事件P發生為前提下事件Q發生的條件概率聯系起來。這個原理提供了一個在原因和結果間來回推導的方法。“如果你能對感興趣的不同事物用那樣的方式描述,那么貝葉斯推論的數學方法會教你如何通過觀察結果,然后逆推各種不同起因的可能性,”田納邦如是說。
新方案的關鍵就是貝葉斯網絡,一個由各種隨機變量組成的模型,在這個模型里每個變量的概率分布都取決于其他變量。給定一個或多個變量的值,通過貝葉斯網絡則可推導出其他變量的概率分布,換言之,得出他們的可能值 。假定這些變量表示癥狀、疾病和檢查結果,給出檢查結果(一種濾過性病毒感染)和癥狀(發熱和咳嗽),則可給可能潛在的病因賦予不同的幾率(流感,很可能;肺炎,不太可能)。
二十世紀九十年代中期,包括羅素在內的研究員開始開發算法,使貝葉斯網絡能利用和學習現有的數據。這很大程度上跟人類基于早期理解的學習方式相同,新的算法卻能通過更少的數據來學習更復雜和更準確的模型。對ANNs來說,這是前進的一大步,因為無需考慮先驗知識,可以從頭學習解決新的問題。
搜獵核武器
人們開始逐漸理解各種努力和嘗試,去創造為現實世界而設的人工智能。一個貝葉斯網絡中,各種參數是概率的分布,如果我們對這個世界知道得越多,這些分布值越有用。與一階邏輯下構建的網絡不同,不完整的知識并不會導致貝葉斯網絡迅速崩潰。
盡管這樣,邏輯也并非無用武之地。事實證明貝葉斯網絡本身并不充分,因為它不允許以簡單片段任意構建復雜結構,取而代之的是一個由綜合的邏輯程序和貝葉斯網絡組成的,進入熱門話題領域的概率性程序。
這種新AI的最前端是少數合并基礎元素和所有靜止研究工具的計算機語言,其中有Church語言,由古德曼、田納邦和同事開發,以某計算機程序邏輯的開創者阿隆索·丘奇命名。多明戈斯的團隊開發了馬爾科夫邏輯網絡,融合了邏輯型網絡和與貝葉斯網絡相似的馬爾科夫網絡。羅素則和他的同事使用了一個直接明了的名字,叫“貝葉斯邏輯”(BLOG)。
最近在奧地利維也納召開的聯合國全面禁止核試條約組織(CTBTO)大會上,羅素展示了Church語言的表達能力。CTBTO邀請了羅素,因為他們預感到新的AI技術可能有助于監測核爆炸。聽過一上午的關于監測地震背景下遠距離核爆引發的地震特征、穿過地球的信號傳播異常和世界地震站的噪音探測器的演示報告后,羅素開始著手用概率程序的設計(神經信息處理系統前沿,卷23,麻省理工學院出版Advances in Neural Information Processing Systems, vol 23, MIT Press)。他說,“在午飯時間,我已能為整個問題編寫一個完整的模型。”,這個模型足足有半頁之長。
這類模型能整合先驗知識,例如,對印度尼西亞蘇門塔臘和英國伯明翰地區發生地震的幾率做比較。CTBTO同時要求任何一個系統首先假定發生在地球上任何地方的核爆幾率均等,然后才使用來自CTBTO監測站接收的真實信號數據。AI系統要做的就是獲取所有數據,對每組數據最可能的解釋作出推斷。
挑戰就在其中。像BLOG這樣的語言是由所謂的通用推理機組成的。已知某個現實問題的模型和眾多變量及概率分布,推理機只能計算某種情況的可能性,例如,在已知期望事件的事前幾率和新地震數據下,推斷一次在中東發生的核爆。但是如果變量改成代表癥狀和疾病,那么它就必定能做出醫學診斷。換言之,其中的算法必須是非常普遍的,這也意味著這些算法極其低效。
結果是,這些算法不得不根據每個新問題逐一定制。但正如羅素所說,你不能每遇到一個新問題就請一個博士學生來改進算法,“那并不是你大腦的工作方式,你的大腦會趕緊適應(新問題)。”
這一點讓羅素、田納邦和其他人緩下來仔細考慮AI的前途。“我希望人們會感到興奮,但不是那種我們向他們推銷蛇油(萬靈藥)的感覺,”羅素說。田納邦也有同感,盡管已是一個年過40的科學家,他覺得只有一半的機會在他有生之年見證有效推理這一難題的解決。盡管計算機將運行得更快,算法會改進得更精妙,他覺得“這些是比登月或者登火星更艱深的問題”。
無論如何,AI團體的意志并沒有因此消沉。例如,斯坦福大學的達菲·柯勒正在用概率編程解決非常特殊的問題并且頗見成效。他與同在斯坦福的新生兒學專家安娜·潘和其他同事一起開發了名為PhysiScore的系統,可以預測一個早產兒是否有任何健康問題。這是個眾所周知的難題,醫生不能作出任何確定程度的預測,“這種預測卻是對那個家庭唯一要緊事,”潘回應。
PhysiScore系統把多方面的因素考慮進去,諸如孕齡、出生體重,以及出生后數小時內的實時數據,包括心率、呼吸率和氧飽和度(Science Translation Medicine, DOI: 10.1126/scitranslmed.3001304)。“我們能夠在頭3個小時內得出哪些嬰兒將來會健康,哪些可能患上嚴重的并發癥,甚至是兩周后會出現的并發癥,”柯勒解釋道。
“新生兒專家對PhysiScore這個系統感到興奮,”潘說。作為一名醫生,對于AI系統具有處理上百個變量并作出決定的能力,潘尤其滿意。這種能力甚至讓該系統超越了他們的人類同行。潘說:“這些工具能理解和運用一些我們醫生和護士看不到的信號。”
這正是多明戈斯一直對自動化醫學診斷抱有信心的原因。其中一個著名例子是“快速醫學參考,決策理論(QMR-DT)”,它是一個擁有600種重要疾病和4000種相關癥狀模型的貝葉斯網絡,其目標是根據一些癥狀推斷可能疾病的幾率。研究者已經針對特殊疾病的推理算法對QMR-DT進行微調,并且教會該系統使用病人的檔案。“人們對這些系統和真人醫生做過比較,這些系統似乎更勝一籌,”多明戈斯說,“人類對自己的判斷,包括診斷,不能保持一致的觀點(態度),而醫生們不愿意放棄他們工作中這一有意思的部分是唯一讓這些系統不能廣泛應用的原因。”
AI領域里的這些技術還有其他成就,其中一個矚目的例子是語音識別,它已經由過去因經常出錯備受嘲笑提升到今天令人驚訝的準確度(New Scientist, 27 April 2006, p26)。現在,醫生可以口述病人檔案,語音系統軟件會把口述檔案轉換成電子文檔,由此可以減少手寫處方。另外,語言翻譯也開始仿效語音識別系統的成功之處。
會學習的機器
但是仍然有重大的挑戰顯現在各個領域中。其中之一就是弄明白機器人的照相機看到什么,解決這個問題將為設計出自我導航的機器人縮短一大段距離。
開發靈活和快速的推理算法的同時,研究者必須提高AI系統的學習能力,無論是根據現存數據還是現實世界檢測到的新數據。今天,大部分的機器學習是由定制算法和小心地構建的數據組完成的,為教會一個系統處理特定的任務而專門設計。“我們希望那些系統更加通用,這樣你可以把它們投入到現實世界,同時它們也能從各種輸入信息中學習。”柯勒說。
一如既往,AI的終極目標是建造出能用我們完全理解的方式復制人類智慧的機器。“那可能是和尋找外星生命一樣遙遠甚至同樣危險的事,”田納邦說。“‘擬人AI’是一個更廣義的詞,有謙虛的余地。如果我們能構造一個視覺系統,像人類能做到的一樣,看一眼就可告訴我們那里有什么,我們將無比高興。”
責任編輯:Ct
評論
查看更多