2018年度AI Index報告出爐,從產學研投資創業和政府媒體關注等各方面衡量人工智能發展。
評估人的體質好壞有BMI,衡量國家經濟發展水平有GDP,如何判斷人工智能進展?今天,由來自哈佛、MIT、斯坦福、OpenAI以及AI產業聯盟等專家學者組成的AI Index小組撰寫的《AI指數2018年度報告》(AI Index 2018 Annul Report)發布。
AI Index報告的目標是利用硬核數據,衡量AI領域的取得的進步,并嘗試理解這些進步,因為這些成果涉及工作自動化等棘手問題的解決方案,以及對通用人工智能(AGI)的總體追求,或者涉及實現讓機器執行任何人類操作的AI類型。
2018 AI Index 報告發現:
AI頂會繼續火爆:NeurIPS 2018年參會人數是2012年的4.8倍,ICML則是2012年的6.8倍,ICLR 2018的參會人數是2012年的20倍
從全球來看,歐洲學者發表的AI論文的數量最多,占去年世界AI論文總數的28%。中國以25%緊隨其后,北美則占17%。但是,美國AI研究論文被引用數量最多,中國AI論文的引用數量也比2006年提升了44%
就業市場上,ML是最大的技能要求,但深度學習崗位的增長速度最快——從2015年到2017年,需要DL技能的職位空缺增加了35倍
論文發表,機器學習和“概率推理”這些與認知相關的論文數量最多,神經網絡第二,第三是計算機視覺,再次是搜索和語音,自然語言處理排在第五
各國對AI的側重也有所不同,中國更注重農業科學、工程和技術,而歐洲和北美更注重人文科學、醫療健康科學。總體看,歐洲的研究類型分布一般更為全面。
中國有76%的學者流動性低。調查發現,流動性高的學者發表的AI論文具有更高的引用率和影響力,也更傾向于更頻繁地發布論文。
高校課程設置上,清華2017年AI和ML課程注冊人數是2010年的16倍,清華也是非美國高校中AI課程學生增長率最高的,是第二名多倫多大學的2倍左右。
從2017年6月到2018年11月,ImageNet訓練時間變快了16倍
AI在很大程度上仍是由VC在驅動
AI Index 的緣起要從2014年說起,當時斯坦福大學決定啟動一個叫做“AI100”的項目,持續跟蹤調查并總結人工智能未來100年在學術研究、經濟、道德倫理、法律等方面的進展。2016年9月,“AI100”小組發布了第一份《斯坦福AI百年報告》,第二份報告預計5年后發布。
然而,人工智能發展迅速,為了更好更及時地跟蹤AI進展,斯坦福百年報告項目發起人Yoav Shoham又組建了一個新的小組,并開發了一個旨在及時跟蹤并反映人工智能發展現狀的指標體系——AI Index。AI Index研究組每年都會發布一份報告,也即《AI指數報告》。
去年12月發布的第一份AI指數報告較為偏向北美。今年,報告增強了全球視野,發現AI的商業化、研究活動、資金流動呈現全球化增長,歐洲和亞洲尤為明顯,而且呈高度集中的態勢:中日韓在AI研究論文發表、大學招生和專利申請方面領先其他東方國家。
報告還設立了一個“超越人類水平的重大突破”部分,記錄了2018年AI在游戲和醫療診斷等領域取得的重大突破性進展,包括微軟的機器翻譯、谷歌深度學習檢測前列腺癌,DeepMind在傳統FPS游戲《雷神之錘》取得的進步,以及OpenAI在Dota 2中面對業余玩家和前職業玩家時令人驚艷的出色表現。
下面,就來詳細看看2018年,人工智能在學術研究、產業發展和政策設定方面的進步吧。
對了,吳恩達看完這份報告總結了兩點:
AI在產學研領域繼續快速發展,我們還需要增加多樣性并且變得更加包容。
學術研究:積極在Arxiv貼論文凸顯領域競爭激烈
1996-2017年發表論文總量猛增
上圖是相較于1996年,學術論文的年度出版率增長情況,該圖比較了計算機科學(CS)領域和AI領域的論文發表率增長情況。從1996年到2017年,AI領域的論文增加了7倍(8x),CS領域的論文增加了5倍(6x)。
各地區發表論文情況
歐洲是AI論文出產大戶,2017年Scopus上的AI論文有28%來自歐洲,25%來自中國,17%來自美國。2007年至2017年在中國發表的論文數量增加了150%,盡管2008年中國的論文數量出現過驟跌現象。
細分領域論文發表情況
2017年,56%的論文屬于機器學習和概率推理領域,而2010年這一數字為28%。
對于大多數細分領域,在2014-2017年期間論文的發表速度要快于2010年-2014年。例如,神經網絡領域(上圖紅線)論文的2010-2014年復合年增長率(CAGR)僅為3%,而該領域2014-2017年的復合年增長率為37%。
ArXiv上的AI論文
自2010年開始,arXiv上的AI論文迅猛增長,從2010年的1073篇,到2017年發布的13325篇。其中計算機視覺領域(CV) 是自2014年起增長最快的一個領域 (上圖藍線) 。
這一趨勢表明AI研究者傾向于傳播他們的研究,無論是經過同行的認可亦或經過了頂會的檢驗,這也說明該領域競爭激烈。
中國AI研究主要由政府主導,美國則是企業主導
領域側重(RAI)
上圖顯示了美國、歐洲和中國的AI領域相對活動指數(RAI)。 RAI可以看出一個區域的專業傾向,通過將其與AI全球研究活動進行比較。RAI值為1時,表明這個國家在AI中的研究活動與全球一致;高于1時,意味著該國更強調重視這個領域;低于1時,意味著更少關注。
從圖中可以看出,中國的AI論文更側重于工程技術和農業科學,而美國和歐洲的AI論文則傾向于關注人文科學和醫學與健康科學。
政府、企業和醫學界主導研究情況對比
在政府主導的AI論文中,從2007年到2017年,中國增長了400%;而企業論文在這期間增長了73%。在美國,相對較大比例的AI論文來源于企業,美國企業的AI論文比例要遠高于中國和歐洲。
各地區的論文引用影響力
FWCI是領域權重引用影響系數,可以用來衡量論文的影響力。盡管歐洲每年發布的AI論文數量最多,但引用影響力處于世界平均水平。相比之下,2016年中國AI論文的被引用率比2000年高出了44%。美國在這方面表現突出,美國作者AI論文的引用率要比世界平均水平高83%。
AI研究者流動率:中國學者“久坐不動”
根據調查,流動性高的學者發表的AI論文具有更高的引用率和影響力,也更傾向于更頻繁地發布論文。
在美國、中國和歐洲這三個國家和地區中,中國低流動性(“久坐不動”)的AI作者比例最大(76%),其次是歐洲(52%),最后是美國(37%)。
各國在AAAI上論文發表情況
在2018-AAAI頂會上提交的論文中約有70%來自美國或中國。 中國提交的論文數量最多,但美國和中國被接受的論文數量基本相同,分別為268和265。
美國機構提交的論文獲得了29%的錄取率,中國為21%。 德語和意大利語的論文獲得最高錄取率(41%),但提交的人數較少。
各大高校AI課程注冊情況
AI和ML課程近年來逐漸進軍高校。從AI課程注冊率來看,2017年注冊AI課程的人數是2012年的3.4倍,入門ML課程的人數是2012年的5倍。
加州大學伯克利分校在這方面增長最迅速,2017年入門ML課程的學生人數是2012年的6.8倍。
報告還統計了非美國地區得高校AI和ML課程注冊人數的變化。其中,清華是非美國高校中增長率最高的,是第二名多倫多大學的2倍左右。
而從清華自身來看,該校2017年AI和ML課程注冊人數是2010年的16倍。
高校AI教授以男性為主
在收集相關數據的過程中,改善師資多樣性的一個重大障礙是無法獲得有關多樣性的數據,我們鼓勵機構將多樣性統計數據透明化。
在所研究的學校中,我們發現平均80%的AI教授都是男性,在世界各地、各大高校都是如此。
AI學術會議熱度提升
來看下大型AI頂會的熱度。首先是三大頂會:NeurIPS (曾用名NIPS) 、CVPR和ICML,這三大會議參與人數眾多。自2012年以來,它們的參會人數增長率也遠高于其他會議。
其中,NeurIPS 2018年參會人數是2012年的4.8倍,ICML則是2012年的6.8倍。
不僅是大型頂會的參會人數增長,小型會議的熱度也在不斷上升,其中最為突出的是ICLR,ICLR 2018的參會人數是2012年的20倍。
AI研討會多樣性情況
上圖顯示了兩個研討會的年度注冊數量:其中一個是由女性參與的機器學習(WiML)主辦,該組織致力于支持女性參與機器學習,以及AI4All的校友人數,后者旨在增加人工智能的多樣性和包容性的教育計劃。 相比于2014年,WiML研討會2015年的參與者增加了600%,AI4ALL的校友人數增加了900%。
機器人安裝情況
下圖所示為隨著時間的推移從ROS.org下載的機器人操作系統(ROS)二進制包的數量。 ROS是一種廣泛使用的機器人開源軟件棧,為許多制造商和學術研究人員廣泛使用。 左軸為平均每月下載量,而右軸為僅來自獨立IP地址的平均月下載量。 自2014年以來,總下載量和單IP下載量分別增長了352%和567%。
下圖顯示了自2012年以來全球訪問ROS.org最多的五大地區。美國和歐洲的訪問次數位居前兩位,中國的增長速度位居第一,目前訪問次數距離前兩名已經不遠。2017年,來自中國的訪問次數已經相當于2012年的18倍。ROS.org表示,來自中國的訪問量增長是結構性的,而不是在中國增加市場營銷和資源投入的結果。
AI技術發展:沒有驚天突破,但在穩步提升
物體識別精度
ImageNet競賽在2017年完結,因此AI Index報告組根據已發表的論文,繼續跟蹤當前物體識別的水平(ImageNet 2012 驗證集)發展。報告組指出,如果某個AI子領域的發展是以某項競賽為基礎來衡量的,那么這項競賽的完結會導致該領域技術真實發展水平難以衡量。好在數據集是開源的,因此在一定程度上還是能保證評估的連續性。
下圖即為物體識別精度情況,藍線為歷年ImageNet競賽冠軍結果,黃線為相關算法在ImageNet驗證集上得到的結果。可以看出,2018年,在沒有為了比拼物體識別精度的情況下,物體識別算法的表現整體也有提升。
ImageNet訓練時間
ImageNet訓練時間是指網絡以高精度分類ImageNet圖像數據集所需的時間。這一指標代表了大型網絡完成AI任務的時間。由于圖像分類是一種相對通用的監督學習任務,因此ImageNet訓練時間這一指標,也可以從某種程度上反映其他AI應用程序的訓練時間。在一年半的時間里,訓練ImageNet的時間從大約一小時減少到大約4分鐘。
ImageNet訓練時間這一指標也反映了AI研究的產業化情況。ImageNet訓練時間減低的因素包括:算法創新和基礎設施建設。
從2017年6月到2018年11月,ImageNet訓練時間變快了16倍。
實例分割
下圖顯示了MS COCO競賽實例分割結果。ImageNet競賽完結后,計算機視覺界開始轉向更為復雜的推理任務,例如以像素級精度定位物體(也即實例分割)和像素級精度劃分場景(語義分割)。
自2015年以來,COCO競賽中算法的平均精度最高增加了0.2個點,或相對提高了72%。
語義分析
下圖顯示了AI系統在確定句子句法結構任務上的表現。語義分析(Parsing)是問答等特定自然語言理解任務中的第一步,如今已經幾乎全部由深度學習完成。自2003年以來,句子成分語義分析水平、F1得分提高了9個百分點,或相對提高了10%。
機器翻譯
下圖顯示了AI在新聞英德互譯中的表現。從2008年到2018年十年間,英譯德機器翻譯BLEU得分提高了3.5倍,德譯英機翻水平則提高了2.5倍。需要指出,由于每年使用的測試集不同,得分并不是完全可比的。但整體看BLEU得分有一定參考意義。
機器問答ARC
下圖顯示了歷年AI2推理競賽(AI2 Reasoning Challenge,ARC)的結果。ARC數據集包含7787個真實的純文字科學多項選擇題(美國3到9年級水平,英語,通常有4個答案選項),分為高難度(Challenge Set,2590個問題)和低難度(Easy Set,5197個問題)兩個數據集。
ARC基準測試于2018年4月發布,到11月,機器在Easy Set上的表現從63%上升到69%,在Challenge Set上則從27%上升到42%。
機器問答GLUE
下圖顯示了GLUE基準測試排行榜的結果。通用語言理解評估(GLUE)是一個新的基準,旨在測試自然語言理解(NLU)系統完成一系列任務的水平,并且鼓勵研究人員開發較為通用的系統。GLUE由九個子任務組成:兩個單句測試(衡量語法和情感),三個關于相似度(similarity)和復述(paraphrase),四個關于自然語言推理,包括Winograd Schema Challenge。語料庫大小從小于1000到超過40萬不等。衡量指標包括準確度/ F1和馬修斯相關系數。
雖然該基準測試在2018年5月才發布,但目前機器水平相比第一次測試結果已有大幅提高,距離非專業人員(大約90%)已經不遠。
投資創業熱度不減,深度學習崗位驟增35倍
AI初創企業
下圖顯示了風險投資支持的美國私營創業公司在特定年份的活躍數量。藍色的線(左軸)只顯示AI創業公司,而灰色的線(右軸)顯示所有風險投資支持的創業公司,包括AI創業公司。這張圖表描繪了每年1月份初創公司的總數。圖表顯示,初創公司的數量是逐年累積的。
從2015年1月到2018年1月,活躍的AI創業公司增長了2.1倍,而所有活躍的創業公司增長了1.3倍。在很大程度上,創業公司整體的增長保持相對穩定,而AI創業公司的數量呈指數級增長。
從2015年到2018年,美國活躍的AI創業公司數量增長了2.1倍,而所有創業公司整體增長了1.3倍。
VC投資
下圖顯示了風險投資公司(VC)在所有融資階段向活躍的美國初創公司提供的年度資金數額。藍色的線(左軸)只顯示對AI創業公司的資助,而灰色的線(右軸)顯示所有VC支持的創業公司的融資額,包括AI創業公司。這些是年度數據,非逐年累積。
從2013年到2017年,AI風投資金增長4.5倍,而所有風投資金增長2.08倍。1997 - 2000年風險投資的繁榮可以用互聯網泡沫來解釋。2014年和2015年較小規模的繁榮反映了這段時期經濟增長較快。
從2013年到2017年,美國AI創業公司的風險投資增加了4.5倍,而所有活躍創業公司的風險投資增加了2.08倍
就業市場:向AI技能開放
下面的圖表顯示了有AI技能要求的每年職位空缺數量,以及該空缺數量的相對增長。這里的AI技能不相互排斥。
雖然ML是最大的技能要求,但深度學習(DL)的增長速度最快——從2015年到2017年,需要DL技能的職位空缺增加了35倍。
就業性別差異:AI目前還是男人的游戲
下圖顯示了2017年AI職位空缺的男性和女性申請者。這些數據是根據所需要的技能統計,不相互排斥。申請人的數量并不意味著雇用或在整個行業的代表。
在美國,平均而言,男性求職者占AI求職者總數的71%,因為機器學習要求的求職者數量最多,平均而言,這主要是由機器學習求職者推動的。除了機器學習,深度學習和機器人技術相對于其他類別而言,性別差異更大。
在美國,男性求職者平均占AI求職者總數的71%
專利
下圖顯示了AI專利的數量和增長情況。AI專利一般使用IPC代碼,屬于認知和意義理解以及人機界面技術領域。
2014年,約30%的AI專利來自美國。其次是韓國和日本,這兩個國家各自擁有16%的AI專利。就發明人地區來說,韓國和中國***增長最快,2014年AI專利數量是2004年的近5倍。
AI采用:按地區分析
下面的圖表顯示了麥肯錫公司對2135名受訪者的調查結果,每個人都代表他們的組織進行了回答。圖表描繪了組織在至少一個功能或業務單元中采用AI能力的受訪者百分比。受訪者可以選擇多種AI能力。
圖表顯示,雖然一些地區比其他地區更傾向于采用某些能力,但是AI能力在不同地區之間的采用程度是相對平等的。我們期待AI采用隨時間的變化。
AI采用:按行業分析
同樣是麥肯錫公司對2135名受訪者的調查結果。下面的圖表描述了組織在特定業務功能中試驗或采用AI能力的受訪者的百分比。
組織傾向于將AI能力納入其行業內最有價值的功能中。例如,金融服務在很大程度上將AI與風險結合在一起,而汽車行業則將AI采用到制造中,零售業則在營銷/銷售方面采用AI。
下面的圖表顯示了AI和機器學習(ML)在企業財報電話會議中被提及的情況。這項分析只統計了在紐約證券交易所上市的公司。
AI和ML在IT行業的財報提及在2015年就有所增加。對于大多數其他行業來說,這一增長始于2016年。IT、非必需消費品、金融和醫療保健行業在財報電話會議上提到AI最多。
機器人安裝情況
下圖按地區顯示了工業機器人的年度安裝情況。第一個圖顯示了機器人安裝量最大的五個地區,第二個圖顯示了其他地區。
自2012年以來,中國每年的機器人安裝量增長了500%,而韓國和歐洲分別增長了105%和122%。
TensorFlow和AutoML定義開源軟件格局
Github上獲得的星數
下圖是Github上出現的各類AI和機器學習軟件包的次數。從圖中可以大致看出各類AI編程框架的受歡迎程度。最近呈現的兩大趨勢是,由大公司支持的框架越來越受歡迎,如谷歌的TensorFlow、Facebook的Pytorch,亞馬遜的mxnet等,以及TensorFlow在受歡迎程度上相對其他語言表現出越來越明顯的優勢。
Github上累計獲得的星數(未包括Tensorflow)
英美加政府對AI和機器學習關注有不同程度提升
媒體對AI的關注
下圖所示為在大眾媒體的文章中包含“人工智能”一詞的文章比例,這些文章被分為正面、負面或中立文章。從2016年初開始,關于人工智能的文章變得更加“正面”,其比例從2016年1月的12%上升到2016年7月的30%。從那時起,“正面”文章的比例一直在30%左右。
政府部門對AI的關注
下圖顯示了美國、英國和加拿大的議會記錄中提及“人工智能”和“機器學習”的情況。在這三個國家的議會中,對這兩個詞語的提及頻率自2016年以來快速上升。而且,“機器學習”在2016年之前很少被提及,而且相對于“人工智能”而言,被提及的次數仍然很少。
注意,由于比較方法不同,本圖表不適合于跨國比較。我們建議只比較一個國家內的一段時間內的趨勢,而不是進行國與國之間的比較。下圖由上至下依次為美國、英國、加拿大的情況。
AI整體活力:很大程度上仍由VC驅動
為了探究學術界和工業界AI相關的活動之間的關系,我們首先從前幾節中選取了一些具有代表性的測量方法。具體來說,我們主要關注Scopus的AI論文發表數量、幾所美國大學AI和ML入門課程的學生數量,以及AI相關初創公司的風險投資。
這些指標表示無法直接比較。為了分析趨勢之間的關系,我們從2010年開始對每一項指標進行標準化,并顯示增長,而不是絕對數字。
Academia-Industry dynamics
AI活力指數
AI活力指數(AI Vibrancy Index)將三個Academia-Industry 指標(出版、課程注冊人數和風險投資)匯總成一個衡量標準,量化AI作為一個領域的活力。與Academia-Industry 動態一樣,AI活力指數始于2010年。
AI活力指數很大程度上受VC投資的推動,相對于其他兩個指標,VC投資增長最快。這三個指標的權重相等。
AI Vibrancy Index
AI政策制定與技術和產品研發同樣重要
AI Index 所有這些硬數據,對于理解AI領域目前所處的階段,過去幾年來AI如何進展,以及未來它將如何發展,都非常有幫助。
但是,當涉及到自動化以及AI在刑事司法、邊境巡邏檢查、戰爭等更棘手的領域時,我們還沒有找到出路。在這些領域,性能的重要性比不上政府政策的重要性。人工智能無疑會繼續變得更加復雜,但在醫院、教育系統、機場和警察部門能夠可靠地使用這類軟件之前,還存在許多障礙,既有技術上的障礙,也有偏見和安全方面的障礙。
但AI仍然得到越來越多的應用。今年,亞馬遜在向執法部門出售其面部識別軟件,而谷歌在被發現向美國國防部一個名為Maven的無人機項目提供計算機視覺技術后,陷入了巨大的爭議。
谷歌表示一旦合同到期,它將退出Maven項目。谷歌也發表了一系列AI倫理原則,包括承諾永遠不會開發AI武器監測系統,或為任何違反了“廣泛接受的國際法和人權原則”的項目提供幫助。但很明顯,硅谷的領導者將AI視為一個絕佳的商業機會,而這類項目和合同則是參與AI研究軍備競賽的經濟回報。
伴隨著自動化的普及,大規模失業雖然不會很快到來,但作為一個社會,我們需要準備好迎接工作性質的轉變,轉向更不穩定、薪酬更低、缺乏醫療保險等安全保障的工作。
不是每個人都會馬上失業。相反,隨著時間的推移,某些工作崗位將被淘汰,而另一些工作崗位將變成半自動化的。有些工作永遠需要有人的角色。工人的命運將取決于特定的雇主限制,勞動法律法規,以及是否有足夠好的制度來確保人們轉移到新的角色或行業。
例如,麥肯錫全球研究所去年11月的一份報告發現,到2030年,全球自動化可能會導致8億人失業,但只有大約6%的工作面臨完全自動化的風險。
美國智庫全球發展中心今年7月發表的一份報告,集中討論了AI和機器人自動化對全球勞動力市場的潛在影響。研究人員發現,目前幾乎沒有足夠的工作在為全面自動化帶來的影響做準備,而多數討論集中在特定市場中實現完全自動化的一般倫理和可行性。報告總結說:“在決定哪些工作實現自動化方面,盈利能力、勞動法規、工會化和企業社會期望等問題至少與技術限制問題同等重要。”
現在來說,可靠地測量AI對社會的影響也許為時過早——這個行業才剛剛起步,但我們要為這一切做好準備,了解這意味著什么,以及AI將如何影響日常生活、工作以及醫療保健、教育和執法等公共機構,這與AI研究和產品開發同等重要。只有同時投資于兩者,我們才能讓世界變得更好。
-
神經網絡
+關注
關注
42文章
4779瀏覽量
101097 -
人工智能
+關注
關注
1796文章
47643瀏覽量
239932 -
深度學習
+關注
關注
73文章
5512瀏覽量
121455
原文標題:斯坦福全球AI報告:清華AI課程人數增16倍,人才需求暴增 35 倍
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論