隨著人工智能的迅速發展,對信息科學部做分析和精準畫像是非常有必要的一項工作,對深入探究學者變遷和項目的發展方向具有較大的意義。上海交通大學AceMap學術搜索組便對此做了深入的工作,并以知識圖譜的形式生動且直觀的進行了展示。
當下,隨著互聯網和人工智能技術的蓬勃發展,信息科學部的研究成果吸引了社會和學界的廣泛關注,成為基金委各人才項目中不可或缺的一環。因此,有必要對信息科學部的分析和精準畫像,深入探究學者變遷和項目的發展方向。
上海交通大學AceMap學術搜索組在對國內人才項目進行立體學術畫像的基礎上,著重對信息科學部進行深入剖析,研究信息科學部下各子學科合作關系和發展情況,搜集并研究學者從本科、碩士、博士到教職的機構變遷情況,提取人才項目關鍵詞,分析學者科研方向,探究關鍵詞在子學科、機構的分布情況,對于研究信息科學部學科劃分、學者變遷和科研發展方向均具有參考意義。
信息科學部合作星云圖
圖1信息科學部合作星云圖
圖1中的節點代表獲評人才項目的學者,不同顏色代表獲評時所在的信息科學部下屬部門,紅色代表一處(電子學與信息系統學科),藍色代表二處(計算機科學學科),黃色代表三處(自動化學科),綠色代表四處(半導體、光學與光電子學科)。節點之間的連邊代表合作關系,邊越寬意味著合作次數越多,節點距離越近,意味著相似度更高、合作更緊密。依據合作關系可以明顯將學者分為三個星系團(社區):三處中涉及控制理論和系統科學的學者位于圖中上方,人數較少,與其他兩個星團距離較遠;從圖中可以觀察到有部分黃色和紅色節點與藍色節點合作緊密,和二處計算機方向學者共同位于圖中左下角;一處和三處涉及電子、通信和半導體等研究,研究方向相近,彼此合作非常緊密,呈“你中有我,我中有你”模態,位于圖中右下角。
通過學者的合作關系可以推知學者的研究領域,一些學者在某一學科申報項目,但本身研究方向可和另外部門的學者合作更加緊密。
圖2信息科學部合作星云圖局部放大圖A
以南京大學周志華教授及其合作者為例。他們在信息三處申報項目,但圖2同時顯示他們與二處計算機方向合作緊密,意味著研究方向可能與計算機更為接近。實際中,周志華教授本人從事人工智能方向,擔任計算機系教授。由于三處包含了人工智能方向,該方向和二處計算機方向關聯緊密。
圖3信息科學部合作星云圖局部放大圖B
類似地,再以信息一處戴瓊海院士為例。從圖3中可以看出其與二處的高文院士距離很近,可以推知二者研究方向很接近。實際中,戴瓊海院士從事立體視覺和計算攝像學研究,高文院士致力于視頻編碼與分析,兩者的研究方向具有高契合度。
通過對合作星云圖的分析與學者所屬部門劃分相比能更加全面準確地刻畫學者的合作關系和研究方向,對學者的研究領域有更直觀的理解,同時對于學科劃分有一定的參考意義。
學者機構變遷知識圖譜
圖4人才項目學者機構變遷知識圖譜
圖4展示了工程與材料科學部、信息科學部、生命科學部、醫學科學部、化學科學部、數理科學部、地球科學部、管理科學部等8個學部近年來優青、杰青、創新群體獲評學者與所在機構的整體分布情況構建知識圖譜,包含可以搜集到的部分學者(信息科學部)本科、碩士、博士畢業所在的學術機構。圖中包括5617位學者和352所機構,其中代表學者的節點為紅色,代表機構的節點則用黃色表示,本科、碩士、博士、優青、杰青、創新各自使用藍色的節點代表,而八個學部則表示為綠色。
表1機構學者人數排行
本科 | 碩士 | 博士 | 優青 | 杰青 | 創新 |
清華大學(65) | 清華大學(33) | 清華大學(64) | 清華大學(38) | 清華大學(28) | 清華大學(6) |
北京大學(31) | 西安電子科技大學(21) | 北京大學(33) | 北京大學(17) | 北京大學(18) | 北京大學(6) |
西安電子科技大學(27) | 北京大學(20) | 上海交通大學(31) | 上海交通大學(16) | 上海交通大學(14) | 浙江大學(4) |
上海交通大學(25) | 上海交通大學(17) | 浙江大學(31) | 浙江大學(16) | 浙江大學(14) | 中國科學院自動化研究所(4) |
南京大學(23) | 東南大學(15) | 西安電子科技大學(28) | 中國科學技術大學(15) | 中國科學院半導體研究所(14) | 東南大學(4) |
浙江大學(23) | 北京航空航天大學(14) | 北京航空航天大學(25) | 哈爾濱工業大學(14) | 南京大學(13) | 中國科學院物理研究所(4) |
北京航空航天大學(19) | 華中科技大學(14) | 南京大學(24) | 北京航空航天大學(13) | 中國科學技術大學(11) | 上海交通大學(3) |
中國科學技術大學(19) | 浙江大學(13) | 中國科學技術大學(21) | 東南大學(10) | 北京郵電大學(11) | 北京郵電大學(3) |
東南大學(18) | 中國科學院半導體研究所(12) | 東南大學(20) | 電子科技大學(10) | 電子科技大學(11) | 中國科學院數學與系統科學研究院(3) |
華中科技大學(18) | 哈爾濱工業大學(11) | 中國科學院半導體研究所(19) | 復旦大學(10) | 華中科技大學(10) | 電子科技大學(3) |
表1列出了信息科學部本科、碩士、博士、優青、杰青、創新學者人數最多的10所學校。不難發現,C9高校占據了排行榜中的絕大多數。除此之外,北京航空航天大學、西安電子科技大學、東南大學、華中科技大學等非C9學校也在排行榜中占據了一席之地。在教育經歷與成果的橫向對比上可以看出,北京大學與清華大學在優青、杰青、創新群體的獲評人數遠超其他C9學校(浙江大學、中國科學技術大學、復旦大學、上海交通大學、南京大學等),體現出了學術影響力上的明顯差異與一定程度上的平臺優勢。在本碩博的區域,清華大學的畢業人數居于首位,而北京大學與緊隨其后的其他學校在畢業人數的差距則沒有那么顯著。該現象可以解釋為:北京大學在教育上體量偏小,但不可否認的是其學術研究上對于人才培養的成果與清華大學平分秋色。
從機構的分布可以看出,獲得優青、杰青、創新群體的學者在教育上的經歷分布較為平均,有許多學者碩士甚至博士畢業于北美或者歐洲的一些院校,國內的院校也五花八門,這部分院校主要分布在圖的左邊和左上角,在教育中充當的是培養基本素質的角色。而獲評的各人才項目則集中于特定的國內高校,說明許多優秀的學者在加入這些院校后做出了自己的成果,獲得了國家自然科學基金委員會的認可。這部分學校分布在中間偏左的位置,除了C9和前面排行榜中提到的學校之外,也可以看到許多中國科學院的研究所,這些機構的人數無法與高校相提并論,但承擔的都是前沿科技的研究,也取得了杰出的成就。
圖5科學院院士與工程院院士教育經歷的機構變遷螺旋圖
圖5以兩院院士為例探究了眾多學者教育經歷的變遷,其中本科、碩士、博士所在學校分別用綠色、黃色、紅色節點表示,而最外層的粉色節點則表示獲評院士時所在的機構。通過觀察可以發現,人才流動具有明顯的集群效應,大部分的學者最終加入了C9高校,其中北京大學、清華大學、哈爾濱工業大學、浙江大學等尤為集中,與之前統計所推斷出的平臺優勢相符。在學校的排名上,根據院士人數對所有院校進行順時針排列后將每位學者本科碩士博士所在的學校相連接,可以看出,半徑上的直線說明該學者從本科開始一直留在相同學校直到最后獲評院士,曲線則代表其教育經歷中從一個機構遷移到了另一個機構。在這種情況下,可以認為由內向外逆時針方向的曲線意味著前往排名更高的學校,反之亦然。總體上進行比較,很明顯逆時針的曲線數量超過順時針的曲線,即大多數學者集中到了排名靠前的學校,與先前的觀察相符。
信息學部合作星云圖
圖6信息科學部關鍵詞與機構關聯圖
圖6在對各人才計劃獲評的項目名稱進行自然語言處理與標簽提取的基礎上呈現信息科學部各處的關鍵詞之間和其與學術機構之間的聯系。圖中各個學術機構用紫色的節點表示,紅色的節點代表信息科學部一處的關鍵詞,黃色代表二處,綠色代表三處,藍色則代表四處,中間粉色的節點表示該關鍵詞出現在了不止一個處的項目中,屬于跨學科的領域。所有的學校根據獲評項目的數量進行順時針排列。從圖中可觀察到,清華大學獲評數最多,第二梯隊中,北京理工大學、北京郵電大學、北京航空航天大學、華中科技大學等與其他C9高校實力相當。對于單個機構進行觀察,可以發現不同學校之間研究側重點上的差異。例如與北京郵電大學相連接的邊幾乎全部都是紅色,意味著該機構在科研方面重點著力于信息科學部的一處;而吉林大學與蘇州大學連接的邊則以藍色占據絕對的主導地位,說明這兩所學校的研究領域主要分布在四處。
圖7關鍵詞-年份對照圖
依照1997-2018年,信息學部四個處當選的杰青的項目信息的數據,我們繪制了如圖7所示的關鍵詞-年份對照圖。圖中共涉及1997-2018間21個不同的年份,并按照時間的先后依次由青色向粉紅色漸變顯示。同時,我們根據杰青當選時的項目信息,特別是題目中的信息,我們提取出了366個關鍵詞,以及關鍵詞之間18831次在同一項目信息中的共同出現,依次按照信息學部的四個處信息來分別展示,即圖中紅色、藍色、黃色、綠色分別代表該關鍵詞的當選人分別屬于一處至四處,而圖中紫色的部分則說明這一關鍵詞的使用是跨越了處的界限的,代表了一定程度上的交叉融合。其中,代表出現了交叉融合的紫色節點的個數共有15個,代表一處的紅色關鍵詞(節點)有94個,代表二處的藍色關鍵詞(節點)有78個,代表三處的黃色關鍵詞(節點)有69個,代表四處的綠色關鍵詞(節點)有110個。同時,圖中關鍵詞代表節點的大小,代表了這一關鍵詞被提及的次數,而代表關鍵詞的點與點之間的邊的粗細,則代表了兩者同時出現的次數的多少。而代表關鍵詞的點與外圍代表年份的點之間的連線,則說明該關鍵詞在該年曾經被該處的某位當選的杰青所提及。
下面僅以一例來說明關鍵詞-年份對照圖的含義。例如對于黃色的三處,我們看到在比較早期,也就是外圍時間環中粉色的部分,1998年前后出現了控制、圖像處理、機器視覺三個關鍵詞(同一年份詞語排序不分先后),而對于這兩個節點,我們通過其與圖片中間連線,可以看出這兩個關鍵詞在中間的關鍵詞關系圖中,其節點大小都較大,說明這一關鍵詞和其代表的研究方向,在后來的領域發展中,獲得了較高的提及頻率。事實上,通過對下面的關鍵詞-年份-申請人的查找,我們可以看到這兩個關鍵詞對應的是1998年當選杰青的譚鐵牛,而其當時的項目題目則是”圖象處理與機器視覺”,契合了我們的關鍵詞和對應的年份定位。
而在了解了圖的含義后,通過對于圖中的連線的分析,我們可以看到,早期的關鍵詞信息相對而言比較少,而絕大部分的關鍵詞和關鍵詞被涉及的次數都是近十數年來才開始大規模出現的,一方面,這與早期杰青的數量相對較少有關,而另一方面,其也從側面反應了信息學科近年來的爆發式發展和在不同領域上的不斷深化和交叉融合。
而通過對于關鍵詞之間的跨越界限和交叉融合來分析,我們可以看到諸如多媒體、網絡、編碼、控制等內容逐漸被擴展開來,一、二、三這幾個處都有所涉及,事實上考慮到近幾年來深度學習,圖像識別等領域的火熱,這也是近些年在這些領域上的學科交叉與融合的體現。
此外,通過對于處內關鍵詞的詞頻的分析,我們也可以看到一些現象,例如圖中左下角的綠色的四處部分,其早年間的關鍵詞通常都是包括光學等基礎理論,而近年來,則更加偏向于諸如量子等更加趨向于應用和前沿的詞語,這也說明了這一學科理論的逐漸完善,和新領域的不斷開拓。而類似的現象也發生在了一處的關鍵詞之上,諸如微波、電磁場等關鍵詞,其與外圍年份對應的連邊中,粉色系邊的數量明顯要多于青色系的數量,也即也體現出了明顯的偏向于早年的特點。
圖8關鍵詞-年份-申請人對照圖
而與之對應的,我們又同時繪制了如圖8所示的關鍵詞-年份-申請人對照圖。圖中呈螺旋放射狀的節點是代表關鍵詞的節點。類似的,節點由內向外依次由粉色逐漸過渡為青色,分別代表了1997-2018年這21年間的關鍵詞變化。特別的,如果一個關鍵詞在某年的某個處出現不止一次的話,我們則會將該年該詞對應的節點放大。同樣的,我們把當選的杰青,按照其當選時的處信息,按照紅色、藍色、黃色、綠色與一處至四處一一對應,放在了圖的外圍。而代表人和代表關鍵詞的連線,則說明該人在該年當選杰青時,其項目信息涉及了這個關鍵詞。其中,代表一處的紅色點的杰青人數為135,代表二處的藍色點的杰青人數為107,代表三處的黃色點的杰青人數為106,代表四處的綠色點的杰青人數為167。
通過分析每年的螺旋放射狀的節點數量可以看出,在近二十余年的杰青評選中,通過橫向對比各處所涉及的關鍵詞的數量,可以看出四個處的關鍵詞數量還是大致一致的。而縱向的依據每年關鍵詞的數量上分析,可以看到盡管不同年份之間存有波動,但從整體趨勢而言,年代越靠后的關鍵詞數量越多,這也與上面關鍵詞-年份對照圖的直觀印象形成了對應。
此外,節點大小則與我們通過谷歌學術上獲取的總引用量相關。對于能夠在谷歌學術上獲取被引量數據的學者,我們將他們對應的外圍節點大小與被引量的對數成正比,同時對于谷歌學術上沒有被引量數據的學者,則以全體杰青被引量的平均值暫代。而通過對比幾個處的學者的被引量,我們可以看出,一處的整體被引量相對而言較小,而其余三個處的被引量則基本保持相對一致。考慮到一處所涉及的學科的特殊性,這并不代表學者之間研究能力的高下,而僅僅是體現了學科之間的差異化分布。
總結和展望
隨著信息化時代的到來,信息科學部正在蓬勃發展,得到了廣泛的關注,通過對信息科學部人才項目的專家畫像和分析,可以了解信息學部發展的整體情況、人才機構變遷的情況和不同子學科的發展趨勢,對于信息學部下學者的關系研究和項目審理提供了重要參考。隨著分析的不斷深入,未來將利用整個人才項目組成的知識圖譜構建專家系統,更進一步對各領域專家進行學術畫像。
-
互聯網
+關注
關注
54文章
11182瀏覽量
103614 -
人工智能
+關注
關注
1793文章
47590瀏覽量
239486 -
知識圖譜
+關注
關注
2文章
132瀏覽量
7724
原文標題:中國信息科學部人才項目變遷熱圖:清華輸出人才最多
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論