電子發燒友網報道(文/李彎彎)AIGC即AI Generated Content,是指利用人工智能技術來生成內容,AIGC也被認為是繼UGC、PGC之后的新型內容生產方式,AI繪畫、AI寫作等都屬于AIGC的分支。對AIGC來說,2022年被認為是其發展速度驚人的一年。
然而AIGC卻存在它的落地痛點,那就是高昂的通用大模型與下游垂直應用場景需求的不匹配。最近ChatGPT熱度持續上升,一方面推動了科技巨頭持續加大AI投入,另一方面也直接帶動下游付費意愿提升,這將進一步加速AIGC應用落地和商業變現。
早早從事自然語言處理(NLP)研究
在ChatGPT熱度這波浪潮中,拓爾思受到了不少關注。拓爾思成立于1993年, 主營業務包括人工智能產品及服務、大數據產品及服務和數據安全產品及服務等。
在AIGC方面,拓爾思圍繞傳媒、政府等垂直領域的語料庫有非常全面的積累,在智能問答、自動寫作或智能寫稿、內容播報、創作智能輔助等方面也有成熟的應用場景。
在自動創作方面,公司利用自研互聯網大數據資訊平臺,在大型體育賽事期間對賽事熱點和話題進行大數據分析和研判,通過AIGC的內容自動創作和虛擬數字人進行聯合,幫助觀眾了解最新賽事盛況。在智能問答方面,公司自主研發了一款面向中文的智能問答云服務系統,即TRS小思智能問答機器人。
人工智能包括計算智能(記憶、計算),感知智能(語音識別、圖像識別),認知智能(語言理解、分析決策),創造智能(想象、創造) 四個層次。
拓爾思所專注的語義智能位于人工智能的認知智能領域,即讓計算機來理解人類語言或其他符號表面數據內含的確切意義,提取出信息或知識,進而進行推理、分析、決策,達到、接近或者超過人類的智慧水平。
據介紹,拓爾思是國內最早從事自然語言處理(NLP)研發的企業之一,在NLP、知識圖譜、OCR、圖像視頻結構化領域都具備自主可控的底層技術。
拓爾思自2000年開始自然語言處理和文本挖掘方面的研究,在國內推出語義智能的商業化軟件TRS DL-CKM,并被國內外數以千計的用戶采用。
TRS DL-CKM人工智能技術平臺,基于機器學習和深度學習開發了50多個功能組件,200多個調用接口,主要應用于智能問答、智能寫作、專題分析、智能文本校對、圖像識別、知識圖譜構建以及多語言實體識別等場景,廣泛應用于融媒體、輿情分析、內容審核、智慧公檢法、智能風控、對話機器人等多個領域。同時,TRS DL-CKM也為公司其它產品提供AI技術支撐。
數據產品為信創領域提供保障
對于人工智能來說,數據作為主要的生產要素,在產業鏈中占據重要的位置。以ChatGPT為代表的AIGC大模型技術對數據更是有更高的要求。在數字化發展的當下,國家對數據的重視程度也在加大。
日前,根據國務院關于提請審議國務院機構改革方案的議案,組建國家數據局。負責協調推進數據基礎制度建設,統籌數據資源整合共享和開發利用,統籌推進數字中國、數字經濟、數字社會規劃和建設。足見數據在數字經濟社會發展中的重要性。
一般而言,數據供方包括數據產生者、數據控制者、數據運營者。未來數據運營者匯集數據生產者、數據控制者的數據,并對數據進行存儲、處理,形成高價值的源數據和數據衍生品,通過交易系統與需方達成交易,通過平臺接口傳輸數據給需方。
根據數據來源的不同,可分為單源數據交易平臺模式和多源數據交易平臺模式。根據數據處理程度不同,該模式可分為源數據交易模式、數據衍生品交易模式以及綜合數據交易模式。
拓爾思在數據供應環節和數據服務環節都有深度布局。在數據供應方面,拓爾思基于自主建設的大數據中心,以長期服務多行業用戶的開源數據持續累積為基礎,建成了具有高商業價值的可運營大數據資源,擁有了規模及質量均位列業界前茅的海量豐富、已經過清洗和脫敏的數據資產。
據介紹,目前拓爾思擁有來自境內外、各行各業的公開數據資產總量超 1200億,并已具備數千億數據量的數據索引、標記、查詢、挖掘分析能力,日均億級數據獲取能力。其不僅支撐公司多個專業化的數據智能服務,也具有對外的開放接口服務,可支撐面向政府、媒體、金融、公安、商業等多行業用戶的大數據云服務。
在數據服務環節,該公司具備完全自主研發的大數據基礎平臺和TRS人工智能平臺,可提供數據采集、清洗、標注、管理等服務。具體產品包括海蜘分布式采集系統、海匯社交視頻采集系統、海聚數據融合系統、海貝搜索數據庫等。
具體來看,其產品海貝數據庫是目前國內少有從底層數據收集,到分詞和索引算法,以及儲存技術的國產數據庫引擎。其核心代碼自主率達到100%,且通過多家國家機構認證,可徹底擺脫對 Elasticsearch和Lucene等國外數據庫的技術依賴。
在大數據領域,拓爾思突破異構數據對大數據搜索引擎的限制,為索引數據加密提供全方位安全保障,實現了文本、圖像特征、二進制的統一索引和跨數據類型跨語言的檢索,并采取最新的集群技術提高了可支持的數據規模和多用戶并發檢索性能,為數據安全和信創領域應用提供全面保障。
小結
2022年AIGC經歷了飛速發展的一年,新年初ChatGPT的爆火更是將AIGC推向了新高度,讓AIGC的落地商用加速。這也讓一些AI企業火出了圈,比如拓爾思。其一是其在自然語言處理(NLP)方面的研究,以及其AIGC在多個領域的成熟應用;其二是它在AI產業鏈主要環節數據方面的深厚積累,在數據方面可以為信創領域提供服務。
-
智能
+關注
關注
8文章
1712瀏覽量
117585
發布評論請先 登錄
相關推薦
評論