人工智能這一概念,早在1956年達(dá)特茅斯會議上便已首次提出。經(jīng)歷60余年,從感知智能走向認(rèn)知智能,人工智能迅猛發(fā)展,賦能千行百業(yè)。 11月18日, 2022科大訊飛全球1024開發(fā)者節(jié)盛大開幕,引領(lǐng)人工智能生態(tài)向新而行。大會現(xiàn)場,科大訊飛消費(fèi)者事業(yè)群總裁于繼棟發(fā)表《人機(jī)協(xié)同 數(shù)字新生》主題演講,分享訊飛開發(fā)者生態(tài)進(jìn)展,展望人機(jī)協(xié)同新未來。
科大訊飛消費(fèi)者事業(yè)群總裁 于繼棟
韌性增長 訊飛生態(tài)蓬勃發(fā)展
面對紛繁復(fù)雜的全球經(jīng)濟(jì)環(huán)境,各行各業(yè)充斥著不確定性,如何應(yīng)對這一變局,尋求下一步發(fā)展的動力來源? 人工智能產(chǎn)業(yè)的蓬勃生命力、訊飛開放平臺的穩(wěn)健增長,讓我們看見人工智能的巨大潛能,相信中國科技廣闊的未來。 自2017年以來,訊飛開放平臺開發(fā)者數(shù)與AI服務(wù)年度調(diào)用總量,呈現(xiàn)持續(xù)穩(wěn)步上升趨勢。2022年,開發(fā)者數(shù)達(dá)到370萬,AI服務(wù)在線調(diào)用年增長率達(dá)到36%。
快速增長的背后,是AI已經(jīng)高度融入人們的日常生活和工作,于繼棟在現(xiàn)場分享到。 在社交場景,近一年輸入法語音調(diào)用量同比增長45%,已超過平臺AI調(diào)用增速。其中,Z世代群體對語音輸入更為偏愛,女性使用語音的比例是男性的1.4倍。語音輸入已成為日常交流中人機(jī)交互的重要方式。
在家庭場景,電視助手語音調(diào)用量過去3年間,增長了515%。在用戶分析中看到,全年齡段用戶都已形成語音交互的習(xí)慣,其中低于14歲的少年兒童群體和高于60歲的中老年群體比成年用戶更偏愛語音交互。
在出行場景,車載語音調(diào)用量獲得到了翻番的增長。在過去一年全國出口的200萬輛汽車中,預(yù)制訊飛多語種語音交互系統(tǒng)的車輛已超71%。合作車企在科大訊飛的助力下,已將13個語種推廣到全球20個國家。
在學(xué)習(xí)場景,過去一年教育相關(guān)的AI調(diào)用呈現(xiàn)出902%的增長。在雙減政策的推動下,AI幫助學(xué)生減負(fù)。訊飛及生態(tài)伙伴推出學(xué)習(xí)機(jī)、翻譯筆、口算寶、早教機(jī)等一系列智能硬件有效陪伴了少年兒童的學(xué)習(xí)成長。
在辦公場景,AI辦公硬件服務(wù)調(diào)用持續(xù)快速增長。以辦公本、會議耳機(jī)、翻譯機(jī)為代表的辦公硬件,為用戶省時增效。在錄音筆的應(yīng)用中,平均每天為每個用戶節(jié)省1.32小時。AI在辦公領(lǐng)域的廣泛應(yīng)用,已為工作效率的提升發(fā)揮巨大作用。
在閱讀場景,一些大型新聞類、閱讀類APP的應(yīng)用,讓語音合成服務(wù)的調(diào)用量有了明顯增長。在AI的加持下,用聲音陪伴的閱讀體驗(yàn),正在改變用戶的閱讀習(xí)慣,提升閱讀粘性。
眾多AI服務(wù)調(diào)用量的增長,讓我們看到AI應(yīng)用的價值在不斷深入。基于此,訊飛將更多的AI能力開放給開發(fā)者,讓AI持續(xù)傳遞。
全新訊飛開放平臺
全方面賦能人機(jī)協(xié)同場景
隨著社交、家庭、出行、學(xué)習(xí)、辦公、閱讀等越來越多AI場景的廣泛應(yīng)用,人工智能在人機(jī)交互階段已經(jīng)走進(jìn)千行百業(yè),并持續(xù)發(fā)光發(fā)熱。當(dāng)下,人工智能與生活結(jié)合更好的時代就是人機(jī)協(xié)同的時代。 如何進(jìn)入人機(jī)協(xié)同時代?于繼棟分享了對物理世界、數(shù)字世界、元宇宙三大場景人機(jī)協(xié)同應(yīng)用的思考。在物理世界,實(shí)體機(jī)器人可以拓展人的能力邊界;在數(shù)字世界,數(shù)字工作助手,將助力工作提效;在元宇宙,虛擬人成為人的交互載體。
實(shí)體機(jī)器人從室內(nèi)到戶外,幫助人們從事工業(yè)焊接、果實(shí)采摘、高空作業(yè)等高精度、高強(qiáng)度、高風(fēng)險(xiǎn)的工作。虛擬數(shù)字人打破實(shí)體的限制,在媒體、金融、辦公等領(lǐng)域廣泛應(yīng)用,打造數(shù)字生產(chǎn)力。 為滿足人機(jī)交互的時代需求,訊飛開放平臺進(jìn)行了全新升級。在感知智能、認(rèn)知智能、運(yùn)動智能強(qiáng)大的技術(shù)底座之上,圍繞能力云、交互云、模型云、資產(chǎn)平臺、超自動化、機(jī)器人超腦,以API、低代碼、軟硬件一體和解決方案的方式,面向?qū)嶓w機(jī)器人和數(shù)字機(jī)器人建設(shè)N種場景化機(jī)器人。
全新的訊飛開放平臺,通過原有組件升級、新組件發(fā)布,為開發(fā)者提供更優(yōu)秀的服務(wù)能力,更廣闊的應(yīng)用場景。
能力云AIHUB,是在2018年發(fā)布的基礎(chǔ)上進(jìn)行升級和擴(kuò)展,已開放513項(xiàng)AI能力并不斷引入生態(tài)合作伙伴最優(yōu)秀的能力,打造AI能力圖譜。面向網(wǎng)絡(luò)不穩(wěn)定、信息安全敏感的環(huán)境,全新升級了全系離線版本,加深行業(yè)應(yīng)用。值得一提的是,在大會現(xiàn)場剛剛發(fā)布的SMART-TTS多風(fēng)格多情感語音合成技術(shù),已在訊飛開放平臺、訊飛有聲APP同步上新,讓開發(fā)者可以更早的體驗(yàn)到擁有10種場景、11種情感的語音合成。
交互云AIUI+,通過遠(yuǎn)近場多模語音增強(qiáng),突破同向人聲干擾難題,解決人機(jī)交互最后一公里問題。通過多模態(tài)技術(shù),對人臉、唇形進(jìn)行跟蹤定位,實(shí)現(xiàn)主動交互、說話人保持、噪聲抑制。在同向人聲干擾下,語音識別準(zhǔn)確率已由60.2%提升到86.8%。
模型云AILAB,面向細(xì)分模型定制場景,提供小樣本訓(xùn)練平臺,主要解決三類問題。面向格式多樣場景,支持任意自定義格式單據(jù)識別;針對數(shù)據(jù)稀缺場景,實(shí)現(xiàn)5張圖片訓(xùn)練出OCR定制模型、半小時音頻生成商用發(fā)言人;遇到價格敏感場景,“0”成本提供多樣喚醒詞。
資產(chǎn)平臺AIRES,聯(lián)合生態(tài),共建數(shù)字資產(chǎn),讓機(jī)器人交互形象生動有內(nèi)容。目前平臺已提供210個多語種技能、342個虛擬人形象、6000萬首正版音樂、1200萬小時有聲內(nèi)容,并開放數(shù)字藏品平臺——星晝,為開發(fā)者提供豐富的內(nèi)容資源。
超自動化AIRPA,用數(shù)字機(jī)器人激活人效潛能,助力企業(yè)數(shù)字化轉(zhuǎn)型。由AI+RPA構(gòu)建的數(shù)字機(jī)器人是訊飛面向企業(yè)場景打造的協(xié)作新模式,提供了數(shù)字機(jī)器人統(tǒng)一工作臺、柔性人機(jī)協(xié)同、智能化員工助手等應(yīng)用。
除以上組件升級煥新以外,訊飛還發(fā)布了機(jī)器人超腦平臺AIBOT,讓機(jī)器人在交互大腦的基礎(chǔ)上,快速構(gòu)建運(yùn)動能力。
機(jī)器人超腦平臺發(fā)布
讓AI的賦能無處不在
“降低開發(fā)者使用門檻,快速實(shí)現(xiàn)超腦能力與實(shí)體機(jī)器人的結(jié)合,為實(shí)體機(jī)器人真正的智能化帶來直接動力與貢獻(xiàn)!”于繼棟在發(fā)布機(jī)器人超腦平臺AIBOT時如是說。
融入多模交互、深度理解、運(yùn)動控制、硬件模組等核心能力的機(jī)器人超腦平臺,為實(shí)體機(jī)器人提供高性能的算力支撐、高效率的地圖導(dǎo)航以及高精度的定位功能,打造軟硬一體的智能化機(jī)器人。 而這一項(xiàng)技術(shù)已經(jīng)有了實(shí)際的應(yīng)用案例。能說會跑的狗來自宇數(shù)科技的四足機(jī)器狗在訊飛機(jī)器人超腦平臺的加持下,已實(shí)現(xiàn)自適應(yīng)的地形能力、全局定位搜索能力、地圖快速構(gòu)建能力、更精細(xì)的運(yùn)動控制能力。在這四大能力全面提升后,機(jī)器狗能跑會跳,能看會說,可應(yīng)用于戶外巡邏、工業(yè)巡檢等多元化場景。
超強(qiáng)助手機(jī)械臂基于訊飛機(jī)器人超腦平臺,珞石科技為柔性機(jī)械臂增加了語音交互、深度視覺以及運(yùn)動控制能力,再加上算法的改造,讓機(jī)械臂操作更智能、工業(yè)質(zhì)檢更高效、定位更實(shí)時,可以有效的適應(yīng)各種應(yīng)用。在工業(yè)質(zhì)檢、商業(yè)服務(wù)、遠(yuǎn)程超聲、柔性生產(chǎn)等場景,柔性機(jī)械臂都可實(shí)現(xiàn)與人類更高效的工作配合。
開發(fā)者燈塔計(jì)劃
讓每個創(chuàng)新者享受AI樂趣
獨(dú)木不成林 生態(tài)才永恒。依托越來越多優(yōu)秀的人工智能應(yīng)用的開放,訊飛開放平臺期待讓每個創(chuàng)新者享受AI的樂趣。 日常生活和企業(yè)工作中,很難要求每個人都懂程序開發(fā)。通過RPA、低代碼等技術(shù)構(gòu)建工作場景下的新型智能應(yīng)用,訊飛開放平臺為懂業(yè)務(wù)、想創(chuàng)新的伙伴提供服務(wù),將更多智能化的體驗(yàn)帶進(jìn)千家萬戶。會上,于繼棟發(fā)布了“開發(fā)者燈塔計(jì)劃”,秉持“共生、共創(chuàng)、共享、多樣繁榮”的理念,打造更豐富、便捷的AI服務(wù),讓AI科學(xué)家、設(shè)計(jì)師、企業(yè)管理人員與內(nèi)容生產(chǎn)者等,都能享受AI的樂趣與價值,共創(chuàng)繁榮的AI新生態(tài)。
“希望與各位開發(fā)者攜手共創(chuàng),邁入人機(jī)協(xié)同新時代”,在大會最后,于繼棟發(fā)出倡議。訊飛開放平臺將繼續(xù)秉持共建人工智能產(chǎn)業(yè)的初心,用生態(tài)定義未來,共筑數(shù)字經(jīng)濟(jì)新發(fā)展。
-
人機(jī)交互
+關(guān)注
關(guān)注
12文章
1211瀏覽量
55447 -
機(jī)器人
+關(guān)注
關(guān)注
211文章
28566瀏覽量
207720 -
人工智能
+關(guān)注
關(guān)注
1792文章
47514瀏覽量
239249 -
科大訊飛
+關(guān)注
關(guān)注
19文章
816瀏覽量
61369 -
元宇宙
+關(guān)注
關(guān)注
13文章
1397瀏覽量
11501 -
數(shù)字人
+關(guān)注
關(guān)注
0文章
131瀏覽量
2067
原文標(biāo)題:機(jī)器人超腦平臺發(fā)布 邁入人機(jī)協(xié)同新時代
文章出處:【微信號:訊飛開放平臺,微信公眾號:訊飛開放平臺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論