快過年了,大家是否和我一樣,跟家鄉的關系弱了,歸家途中“近鄉情更怯”,擔心大過年的把天給聊尬了。但踏上故土的那一刻,聽到熟悉的鄉音,聽聽親友的傾訴,又有一種“知所從來”的踏實。
放下“XX老師”“Selina”“X總”等在外的身份,帶著鄉音的那一聲呼喚,是我們的來時路,與春節格外適配。
用方言過一個熱鬧而熨帖的春節,百度文心智能體平臺,帶著你我的34個省AI人脈走來了。
我最近發現,百度app上線了由開發者打造的34個省級行政區的AI智能體,不僅能聽懂各地方言,回答吃喝玩樂、旅游訂票等個性化問題,還能一鍵「打電話」視頻聊天暢聊,堪稱是i人過節的“神助攻”。
我們第一時間連線一番,給大家帶來這份AI智能體過年攻略,是時候給親友們展現一下咱的AI人脈,給春節添加一些有趣的AI年味兒了。
我聽過一個說法,小時候覺得年味兒濃,是大人們特意為我們營造了過節氛圍。那些記憶中熟悉的儀式感,很難再引發強烈的共鳴。而長大后的我們,成了那個制造年味兒的人。
面對代際間的生疏,略顯尷尬的提問,我們能不能主動帶來新鮮的談資,讓年味兒變得有那么一點不同呢?
蛇年春節,我就打算用AI智能體來打開話匣子了。
返鄉第一件事,肯定是關心這一年在外面過得怎么樣。作為一名進京務工人員,我的家人們就格外關注北京。北京近來天氣怎么樣,搞了什么大型活動,親戚家哪個孩子來北京求學工作了……仿佛了解這座城市,就參與到了我的日常生活。怎樣讓他們了解一個地道的北京城?我在百度app上,把皇阿瑪請出來給大家做導游了。
聽皇阿瑪用京片子講解北京的知名景點、風土人情,告訴俺娘俺在北京不是孬種。
孩子們在外有沒有人陪伴,是父母最關心的問題,在難得相處的幾天里,一嘮叨關于工作、升職、婚育的問題,特別影響過年氣氛。
今年我就不打算正面硬剛了,直接給安徽老鄉“包拯”智能體拉出來,給他們講講理。沒想到AI包公不僅合肥話講得地道,還挺會做人,一下子就把注意力轉移到安徽旅游了。
太好了,是AI智能體,我們有救了。
長期出門在外,難以承歡膝下,父母平時在家缺少陪伴,是我們外地游子最慚愧的事情。我媽去年最愛看的電視劇就是《繁花》,當我幫她撥通“許文強”智能體的電話,用滬語介紹繁花相關的各色上海風貌。
這樣接地氣又隨時隨地地陪伴,帶著科技的溫度,來到日常生活中,熨平了孤獨的人心上的褶皺。
AI智能體的語音功能,不僅形象和口音極具地域特色,也能聽懂各地方言,用家鄉話跟AI對話也毫無問題。比如我用蹩腳的“港普”跟港姐AI智能體聊天,夸她“超靚”,對方也能聽懂我在講什么。
這個春節,各地方的人都能用自己的家鄉話,在家“云游”34省,告別尬聊,包充實的。
值得一提的是,34省AI智能體,都是百度文心智能體平臺的開發者,基于文心大模型打造的。你我不僅是AI用戶,還可以零門檻化身AI開發者,在百度文心智能體平臺一鍵get同款,定制自己家鄉方言的智能體,或者自己感興趣的垂類智能體。
蛇年春節,AI不再是大廠發布會上的炫技,不再是遙不可及的黑科技,而是化作千姿百態的鄉音,在千家萬戶的團圓夜,找到了最溫暖的棲身之所。
過去一年來,AI領域最大的變化,就是從一項大廠實驗室誕生的高科技,變成了四五線城市乃至鄉鎮間都在熱議的全民話題。
但百聞不如一用,如何讓AI在全國范圍內被廣泛地應用和理解呢?闔家歡聚的春節,無疑是一個絕佳的契機。不過,在春節期間,大規模且穩定地向大眾輸出技術能力,對任何一個頂尖科技企業來說,都極具挑戰。
以AI智能體的方言對話為例,其實方言語音功能,大多數網友都不陌生,早在機器學習時代,就已經有方言識別與合成的TTS產品了。但此前,方言語音合成的實現難度大。
比如九聲六調的粵語,“詩”“史”“試”僅靠音調區分含義,AI需要捕捉比普通話復雜3倍的聲紋特征。合肥話的“連讀變調”,更是讓工程師們抓狂。一些語料較少的方言,要深入當地走街串巷,收集語料,再為每種方言單獨開發前端。
整個過程耗時很長,功能上線當然快不了,所以很多地方的小眾方言,以前都是無法通過線上應用,被大眾體驗到的。
今年春節,34省AI智能體的方言語音功能,不僅能搞定較難的粵語、合肥話,而且在百度app說上線就上線。
這種方言功能在AI應用中的快速落地,依賴于百度語音技術的特殊支撐。主要是兩大能力:
一是語音大數據挖掘技術。通過識別大模型,對不同省份的方言數據,進行切分、降噪、識別等自動化處理,可以高效產出海量方言數據;
二是語音合成大模型技術。基于大模型,將普通話和方言統一建模,利用遷移技術訓練出支持多種語音合成的通用模型,讓一個模型可以用任意音色說任意方言,大大減少了開發工作量,縮短了研發周期。
AI智能體,從一種高大上的技術概念,到鄉土地頭的趣味應用,不僅給這個春節帶來了極大改變,也將成為AI語音應用廣泛普及的開始。
AI大模型爆火之后,普羅大眾最關心的就是:AI有什么用?如果要選一個最具重要性和緊迫性的應用場景,那應該是:聽懂中國話。
中國的萬里山川,存在著大量“十里不同音”的地域,讓各地方的人們跨越方言的阻礙,順暢地彼此交流、融入數字生活,是國產語音技術一直努力的方向,其中,百度就是一支源遠流長的技術力量。
起步早。2010年,百度語音技術團隊成立,專注于語音識別(ASR)、語音合成(TTS)等基礎技術研發。深度學習技術在全球剛剛興起的時候,百度就在2014年推出了基于深度學習的語音識別系統(Deep Speech),被《MIT科技評論》評為全球十大突破技術。
技術強。多年來,百度不斷推出了流式多級截斷注意力(SMLTA)、多模態交互、端到端語音合成、定制化音色等語音技術,研發實力領先業界。
覆蓋廣。經由DuerOS(小度助手),百度語音技術被廣泛應用于車載場景、智能家居硬件、AI客服等,不斷積累語料、迭代打磨產品。
回望百度語音技術的來時路,也就不難理解,為什么是百度,在蛇年春節首個上線34省的方言功能了。
春節只是一個縮影,實際上,百度的AI聲浪已經席卷日常生活,成為你我身邊的一個個科技彩蛋。
比如說,直播電商,是很多人的購物首選方式。但真人主播的成本高、人力稀缺,很多小品牌請不起;使用數字人直播帶貨,以前的音色很不自然,消費者體驗不好。百度通過自動化的數據采集和增強技術、語音大模型的遷移技術、篇章段落合成技術等,不僅讓語音更連貫,提升了數字人主播的自然度和擬人度,而且僅需幾分鐘,就能達到超越真人的TTS水平,降低了定制音庫的制作成本。如今,百度語音技術每天支持眾多直播間開播,業務側CVR也得到大幅提升。
有聲小說,是大眾喜聞樂見的娛樂應用,但以前的有聲書,缺乏對內容段落的理解能力,霸總狂拽炫酷地冷哼,反派邪魅狂狷的大笑,念起來都是一個味兒,缺乏沉浸感。如今,百度小說、頭部第三方小說平臺,接入了百度全自動化生產平臺,可以基于大語言模型的文本理解技術,對角色、人物畫像、對白情感,進行精準分析,再利用高表現力的聲學建模技術,對十多種情感和副語言進行遷移控制,生成貼合語義、情感細膩的類真人聲音,聽起小說來,那叫一個身臨其境。
車載語音,是智能座艙的體驗重心。一位汽車銷售告訴我,基于百度語音技術打造的智能座艙,是業內唯一多人同時說話、語音助手也能聽清的互動體驗,甚至沒有之一。怎么做到的呢?原來,百度將視覺信息引入語音增強,對人臉唇動特征和語音信號統一建模,改變了過去單一模態的交互體驗,更準確地理解用戶交互意圖,對目標說話人做語音分離,解決傳統語音單模態技術難以區分和追蹤目標聲源的問題,從而大幅提升了復雜場景下的語音增強的效果,帶來“人無我有”的車載語音交互體驗。
憑借在智能語音領域的技術壁壘和創新能力,百度完成了國產AI技術落地的一次次演練。
這一個蛇年春節,AI鄉音在游子們的歸途中響起,智能的種子也飄散在了萬里山川。
-
AI
+關注
關注
87文章
31493瀏覽量
270096 -
智能體
+關注
關注
1文章
166瀏覽量
10609 -
文心一言
+關注
關注
0文章
125瀏覽量
1316 -
大模型
+關注
關注
2文章
2544瀏覽量
3062
發布評論請先 登錄
相關推薦
評論