據報道,微軟計劃于今年六月份推出網頁版PowerPoint全新語音識別功能。此項功能將能夠監控PowerPoint視頻中的聲音,進而自動生成字幕。
早在2023年12月,微軟已對網頁版PowerPoint進行了升級,允許用戶在視頻中添加字幕,但目前僅支持WebVTT格式。
微軟表示,新功能上線后,用戶只需在演示文稿中插入視頻,即可通過字幕選項,從支持的63種語言中選擇最合適的語言,然后點擊生成字幕。
此外,微軟還透露,該功能可在PowerPoint應用程序中快速掃描長達兩個小時的視頻,并在數分鐘內生成字幕。完成后,用戶可點擊“編輯字幕”按鈕,對自動生成的字幕進行修正。當用戶發現需編輯的字幕部分時,視頻將會自動播放。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
微軟
+關注
關注
4文章
6598瀏覽量
104066 -
語音識別
+關注
關注
38文章
1739瀏覽量
112661 -
應用程序
+關注
關注
37文章
3268瀏覽量
57710
發布評論請先 登錄
相關推薦
基于語音識別的智能會議系統具備哪些交互功能
標貝科技專注智能語音交互領域多年,在語音識別和語音合成領域有著多項大型企業合作案例,標貝與多個智能會議系統廠商合作,成功將
ChatGPT新增實時搜索與高級語音功能
在OpenAI的第八天技術分享直播中,ChatGPT的搜索功能迎來了重大更新。此次更新不僅豐富了ChatGPT的功能體系,更提升了其實用性和競爭力。 新增的實時搜索功能,是此次更新的亮
微軟預覽版Copilot Vision AI功能上線
微軟公司近日宣布,將面向美國地區的Copilot Pro用戶推出預覽版的Copilot Vision AI功能。這一創新功能旨在通過人工智能技術,進一步提升用戶的網頁瀏覽體驗。 Cop
語音識別與自然語言處理的關系
在人工智能的快速發展中,語音識別和自然語言處理(NLP)成為了兩個重要的技術支柱。語音識別技術使得機器能夠理解人類的語音,而自然語言處理則讓
ASR與傳統語音識別的區別
識別技術。 構建更深更復雜的神經網絡模型,利用大量數據進行訓練。 提高了語音識別的準確率和穩定性。 傳統語音識別 : 通常依賴于聲學-語言模
什么是離線語音識別芯片?與在線語音識別的區別
離線語音識別芯片適用于智能家電等,特點為小詞匯量、低成本、安全性高、響應快,無需聯網。在線語音識別功能更廣泛、
Transformer模型在語音識別和語音生成中的應用優勢
隨著人工智能技術的飛速發展,語音識別和語音生成作為人機交互的重要組成部分,正逐漸滲透到我們生活的各個方面。而Transformer模型,自其誕生以來,憑借其獨特的自注意力機制和并行計算
谷歌將優化安卓系統的實時字幕功能,用戶可更改字幕行數
Live Captions作為安卓系統的輔助工具,能自動識別并實時將音頻轉化為字幕。此功能對聽力受損或環境嘈雜時難以理解內容的人群十分有用。
微軟OneNote引入“便箋”功能并更改圖標為紫色,新增搜索框
如今,微軟官方宣布這一功能已進入穩定運行階段,所有Windows用戶均可嘗試最新版本的OneNote應用,體驗其新增的“便箋”功能。
微軟onedrive網頁版新增離線模式
此項新功能開放后,客戶可利用網頁版OneDrive的離線模式實現諸如主頁、個人文檔、共享、收藏夾、人員管理和會議視圖等基本功能。同時,用戶還能查閱文件夾、文件名稱,獲取所有者、大小、活動和上次訪問時間等詳細信息。
微軟網頁版Excel新增復制粘貼功能,助力提升用戶工作效率
今日,微軟公司宣布推出Microsoft 365Insider項目,面向會員開放網頁版Excel的試用機會,旨在通過提升復制粘貼功能來提高用戶生產效率。
谷歌Chrome瀏覽器實時字幕功能拓展至11種語言,覆蓋簡繁中文
這款名為“提供音頻和視頻自動字幕生成”的功能,不僅能夠實現設備間數據零泄漏,而且在IT之家當前所試用的最新穩定版Chrome瀏覽器環境下,其主要界面將顯示為英文,但同時也兼容其他如法語、德語及意大利語的
微軟相冊更新生成式擦除編輯功能,消除照片干擾
微軟公開宣布,已經成功地將最近研發出的所有人工智能編輯功能(包括模糊背景、刪除及替換背景以及生成式擦除)移植到適配Arm64設備和Windows 10的照片應用中,現在已面向全平臺的W
評論