在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌AI探索無障礙溝通

23gi_ifanr ? 來源:fqj ? 2019-05-12 09:14 ? 次閱讀

Steve Saling 罹患肌萎縮性脊髓側索硬化癥(ALS)已有 13 年光景,這是一段人生大門逐漸關閉的過程。

ALS 俗稱漸凍癥,發病后肌肉僵硬,抽搐,造成說話或吞咽困難,再逐漸到手臂和腿部無力,最終失去自主控制運動的能力。英國著名物理學家霍金即患此病。Steve Saling 與人交流,是通過眼球追蹤技術來控制計算機上的虛擬鍵盤打字,溝通十分低效。

圖 | 漸凍癥患者 Steve Saling

如今,在新技術的幫助下,他在觀看運動賽事的精彩瞬間時,竟然可以發出歡呼。只不過,聲音是通過臉部表情控制機器發出的。通過加入谷歌的 Project Euphonia 項目,Steve Saling 可以自主訓練機器學習模型,當模型更了解他的面部表情,不出聲即可操作 Google Home。

圖 | Steve Saling 正在自主訓練機器學習模型

在 2019 谷歌開發者大會上,失聰設計師 Elise Roy 與谷歌科學家、哈佛教授 Michael Brenner 共同宣布 Project Euphonia 項目。Michael Brenner 博士確信 AI 技術能解決 ALS 患者這一特定的語言障礙問題,但同時也需要大眾的協助,提供更多的聲音樣本供模型訓練。

生活中的方方面面都涉及到與他人溝通,以及被他人理解。

想象一下,如果旁人難以理解我們的說話或表達方式時,生活會變成什么樣,是不是會感到不便和心情沮喪?

然而,對上千萬的中風、ALS 、多發性硬化、創傷性腦損傷和帕金森氏癥等神經系統疾病而產生語言障礙的人士來說,這就是他們每天都必須面對的情況。

造成語言障礙的成因有很多,有些是聽力受損,有的是腦部控制語言的神經系統受到創傷,還有的是臉部肌肉不受控制,導致發音模糊,含糊不清。

非營利組織 ALS-TDI(美國 ALS 研究機構)的臨床團隊在過去幾年中發現,即使有嚴重發音障礙(語言障礙)的 ALS 患者,也可以被親密朋友和家人理解。這說明,只要有足夠多的聲音樣本,AI 可以學習如何解釋受損的聲音。

看到這一技術實現的可能性后,谷歌在 2019 開發者大會上推出 Project Euphonia,計劃用 AI 來了解語言障礙者的講話方式,例如含糊不清、不完整的講話,從而實現精準的語音轉寫。

此項目的聲音樣本主要通過與 ALS-TDI(美國 ALS 研究機構)與 ALS Residence Initiative(ALS 住宅計劃)合作獲得,錄下 ALS 患者的聲音,然后將錄下的語音轉成聲譜圖,或以更視覺化的圖像方式來呈現聲音。接著計算機用轉錄的聲譜圖拿來訓練模型,以更準確辨識這類非典型的語音。

目前設計的 AI 模型是以典型的 ALS 相關障礙的英語人士為目標對象,相信不久后這項研究將可應用到更大范圍的不同語言障礙人群。

谷歌語音研究員 Dimitri Kanevsky 是一名聽力障礙者,幼年失聰后才開始學的英文,他的主要語言障礙是發音不標準,吐字模糊。

谷歌的語音轉錄程序顯然無法對非標準發音的句子進行高精確識別。于是 Kanevsky 研究員錄入了 15000 條自己的語音數據來對模型訓練,起初效果并不明顯,但在他的堅持下模型終于有了不錯的表現,程序可以很準確識別他的聲音,適應了他講話的方式。

不同語言障礙的人群所需要的技術不同,技術實現的難度也不同,但最終實現的效果是一樣的,理解和被理解。這是人類溝通的快樂源泉。

目前谷歌的 Live Transcribe 轉錄技術也可以作為聽障人士的輔助交流工具。

圖 | Live Transcribe 轉錄過程

此次谷歌開發者大會上,谷歌也推出了 Live Relay 功能,可以讓設備在語音和文本之間進行轉換,語音信息實時轉化成文本,并且以語音的形式轉換回來,可以幫助聽力障礙或失聰人士打電話。

Live Relay 是系統中原生功能,不需要聯網就可以在終端上運行,因此能確保通話的隱私性。

雖然 Live Relay 還在早期研究階段,不過谷歌對 Live Relay 的長期發展十分樂觀,這項技術不光是給語言障礙人群提供方便,未來所有用戶都能因這項服務受益。比如,很多用戶都曾有需要接聽重要電話,但無法離開當下手邊正在進行的事項的經歷,在 Live Relay 的幫助下,用戶不必實際與對方交談,也能隨時隨地通過輸入文本的方式接聽電話,甚至可集成即時翻譯功能,讓用戶能與世界各地的人通話,完全不必擔心語言隔閡。

谷歌 AI 在語音識別和轉錄技術上已達到非常領先的水準,雖然在理解語言障礙者的發音和講話方式還在探索中,但這無疑是離終極目標——無障礙溝通最近的一次。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6172

    瀏覽量

    105618
  • AI
    AI
    +關注

    關注

    87

    文章

    31076

    瀏覽量

    269410

原文標題:為了追求一個更真實的游戲世界,我們還缺乏什么?| 近未來 ⑤

文章出處:【微信號:ifanr,微信公眾號:愛范兒】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    數據采集與傳輸無障礙 簡化設備,解決隧道深部監測難題 擺脫信號盲區的困擾

    數據采集與傳輸無障礙 簡化設備,解決隧道深部監測難題 擺脫信號盲區的困擾 根據實際情況和工程環境,我們特別推出了一種一站式現場監測方案,旨在方便快捷地完成隧道深部及信號盲區部分的施工監測。我們利用
    的頭像 發表于 12-21 17:29 ?126次閱讀
    數據采集與傳輸<b class='flag-5'>無障礙</b> 簡化設備,解決隧道深部監測難題 擺脫信號盲區的困擾

    谷歌發布Gemini 2.0 AI模型

    谷歌近日正式推出了新一代AI模型——Gemini 2.0。此次更新引入了名為“深度研究”的新特性,旨在為用戶提供更加全面和深入的復雜主題探索與報告撰寫輔助。 Gemini 2.0通過高級推理和長上
    的頭像 發表于 12-12 10:13 ?252次閱讀

    HarmonyOS NEXT應用元服務開發標注屏幕朗讀內容的場景

    控件包含顯示文本(text)、無障礙文本(accessibilityText)2個屬性,其中,顯示文本為用戶界面上呈現的信息,無障礙文本為無障礙專有的朗讀信息,不在界面上顯示。屏幕朗讀提取信息進行
    發表于 10-12 15:52

    開發者大會成功舉辦 vivo用科技搭建人與數字世界的無障礙橋梁

    2024年10月10日,vivo開發者大會在深圳舉辦,其中信息無障礙分會場受到外界廣泛關注。vivo副總裁、OS產品副總裁、vivo AI全球研究院院長周圍及全國政協委員,中國殘疾人聯合會理事,中國
    發表于 10-12 14:18 ?152次閱讀
    開發者大會成功舉辦 vivo用科技搭建人與數字世界的<b class='flag-5'>無障礙</b>橋梁

    HarmonyOS NEXT應用元服務開發Accessibility(信息無障礙)介紹

    Accessibility(信息無障礙),是指任何人在任何情況下都能平等、方便地獲取信息并利用信息。其目的是縮小全社會不同階層、不同地區、不同年齡、不同健康狀況的人群在信息理解、信息交互、信息利用
    發表于 10-09 10:29

    蘋果承認使用谷歌芯片來訓練AI

    蘋果公司最近在一篇技術論文中披露,其先進的人工智能系統Apple Intelligence背后的兩個關鍵AI模型,是在谷歌設計的云端芯片上完成預訓練的。這一消息標志著在尖端AI訓練領域,大型科技公司正積極
    的頭像 發表于 07-30 17:03 ?743次閱讀

    華為致力于推動無障礙技術發展

    的智能生活新紀元。這場聚焦前沿科技的盛會并未止步于技術的展示,而是進一步拓展至人文情懷與平等包容,用一場“湖畔對談”無障礙活動以及TECH4ALL數字包容展館,為我們呈現了一次科技與人文的對話。 ? 今年已經是第三年,華為在HDC現場舉辦與華為無障礙用戶交流
    的頭像 發表于 06-29 16:13 ?751次閱讀

    鴻蒙ArkTS聲明式開發:跨平臺支持列表【無障礙屬性】 通用屬性

    組件可以設置相應的無障礙屬性和事件來更好地使用無障礙能力。
    的頭像 發表于 06-11 17:30 ?416次閱讀
    鴻蒙ArkTS聲明式開發:跨平臺支持列表【<b class='flag-5'>無障礙</b>屬性】 通用屬性

    榮耀新品將搭載谷歌AI功能,提升生成式AI體驗

    榮耀于5月22日宣布,將在新款智能手機上集成谷歌AI功能,實現生成式AI體驗。此外,新機還將得到谷歌云服務的支持。
    的頭像 發表于 05-23 08:51 ?501次閱讀

    谷歌增強安卓無障礙體驗:用AI描述周圍環境等

     據悉,Lookout是谷歌專為盲人與低視力Android用戶設計的應用,旨在協助他們識別周邊環境并閱讀文檔。此次升級后,Lookout新增了一種查找模式,可識別包括座椅、桌子等在內的七大類物品,并告知用戶距離及行走方向。
    的頭像 發表于 05-17 10:18 ?421次閱讀

    谷歌發布多模態AI新品,加劇AI巨頭競爭

    在全球AI競技場上,谷歌與OpenAI一直穩居領先地位。近日,谷歌在I/O開發者大會上掀起了一股新的技術浪潮,發布了多款全新升級的多模態AI產品。
    的頭像 發表于 05-16 09:28 ?458次閱讀

    交通運輸部大力推廣適老化無障礙交通服務

    4月3日,交通運輸部發布了關于2024年適老化無障礙交通出行服務擴容提質增效的實施方案。方案明確了出租車電動召回和網絡預約車輛的“一鍵召喚”服務要在地級市以上的所有城市實現全區覆蓋;
    的頭像 發表于 04-03 16:15 ?918次閱讀

    基于STM32H743IIT6開發的代碼,是否能不經修改無障礙地運行在STM32H753IIT6上?

    基于 STM32H743IIT6 開發的代碼,是否能不經修改無障礙地運行在STM32H753IIT6上?
    發表于 03-29 06:19

    蘋果iOS 18和macOS 15無障礙功能升級

    Adaptive Voice Shortcuts功能可讓用戶把獨特的口語短語綁定到無障礙設定中。用戶能自行設定定制化短語,只需講述這段話便能啟動他們所需的輔助功能設置; 例如VoiceOver,語音控制,縮放等諸多現有輔助功能都能用此方法進行快速切換。
    的頭像 發表于 03-08 11:08 ?738次閱讀

    谷歌AI大模型Gemma全球開放使用

    谷歌公司近日宣布,其全新的AI大模型Gemma現已在全球范圍內開放使用。這一重要舉措不僅彰顯了谷歌AI領域的領先地位,還為其在全球范圍內的競爭力增添了新
    的頭像 發表于 02-28 18:12 ?1171次閱讀
    主站蜘蛛池模板: 啪啪网免费| 中文字幕一区二区在线观看| 亚洲第一免费网站| 亚洲va国产日韩欧美精品色婷婷 | 边做边爱在线观看视频免费| 最色网站| 四虎网站最新网址| 欧美综合视频| 久久精品综合网| 丁香花在线| 天天干天天射天天舔| 美女天天操| 欧美色淫| 国产三级精品在线观看| 国产特黄一级毛片特黄| 1024成人| 久草资源免费| 丁香六月激情网| 国产高清在线观看| 婷婷色激情| 一个人看的www片免费高清视频| 亚洲免费影视| 奇米视频在线观看| 国产拍拍视频| 日日干天天操| 天天草天天射| 56pao强力打造| 草草影院私人免费入口| h国产在线观看| 5252色欧美在线激情| 足控免费视频xxav| 色老头一区二区三区在线观看| 六月丁香婷婷综合| 午夜视频在线观看视频| 天天狠天天操| 在线视频免费播放| 伊人最新网址| 免费你懂的| 天天视频国产免费入口| 激情欧美在线| 四虎最新视频|