Facebook通過AI改善視障人士的體驗(yàn)

在Facebook和其他社交媒體平臺(tái)上最常見的分享內(nèi)容之一是照片。雖然大多數(shù)社交媒體用戶都能看懂一張圖片，并了解它所代表的內(nèi)容，但對于那些盲人或視障人士來說就不那么容易了。Facebook表示，屏幕閱讀器可以使用合成語音描述這些圖片的內(nèi)容，讓盲人或視障用戶能夠理解Facebook feed中的圖片。

然而，許多照片在發(fā)布時(shí)沒有alt文字，導(dǎo)致Facebook在2016年推出了自動(dòng)替代文本（AAT）。該技術(shù)利用對象識(shí)別技術(shù)為盲人或視障用戶按需生成照片的描述。自2016年以來，F(xiàn)acebook一直致力于改進(jìn)AAT，并在最近推出了下一代技術(shù)。Facebook在AAT上的進(jìn)步改善了用戶的照片體驗(yàn)，AAT可以可靠地檢測和識(shí)別照片中的概念數(shù)量擴(kuò)大了十倍以上。這意味著沒有描述的照片減少了，提供的描述也更加詳細(xì)。AAT可以識(shí)別活動(dòng)、地標(biāo)、動(dòng)物類型等等。

AAT現(xiàn)在會(huì)給出這樣的描述：“可能是兩個(gè)人的自拍，戶外，比薩斜塔”。Facebook還表示，能夠在照片中加入有關(guān)元素的潛在位置和相對大小的信息是行業(yè)首創(chuàng)。它不是簡單地描述 “可能是五人的合影”，而是描述成“兩個(gè)人在照片的中心，另外三個(gè)人向邊緣分散。”

Facebook表示，這一進(jìn)步可以幫助盲人或視力受損的用戶更好地理解家人和朋友發(fā)布照片中的內(nèi)容。最新版本的AAT使用了一個(gè)在數(shù)十億張Instagram公開圖片和標(biāo)簽數(shù)據(jù)上訓(xùn)練出來的模型。訓(xùn)練后產(chǎn)生的模型更加準(zhǔn)確，并且在文化和人口統(tǒng)計(jì)方面更具包容性。改進(jìn)后的AAT可以可靠地識(shí)別1200多個(gè)概念。
責(zé)編AJX

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

AI

AI

+關(guān)注

關(guān)注
87

文章
30979

瀏覽量
269253
Facebook

Facebook

+關(guān)注

關(guān)注
3

文章
1429

瀏覽量
54785
照片

照片

+關(guān)注

關(guān)注
0

文章
15

瀏覽量
9613

評(píng)論

相關(guān)推薦

Luma AI全新視頻模型Ray 2即將面向消費(fèi)者、專業(yè)人士和開發(fā)者開放

，Luma AI宣布其最新版Luma AI Ray 2視頻模型即將發(fā)布，該模型僅需10秒即可根據(jù)文本和圖像提示生成視頻。Luma AI Ray 2視頻模型面向普通消費(fèi)者、專業(yè)消費(fèi)者及專業(yè)人士

發(fā)表于 12-18 09:49 ?135次閱讀

使用NVIDIA Jetson打造機(jī)器人導(dǎo)盲犬

Selin Alara Ornek 是一名富有遠(yuǎn)見的高中生。她使用機(jī)器學(xué)習(xí)和 NVIDIA Jetson邊緣 AI 和機(jī)器人平臺(tái)，為視障人士打造了機(jī)器人導(dǎo)盲犬。

發(fā)表于 11-09 13:51 ?265次閱讀

使用機(jī)器學(xué)習(xí)和NVIDIA Jetson邊緣AI和機(jī)器人平臺(tái)打造機(jī)器人導(dǎo)盲犬

Selin Alara Ornek 是一名富有遠(yuǎn)見的高中生。她使用機(jī)器學(xué)習(xí)和 NVIDIA Jetson 邊緣 AI 和機(jī)器人平臺(tái)，為視障人士打造了機(jī)器人導(dǎo)盲犬。該項(xiàng)目名為 I

發(fā)表于 11-08 10:05 ?406次閱讀

助盲環(huán)境感知裝置設(shè)計(jì)方案

今天為大家?guī)淼氖莵碜詣?chuàng)作者X同學(xué)的作品：助盲環(huán)境感知裝置. 這個(gè)裝置主要利用Grove Vision AI V2-Camera module識(shí)別環(huán)境中的物體，并利用XIAO ESP32S3和樹莓派進(jìn)行語音輸出，結(jié)合了物體檢測和文本轉(zhuǎn)語音技術(shù)，以向視

發(fā)表于 11-05 11:42 ?235次閱讀

如何通過改善工藝解決電感噪音問題

電子發(fā)燒友網(wǎng)站提供《如何通過改善工藝解決電感噪音問題.docx》資料免費(fèi)下載

發(fā)表于 11-04 10:23 ?0次下載

機(jī)器人紅外避障

機(jī)器人紅外避障

發(fā)表于 09-19 12:57 ?0次下載

利用圖像處理板避障讓小型飛行器像昆蟲一樣靈巧

許多小型化的飛行器類似于昆蟲，憑借其機(jī)動(dòng)、靈活、體積小的特點(diǎn)能夠在復(fù)雜的環(huán)境中執(zhí)行飛行任務(wù)。但是再精細(xì)化的操控，也難以做到完全避免障礙物的阻礙，因此可以采用AI圖像處理板來輔助避障。AI避障

發(fā)表于 07-31 08:30 ?275次閱讀

智行者——視聽障礙者出行輔助AI小車設(shè)計(jì)

摘要據(jù)統(tǒng)計(jì)，我國視障人數(shù)達(dá)1731萬人，聽力殘疾患者2780萬人。視聽障礙者對出行和交流需求迫切，但現(xiàn)有設(shè)施和輔具局限性大，使他們面臨出行難題。因此，我們開發(fā)了一款安全、精準(zhǔn)、語音與手部交互的導(dǎo)航避

發(fā)表于 07-19 08:11 ?678次閱讀

強(qiáng)強(qiáng)聯(lián)合！深視智能攜手Zebra公司成功舉辦“3D機(jī)器視覺+AI融合技術(shù)”研討會(huì)

?深視智能&斑馬技術(shù)7月9號(hào)下午，VisionChina行業(yè)盛會(huì)期間，深視智能與領(lǐng)先數(shù)字解決方案提供商Zebra公司強(qiáng)強(qiáng)聯(lián)合，成功舉辦一場以“AI時(shí)代下3D機(jī)器視覺與AI技術(shù)融合創(chuàng)新

發(fā)表于 07-16 10:40 ?514次閱讀

蘋果與Meta討論建立AI合作伙伴關(guān)系

在人工智能（AI）技術(shù)日新月異的今天，各大科技巨頭紛紛搶灘AI賽道，力圖通過技術(shù)革新引領(lǐng)行業(yè)變革。近日，有知情人士透露，Facebook的母

發(fā)表于 06-24 18:09 ?1345次閱讀

AGV小車使用避障雷達(dá)

AGV（自動(dòng)導(dǎo)引車）小車使用避障雷達(dá)是為了確保其在運(yùn)行過程中的安全性和穩(wěn)定性。避障雷達(dá)，如激光雷達(dá)或超聲波雷達(dá)，能夠?qū)崟r(shí)檢測并避免與障礙物發(fā)生碰撞。 AGV小車避障雷達(dá)的安裝和使用通常涉及以下

發(fā)表于 05-20 10:48 ?643次閱讀

創(chuàng)客打造智能眼鏡，助聽障人士理解手語

據(jù)悉，知名創(chuàng)客Nekhil近期將樹莓派進(jìn)行深度改裝，成功研發(fā)出一款可用于解讀手語的智能眼鏡，以解決聽障人士的溝通問題。

發(fā)表于 04-23 15:32 ?494次閱讀

AI正通過智能家居幫助我們?nèi)朊?/a>

電子發(fā)燒友網(wǎng)報(bào)道（文/黃山明）隨著AI的發(fā)展，這一技術(shù)已經(jīng)與人們的生活緊密結(jié)合，甚至包括我們的睡眠。目前可以看到AI技術(shù)正在積極地賦能智能家居睡眠產(chǎn)品，以提高睡眠質(zhì)量和改善睡眠環(huán)境。 ? 比如

 發(fā)表于 04-12 00:08 ?3287次閱讀

 曠視科技與上海家化正式簽署《AI科技創(chuàng)新合作框架協(xié)議》

3月18日，在2024年上海家化“致美·致時(shí)代”年度發(fā)布會(huì)上，上海家化聯(lián)合股份有限公司與北京曠視科技有限公司正式簽署《AI科技創(chuàng)新合作框架協(xié)議》，雙方將在AI賦能美業(yè)領(lǐng)域進(jìn)一步展開深度合作，以

發(fā)表于 03-20 10:21 ?598次閱讀

幾種不同數(shù)據(jù)采集的概念：遙測、遙控、遙信、遙調(diào)、遙視、遙感

遙測、遙控、遙信、遙調(diào)、遙視、遙感、遙視：這幾種技術(shù)在概念上容易混淆，在數(shù)據(jù)自動(dòng)采集中常常用到，各自有不同的用途，下面加以簡述：遙測 (Telemetry)： ? 通過遠(yuǎn)程傳輸數(shù)據(jù)來監(jiān)測遠(yuǎn)程系統(tǒng)中

發(fā)表于 03-04 11:10 ?3270次閱讀

精選推薦
更多

文章

資料

帖子

【科普系列】LIN協(xié)議錯(cuò)誤類型介紹

北匯信息POLELINK
8小時(shí)前

244 閱讀

RJ45網(wǎng)口PCB設(shè)計(jì)：制造與實(shí)踐要點(diǎn)

PCB學(xué)習(xí)醬
9小時(shí)前

241 閱讀

自動(dòng)駕駛中常提的魯棒性是個(gè)啥？

智駕最前沿
9小時(shí)前

230 閱讀

SiC MOSFET如何選擇柵極驅(qū)動(dòng)器

安森美
11小時(shí)前

290 閱讀

鑒相器和電荷泵的結(jié)構(gòu)設(shè)計(jì)及優(yōu)化

巨霖
16小時(shí)前

302 閱讀

漢口火車站客車自動(dòng)上水系統(tǒng)

鄭成枝
63

5積分

38下載

高級(jí)駕駛輔助系統(tǒng)ADAS核心設(shè)計(jì)攻略

盧國藝
4281KB

5積分

234下載

RepRap開源3D打印機(jī)

klysa
11.57 MB

2積分

7下載

bitcoinjs-lib比特幣客戶端功能的javascript實(shí)現(xiàn)

李勇俊
0.40 MB

2積分

2下載

Pg_Partman PostgreSQL的分區(qū)管理擴(kuò)展插件

石正厚
1.42 MB

免費(fèi)

0下載

鴻蒙原生頁面高性能解決方案上線OpenHarmony社區(qū) 助力打造高性能原生應(yīng)用

HarmonyOS開發(fā)者社區(qū)
1天前

206 閱讀

VirtualLab Fusion應(yīng)用：具有高數(shù)值孔徑的反射顯微鏡系統(tǒng)

jf_37601689
1天前

209 閱讀

RJ45網(wǎng)口PCB設(shè)計(jì)：制造與實(shí)踐要點(diǎn)

鄒夢雨
1天前

203 閱讀

開源項(xiàng)目！能夠精確地行走、跳舞和執(zhí)行復(fù)雜動(dòng)作的機(jī)器人—Tillu

紅舊衫
1天前

223 閱讀

開源項(xiàng)目！3D打印的遠(yuǎn)程控制雙速全驅(qū)汽車

聽我講
1天前

265 閱讀

推薦專欄
更多

搜索歷史

Facebook通過AI改善視障人士的體驗(yàn)

評(píng)論