在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

圖像捕獲是AI中最難的問題之一

倩倩 ? 來源:新經(jīng)網(wǎng) ? 作者:新經(jīng)網(wǎng) ? 2020-10-15 14:03 ? 次閱讀

長期以來,AI的目標就是準確地描述圖像,而不僅僅是像笨拙的機器人。谷歌在2016年表示,其人工智能可以為人類提供幾乎與人類一樣的字幕圖像,準確度達到94%。現(xiàn)在,微軟表示,它走得更遠:它的研究人員建立了一個AI系統(tǒng),甚至比人類更準確-以至于現(xiàn)在坐上了榜首的nocaps圖像字幕標桿。微軟聲稱其自2015年以來一直使用的圖像字幕模型要好兩倍。

盡管這本身就是一個顯著的里程碑,但微軟不僅僅是將這項技術保留在自己手中。現(xiàn)在,它作為Azure認知服務的一部分提供了新的字幕模型,因此任何開發(fā)人員都可以將其引入他們的應用程序中。今天,它也可以在Seeing AI中使用,Seeing AI是面向盲人和視障用戶的Microsoft應用程序,可以描述周圍的世界。今年下半年,字幕模型還將改善您在PowerPoint中針對Web,Windows和Mac的演示文稿。它還會在桌面平臺的Word和Outlook中彈出。

Azure AI的CVP Eric Boyd在接受Engadget采訪時說:“圖像捕獲是AI中最難的問題之一。它不僅代表理解場景中的對象,還包括它們之間的交互方式,以及如何描述它們。”精細的字幕技術可以為每個用戶提供幫助:它使在搜索引擎中查找所需圖像變得更加容易;對于視障用戶,它可以使瀏覽網(wǎng)絡和軟件變得更加出色。

看到公司吹捧他們的AI研究創(chuàng)新并不少見,但是將這些發(fā)現(xiàn)迅速部署到運輸產(chǎn)品中卻很少見。Azure AI認知服務的CTO Huang Xuedong出于對用戶的潛在好處,推動將其迅速集成到Azure中。他的團隊使用標記有特定關鍵字的圖像對模型進行了訓練,這有助于使它成為大多數(shù)AI框架所沒有的視覺語言。通常,這些類型的模型是使用圖像和完整標題訓練的,這使得模型更難于學習特定對象的交互方式。

“視覺詞匯預訓練本質(zhì)上是訓練系統(tǒng)所需的教育;我們正在嘗試教育這種運動記憶,”黃在博客文章中說。這就是這種新模型在nocaps基準測試中的優(yōu)勢,該基準測試側(cè)重于確定AI可以如何為字幕創(chuàng)建字幕,這些字幕從未見過。

但是,盡管要打破基準很重要,但微軟新模型的真正考驗將是它在現(xiàn)實世界中的功能。據(jù)博伊德說,Seeing AI開發(fā)人員Saqib Shaik也在自己的盲人手中推動了Microsoft的更大可訪問性,他說這是對他們先前產(chǎn)品的巨大改進。既然微軟已經(jīng)設定了一個新的里程碑,那么有趣的是,看看來自Google和其他研究人員的競爭模型也將如何競爭。

責任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 微軟
    +關注

    關注

    4

    文章

    6610

    瀏覽量

    104159
  • 機器人
    +關注

    關注

    211

    文章

    28501

    瀏覽量

    207472
  • AI
    AI
    +關注

    關注

    87

    文章

    31097

    瀏覽量

    269430
收藏 人收藏

    評論

    相關推薦

    攝像頭捕獲 2D 圖像,深度傳感器拉長距離

    的,但單獨的攝像頭只能捕獲2D圖像。為了發(fā)揮作用,還需要使他們獲得深度信息。例如:自動感應水龍頭需要識別與手的距離、機器人和自動駕駛汽車需要檢測到與物體的距離以避免碰
    的頭像 發(fā)表于 12-08 01:01 ?261次閱讀
    攝像頭<b class='flag-5'>捕獲</b> 2D <b class='flag-5'>圖像</b>,深度傳感器拉長距離

    高通AI Hub:輕松實現(xiàn)Android圖像分類

    高通AI Hub為開發(fā)者提供了個強大的平臺,以優(yōu)化、驗證和部署在Android設備上的機器學習模型。這篇文章將介紹如何使用高通AI Hub進行圖像分類的程式碼開發(fā),并提供
    的頭像 發(fā)表于 11-26 01:03 ?265次閱讀
    高通<b class='flag-5'>AI</b> Hub:輕松實現(xiàn)Android<b class='flag-5'>圖像</b>分類

    AI圖像識別攝像機

    隨著科技的迅猛發(fā)展,人工智能(AI)在各個領域的應用越來越廣泛,其中圖像識別技術尤為引人注目。AI圖像識別攝像機作為這技術的重要應用
    的頭像 發(fā)表于 11-08 10:38 ?278次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>圖像</b>識別攝像機

    AI大模型的訓練數(shù)據(jù)來源分析

    AI大模型的訓練數(shù)據(jù)來源廣泛且多元化,這些數(shù)據(jù)源對于構建和優(yōu)化AI模型至關重要。以下是對AI大模型訓練數(shù)據(jù)來源的分析: 、公開數(shù)據(jù)集 公開數(shù)據(jù)集是
    的頭像 發(fā)表于 10-23 15:32 ?752次閱讀

    AI大模型在圖像識別中的優(yōu)勢

    AI大模型在圖像識別中展現(xiàn)出了顯著的優(yōu)勢,這些優(yōu)勢主要源于其強大的計算能力、深度學習算法以及大規(guī)模的數(shù)據(jù)處理能力。以下是對AI大模型在圖像識別中優(yōu)勢的介紹:
    的頭像 發(fā)表于 10-23 15:01 ?748次閱讀

    圖像采集卡:增強視覺數(shù)據(jù)采集

    。什么是圖像采集卡?圖像采集卡,是種專門用于捕獲和處理來自不同來源的視頻信號或圖像的硬件組件。它們充當成像設備(例如相機或視頻源)與計算機
    的頭像 發(fā)表于 09-24 11:06 ?321次閱讀
    <b class='flag-5'>圖像</b>采集卡:增強視覺數(shù)據(jù)采集

    Freepik攜手Magnific AI推出AI圖像生成器

    近日,設計資源巨頭Freepik攜手Magnific AI,共同推出了革命性的AI圖像生成器——Freepik Mystic,這里程碑式的發(fā)布標志著
    的頭像 發(fā)表于 08-30 16:23 ?1152次閱讀

    是德DSOX4032A示波器波形捕獲

    在電子工程領域,示波器是不可或缺的工具之一。而其中,是德DSOX4032A示波器以其卓越的性能和精準的測量能力備受青睞。今天,我們就來深入了解下是德DSOX4032A示波器的波形捕獲率。
    的頭像 發(fā)表于 08-30 15:38 ?287次閱讀
    是德DSOX4032A示波器波形<b class='flag-5'>捕獲</b>率

    OpenAI發(fā)布圖像檢測分類器,可區(qū)分AI生成圖像與實拍照片

    據(jù)OpenAI介紹,初步測試結(jié)果表明,該分類器在辨別非AI生成圖像與DALL·E 3生成圖像時,成功率高達近98%,僅有不到0.5%的非AI圖像
    的頭像 發(fā)表于 05-09 09:57 ?476次閱讀

    UL Procyon AI 發(fā)布圖像生成基準測試,基于Stable Diffusion

    UL去年發(fā)布的首個Windows版Procyon AI推理基準測試,以計算機視覺工作負載評估AI推理性能。新推出的圖像生成測試將提供統(tǒng)、精確且易于理解的工作負載,用以保證各支持硬件間
    的頭像 發(fā)表于 03-25 16:16 ?905次閱讀

    AI女友比AI男友更受歡迎?前者是后者的700%+

    生成式 AI 催生了各種新的應用類別,但其中最大的影響之一是重新激活了 AI 約會和陪伴……
    的頭像 發(fā)表于 03-18 09:07 ?444次閱讀

    種油冷扁線電機開發(fā)多物理域設計高效解決方案

    散熱冷卻是電機設計過程中最難處理的問題之一。只有提升電機的散熱效果, 才能實現(xiàn)更高的功率密度和轉(zhuǎn)矩密度。
    的頭像 發(fā)表于 03-13 10:36 ?569次閱讀
    求<b class='flag-5'>一</b>種油冷扁線電機開發(fā)多物理域設計高效解決方案

    cycx3_uvc_ov5640如何添加Method 1支持的靜態(tài)圖像捕獲功能?

    根據(jù)例程 cycx3_uvc_ov5640可以實現(xiàn) Method 2拍照功能,我們的設備需要按鍵拍照功能,請問如何添加 Method 1 支持的靜態(tài)圖像捕獲功能,如何實現(xiàn)此功能?
    發(fā)表于 03-06 06:10

    Stability AI試圖通過新的圖像生成人工智能模型保持領先地位

    Stability AI的最新圖像生成模型Stable Cascade承諾比其業(yè)界領先的前身Stable Diffusion更快、更強大,而Stable Diffusion是許多其他文本到圖像生成
    的頭像 發(fā)表于 02-19 16:03 ?959次閱讀
    Stability <b class='flag-5'>AI</b>試圖通過新的<b class='flag-5'>圖像</b>生成人工智能模型保持領先地位

    計算機視覺:AI如何識別與理解圖像

    計算機視覺是人工智能領域的個重要分支,它致力于讓機器能夠像人類樣理解和解釋圖像。隨著深度學習和神經(jīng)網(wǎng)絡的發(fā)展,人們對于如何讓AI識別和理解圖像
    的頭像 發(fā)表于 01-12 08:27 ?1480次閱讀
    計算機視覺:<b class='flag-5'>AI</b>如何識別與理解<b class='flag-5'>圖像</b>
    主站蜘蛛池模板: 欧美夜夜夜| 综合五月激情| 天天摸夜夜添夜夜添国产| 天天狠天天透天干天天怕处| 色综合久久98天天综合| 精品久久看| 欧美成人性高清观看| 中文字幕一区二区三区永久| 色综合久久网女同蕾丝边| 永久精品免费影院在线观看网站| 亚洲精品美女| 日本动漫在线看| 国产激情电影综合在线看| 偷操| 国产精品久久久久久久牛牛| h网站在线| 最新天堂| 三级毛片在线免费观看| 久久美女精品国产精品亚洲| 97午夜影院| 九九热国产| 日本在线观看一区| 婷婷亚洲五月| 久久久久青草| 天天综合天天做| 51精品国产| 种子在线搜索| 男女网站在线观看| 影音先锋色偷偷米奇四色| 久久啊| 老司机亚洲精品影院在线观看| 四虎在线播放免费永久视频| 麻豆美女大尺度啪啪| 夜夜cao| 在线播放视频网站| 永久黄网站色视频免费| 欧美wwwwww| 天天色综合5| 黄视频网站在线| 天堂资源在线官网| 国产一级特黄aa大片免费|