盗墓笔记小说txt下载,小说网,完美世界前传下载

在IBM最新的論文中，研究人員提出了一種能自主制作多樣化、創造性和符合人類語境的圖片文字說明的模型。實驗證明，圖片的文字說明取得了“良好”的性能，未來可以為強大的新計算機視覺系統奠定了基礎。

無論是報社、雜志社還是新媒體，編輯們最不愿意干得事情就是為圖片搭配文字說明。事實上這項工作必要且重要但實際操作上又非常枯燥。

不過，一個振奮人心的消息是，AI可能很快就能處理大部分工作。6月18日在加州長灘舉行的2019年計算機視覺和模式識別會議(CVPR)上，Pierre L. Dognin, Igor Melnyk, Youssef Mroueh, Jarret Ross, Tom Sercu發表了一篇論文《改進圖像說明的對抗性語義對齊》，提出了一種能夠自主制作多樣化、創造性和符合人類語境的圖片文字說明的模型。

在論文中，他們將圖像說明作為一種有條件的GAN（生成式對抗網絡）訓練進行研究，提出了一種上下文感知的LSTM字幕器和共同注意鑒別器，它們加強了圖像和字幕之間的語義對齊。

研究人員根據經驗著重研究了SCST和ST兩種訓練方法的可行性。他們發現即使沒有直接訪問鑒別器梯度，SCST也比ST顯示出更穩定的梯度行為和更好的結果。進而還解決了對這些模型進行自動評估的開放性問題，引入了一個新的語義評分，并證明了它與人類判斷的強相關性。

作為評估范例，一個重要的標準是生成器能夠概括出平常不會一起出現的對象之間的組合關系。為此研究人員引入了一個小標題能脫離上下文（OOC）測試集。OOC與常規語義評分相結合，為圖片搭配說明文字得體系提出了新基準。當面向OOC和MS-COCO進行測試時，可以發現基于SCST的訓練在語義評分和人類評估方面都有很強的表現，有望成為高效離散GAN訓練的一種有價值的新方法。

目前，構建系統需要解決自動說明文字系統的一個主要缺點：順序語言生成導致語法正確—但同質、非自然和語義不相關的結構。

研究者的方法是通過一個注意力文字說明模型來解決這個問題，模型使用它正在觀察的照片中的場景片段來造句。在每一個生成步驟中，團隊的AI都可以選擇關注最后一步的視覺或文本提示。

為了確保生成的文字說明聽起來不太機械化，研究團隊在訓練時使用了生成對抗網絡(GANs)——由生成樣本的生成器和試圖區分生成樣本和現實世界樣本的鑒別器組成的兩部分神經網絡。共同注意鑒別器通過一個在像素級匹配場景和生成單詞的模型對新句子的“自然度”進行評分，使文字說明者能夠通過圖像和句子成對來進行合成。

文字說明系統中的另一個常見問題是，如何避免訓練數據集的偏差，即經常遭受過度擬合(特定數據集過于接近的分析)就需要構建診斷工具，否則并不適合推廣到學習對象(“床和臥室”)出現在看不見的環境(“床和森林”)中的場景。為此，研究人員提出了一種標題圖像的測試語料庫，其設計方式使得不良模型性能表明過度擬合。

在實驗中，Amazon's Mechanical Turk評估人員負責識別AI模型生成的文字說明，并判斷每句話對相應圖像的描述程度，給出幾個真實的和合成的樣本，研究人員表示，他們的文字說明總體上取得了“良好”的性能。他們相信他們的工作為強大的新計算機視覺系統奠定了基礎，并打算在未來的工作中繼續探索這些系統。另外，銜接語言和視覺語義的鴻溝表明需要將常識和推理融入場景理解中。

未來，圖像文字說明的自動生成和場景理解的進步，使AI系統可以作為視覺障礙者的助理改善他們的日常生活。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

IBM

IBM

+關注

關注
3

文章
1761

瀏覽量
74779
AI

AI

+關注

關注
87

文章
31364

瀏覽量
269769

原文標題：IBM發布最新AI模型，幫視障者“看”到更多

文章出處：【微信號：Aiobservation，微信公眾號：人工智能觀察】歡迎添加關注！文章轉載請注明出處。

IBM推出高性能AI模型Granite 3.0

在近日舉行的IBM年度TechXchange大會上，IBM正式推出了其最先進的AI模型家族——Granite 3.0。這款旗艦級語言模型代表

發表于 10-28 17:39 ?487次閱讀

IBM發布Granite 3.0 AI模型家族

IBM在近日舉行的年度TechXchange大會上，正式推出了其迄今為止最先進的AI模型家族——Granite 3.0。這一系列的發布標志著IBM

發表于 10-23 17:09 ?461次閱讀

IBM發布面向企業的人工智能模型新版本

近日，IBM正式發布了其面向企業的人工智能模型——Granite 3.0的最新版本，旨在抓住當前企業紛紛擁抱生成式AI技術的熱潮。與IBM

發表于 10-22 17:32 ?485次閱讀

IBM Granite系列模型被Forrester評為“強勁表現者”

近日，IBM 憑借其旗艦 Granite 系列模型，在 2024年第二季度的《Forrester Wave：語言 AI 基礎模型》報告中，被評為“強勁表現

發表于 08-16 11:34 ?507次閱讀

智行者——視聽障礙者出行輔助AI小車設計

摘要據統計，我國視障人數達1731萬人，聽力殘疾患者2780萬人。視聽障礙者對出行和交流需求迫切，但現有設施和輔具局限性大，使他們面臨出行難題。因此，我們開發了一款安全、精準、語音與手部交互的導航避

發表于 07-19 08:11 ?737次閱讀

騰云馭智出海時看IBM如何用1%的數據讓你與眾不同

——IBM混合云與AI為中國企業出海提供有力支持之系列報道（三）北京2024年6月24日?/美通社/ -- IBM日前在北京舉行媒體會，從IBM的戰略、定位、實踐，

發表于 06-24 17:34 ?472次閱讀

2024 TUYA全球開發者大會盛大啟幕，Cube AI大模型重磅首發！

2024TUYA全球開發者大會上，重磅推出AI大模型、AI開發工具、AI小程序開發基座等重量級產品，讓A

發表于 05-31 08:15 ?389次閱讀

2024 TUYA全球開發者大會盛大啟幕，Cube AI大模型重磅首發！

2024 TUYA全球開發者大會上，重磅推出AI大模型、AI開發工具、AI小程序開發基座等重量級產品，讓

發表于 05-30 09:13 ?241次閱讀

IBM開源AI模型，推動AI企業化應用

IBM近日宣布，將把一系列先進的人工智能模型以開源軟件的形式發布，此舉標志著人工智能技術在企業應用上的新篇章。公司表示，隨著watsonx平臺推出滿一年，該平臺將迎來重大更新，新增的數據和自動化功能將使企業能夠更輕松地集成和部署

發表于 05-22 09:25 ?506次閱讀

紅帽發布RHEL AI開發者預覽版，集成IBM Granite模型，簡化AI開發流程

RHEL AI依托InstructLab開源項目，結合IBM Research的開源授權Granite大型語言模型與InstructLab模型對齊工具，采用LAB（Large-scal

發表于 05-08 15:01 ?515次閱讀

開發者手機 AI - 目標識別 demo

功能簡介該應用是在Openharmony 4.0系統上開發的一個目標識別的AI應用，旨在從上到下打通Openharmony AI子系統，展示Openharmony系統的AI能力，并為開發者

發表于 04-11 16:14

使用CUBEAI部署tflite模型到STM32F0中，模型創建失敗怎么解決？

看到CUBE_AI已經支持到STM32F0系列芯片，就想拿來入門嵌入式AI。生成的模型很小，是可以部署到F0上的，但是一直無法創建成功。

發表于 03-15 08:10

IBM在watsonx上提供開源的Mistral AI模型

IBM 提供 Mixtral-8x7B 的優化版本，該版本可將延遲時間最多縮短 75% IBM、第三方和開源模型的目錄不斷增加，為客戶提供更多選擇和靈活性是 watsonx 人工智能

發表于 03-12 19:10 ?1351次閱讀

谷歌發布開源AI大模型Gemma

近日，谷歌發布了全新AI大模型Gemma，這款模型為各種規模的組織提供了前所未有的機會，以負責任的方式在商業應用中進行分發。

發表于 02-28 17:38 ?880次閱讀

獵戶星空發布強大AI大模型

近日，獵戶星空在2024·傅盛的開年AI大課暨獵戶星空企業應用大模型發布會上，正式發布了其最新研發的大模型。這個大

發表于 01-22 14:31 ?728次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

IBM發布最新AI模型,幫視障者“看”到更多

評論

IBM推出高性能AI模型Granite 3.0

IBM發布Granite 3.0 AI模型家族

IBM發布面向企業的人工智能模型新版本

IBM Granite系列模型被Forrester評為“強勁表現者”

智行者——視聽障礙者出行輔助AI小車設計

騰云馭智出海時看IBM如何用1%的數據讓你與眾不同

2024 TUYA全球開發者大會盛大啟幕，Cube AI大模型重磅首發！

2024 TUYA全球開發者大會盛大啟幕，Cube AI大模型重磅首發！

IBM開源AI模型，推動AI企業化應用

紅帽發布RHEL AI開發者預覽版，集成IBM Granite模型，簡化AI開發流程

開發者手機 AI - 目標識別 demo

使用CUBEAI部署tflite模型到STM32F0中，模型創建失敗怎么解決？

IBM在watsonx上提供開源的Mistral AI模型

谷歌發布開源AI大模型Gemma

獵戶星空發布強大AI大模型