在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

AI新模型可將文本轉換為生動的圖像

如今人工智能越來越強大，比如可以實現生成音樂、改變圖片藝術風格等等。最近，人工智能非營利組織OpenAI發布了一個名為DALL-E的神經網絡，可以將文本轉換成與內容相關的圖像。

比如生成下面這些穿著芭蕾舞裙揮舞著光劍的熊貓寶寶：

OpenAI在一篇博文中表示，該系統是具有里程碑意義的GPT-3語言模型的120億參數版本。

DALL-E模型具有多種功能，包括創建動物和物體的擬物化版本，以合理的方式展示相關的概念，渲染文本，以及對現有圖像進行轉換。

比如在該模型中選定“與貓有關的文本關鍵詞”，同時選擇給定的其中一種貓類型，最終系統會自動生成一系列與貓主題有關的圖像，并且風格呈現多樣化。

訓練該模型的數據集主要基于互聯網大量文本-圖像。這使得它能夠通過探索提示的結構來創造出全新的圖片。比如生成一些令人印象深刻的地標、位置、雜交動物和不同年代設計的圖像。但是OpenAI承認并不是所有的結果都是成功的。

不過，OpenAI承認并不是所有生成的結果都是成功的。該公司表示，DALL-E系統有時無法繪制出某些特定的項目，混淆了對象與其特定屬性之間的關系。

通常，提示DALL-E寫的字符串越長，成功率越低。測試中發現，重復部分文本內容，準確率有所提高。

當回答有關地理方面的問題時，比如旗幟、菜肴和當地野生動物，DALL-E也經常反映出膚淺的刻板印象。考慮到人們越來越關注人工智能算法偏見的問題，這個缺點尤為明顯。

OpenAI表示，它計劃分析DALL-E等模特的社會影響，但該公司認為，該系統表明“通過語言操縱視覺概念現在已經觸手可及。”

感興趣的小伙伴可以在OpenAI網站上查看更多DALL-E模型生成的圖像。
責編AJX

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

圖像處理

圖像處理

+關注

關注
27

文章
1292

瀏覽量
56747
AI

AI

+關注

關注
87

文章
30897

瀏覽量
269111
模型

模型

+關注

關注
1

文章
3244

瀏覽量
48844

OpenAI推出AI視頻生成模型Sora

近日，備受期待的OpenAI再次推出了其創新之作——AI視頻生成模型Sora。這一新品的發布，無疑為AI技術注入了新的活力。據悉，Sora與OpenAI旗下的AI工具DALL-E有著

發表于 12-12 09:40 ?192次閱讀

AI模型部署邊緣設備的奇妙之旅：如何實現手寫數字識別

涉及將浮點數（如32位或16位）表示的權重和激活轉換為低精度的數據類型（如8位整數或更低），從而實現模型壓縮和加速推理。過程（1）訓練后量化這是最簡單的方法，直接應用于已經訓練好的模型。過程如下

發表于 12-06 17:20

NVIDIA推出全新生成式AI模型Fugatto

NVIDIA 開發了一個全新的生成式 AI 模型。利用輸入的文本和音頻，該模型可以創作出包含任意的音樂、人聲和聲音組合的作品。

發表于 11-27 11:29 ?357次閱讀

AI大模型的訓練數據來源分析

學術機構、政府組織或企業公開發布，涵蓋了各種類型的數據，如圖像、文本、音頻、視頻等。例如： ImageNet ：一個廣泛用于圖像識別任務的大規模圖像數據集。 Common Crawl

發表于 10-23 15:32 ?632次閱讀

AI大模型的最新研究進展

。例如，在醫療領域，生成式AI可以幫助醫生生成診斷報告、治療方案等；在教育領域，AI大模型可以生成個性化的學習資源和建議。多模態融合與交互： AI大

發表于 10-23 15:19 ?447次閱讀

未來AI大模型的發展趨勢

上得到了顯著提升。未來，算法和架構的進一步優化將推動AI大模型在性能上實現新的突破。多頭自注意力機制、前饋神經網絡等關鍵技術的改進，將增強模型的表達能力和泛化能力。多模態融合： AI

發表于 10-23 15:06 ?625次閱讀

AI大模型在圖像識別中的優勢

AI大模型在圖像識別中展現出了顯著的優勢，這些優勢主要源于其強大的計算能力、深度學習算法以及大規模的數據處理能力。以下是對AI大模型在

發表于 10-23 15:01 ?669次閱讀

AI大模型在自然語言處理中的應用

AI大模型在自然語言處理（NLP）中的應用廣泛且深入，其強大的語義理解和生成能力為NLP任務帶來了顯著的性能提升。以下是對AI大模型在NLP中應用的介紹：一、核心應用

發表于 10-23 14:38 ?461次閱讀

微軟Azure AI語音服務革新:引入虛擬人形象,文本一鍵轉生動視頻

微軟于8月23日宣布，在其領先的Azure AI語音服務中融入了一項革命性創新——虛擬人形象功能，此功能徹底顛覆了傳統交互方式，讓文本轉視頻的過程變得前所未有的直觀與生動。

發表于 08-23 16:25 ?712次閱讀

李未可科技正式推出WAKE-AI多模態AI大模型

文本生成、語言理解、圖像識別及視頻生成等多模態交互能力。 ? 該大模型圍繞 GPS 軌跡+視覺+語音打造新一代 LLM-Based的自然交互，同時多模態問答技術的加持，能實現所見即所問、所問即所得的精準服務。此外，融合了人類意圖

發表于 04-18 17:01 ?601次閱讀

阿里巴巴推出全新AI圖生視頻模型EMO

近日，阿里巴巴集團智能計算研究院宣布推出了一款革命性的AI圖片-音頻-視頻模型技術——EMO。據官方介紹，EMO是一種先進的音頻驅動肖像視頻生成框架，能夠將靜態照片轉化為生動逼真的動態視頻，并且能夠隨著任意音頻文件“說話”或“唱

發表于 03-05 11:00 ?1352次閱讀

英偉達如何應對AI芯片市場需求的轉變

隨著該行業的快速發展，更大的機遇將是銷售讓這些模型在訓練后運行的芯片，為生成式AI工具迅速擴大的公司和個人使用者提供大量文本和圖像。

發表于 02-27 10:34 ?242次閱讀

Stability AI試圖通過新的圖像生成人工智能模型保持領先地位

Stability AI的最新圖像生成模型Stable Cascade承諾比其業界領先的前身Stable Diffusion更快、更強大，而Stable Diffusion是許多其他文本

發表于 02-19 16:03 ?944次閱讀

AI大模型怎么解決芯片過剩?

AI大模型

電子發燒友網官方
發布于 :2024年01月02日 15:42:05

AI大模型可以設計電路嗎?

AI大模型

電子發燒友網官方
發布于 :2024年01月02日 15:09:29

精選推薦
更多

文章

資料

帖子

2024過去了，留下十個科技記憶

腦極體
1天前

699 閱讀

兩款VR頭顯大拆解，都用了哪些芯片？

拍明芯城
1天前

520 閱讀

屏蔽柵MOSFET技術簡介

翠展微電子
1天前

473 閱讀

基于LKS32MC07x系列MCU的超高速清潔電器解決方案

晶豐明源
1天前

517 閱讀

基于瑞薩電子RA6T2 MCU的電機控制讓吸塵器更智能

瑞薩MCU小百科
1天前

412 閱讀

基于MATLAB的溫室溫度模糊專家控制仿真研究

羅星
239

10積分

102下載

x-crack弱口令掃描器

任憑風吹
0.05 MB

免費

0下載

Relative-RZJ基于易語言的IDE

賈熹
27.17 MB

2積分

2下載

ssbc BT搜索引擎

楊火亭
0.03 MB

2積分

1下載

Tendis分布式高性能KV存儲數據庫

唯愛萌meng
40.05 MB

2積分

1下載

【飛凌嵌入式OK3588J-C開發板體驗】OK3588J-C開發板的ffmpeg編解碼、HDMI輸入及編碼

dutong0321
2天前

480 閱讀

采集值突然驟降

塵埃sawdsa
1天前

525 閱讀

2024 電機控制年度技術分享會來啦！！！

ElecFans小喇叭
2天前

712 閱讀

[廣東龍芯2K1000/2K500開發板] OpenWRT 使用說明

jf_38522704
10月前

5637 閱讀

使用單片機驅動DAC088S085無反應

jf_68383328
2天前

931 閱讀

推薦專欄
更多

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

AI新模型可將文本轉換為生動的圖像

評論

OpenAI推出AI視頻生成模型Sora

AI模型部署邊緣設備的奇妙之旅：如何實現手寫數字識別

NVIDIA推出全新生成式AI模型Fugatto

AI大模型的訓練數據來源分析

AI大模型的最新研究進展

未來AI大模型的發展趨勢

AI大模型在圖像識別中的優勢

AI大模型在自然語言處理中的應用

微軟Azure AI語音服務革新:引入虛擬人形象,文本一鍵轉生動視頻

李未可科技正式推出WAKE-AI多模態AI大模型

阿里巴巴推出全新AI圖生視頻模型EMO

英偉達如何應對AI芯片市場需求的轉變

Stability AI試圖通過新的圖像生成人工智能模型保持領先地位

AI大模型怎么解決芯片過剩?

AI大模型可以設計電路嗎?