好看的小说完本推荐,盗墓笔记第二季,我吃西红柿

0. 筆者個人體會

最近文本到圖像的工作很火，生成的圖像也非常真實。但還有個問題，現有工作效率比較低，往往只能接受一次text指令，再修改就要重新輸入text重新生成，可能會影響原本的語義信息，這樣導出的圖像和最初圖像可能差距甚遠。

今天筆者將為大家分享一項最新開源的工作LEDITS++，可以一次輸入無限多的編輯指令，一次性生成真實圖像！而且LEDITS++是無參數方案，不需要微調和優化。不得不感慨AI發展之迅速，距離人們真實生活也越來越近了。

下面一起來閱讀一下這項工作，文末附論文和代碼鏈接~

1. 效果展示

先看一下具體效果，輸入具體指令就可以直接產生對應效果。PS要想在幾十秒內達到同等效果應該是有點困難。

LEDITS++很強調編輯前后的圖像一致性，也就是僅修改圖像的相關區域，保持原始圖像的語義信息。這里也推薦工坊推出的新課程《徹底搞懂視覺-慣性SLAM：VINS-Fusion原理精講與源碼剖析》。

代碼已經開源了，官方主頁也開放了交互式demo，感興趣的讀者可以上傳自己的圖像和文本指令嘗鮮一下效果。

2. 具體原理是什么？

LEDITS++可以分為三個部分：（1）有效的圖像反轉；（3）多功能文本編輯；（3）圖像變化的語義基礎。

我們知道擴散模型生成圖像是通過反轉采樣來進行的，重點是識別噪聲。LEDITS++從DDPM反演中提取特征，并提出一種有效的反演方法，大大減少所需的步驟，同時降低重建誤差。當將反向擴散過程公式化為SDE時，DDPM可以被視為一階SDE解算器。使用高階微分方程解算器可以更有效地解算，因此作者推導出一種新的更快技術------DPM-solver++反演。

在創建重建序列之后，可以通過一組編輯指令操縱噪聲來編輯圖像。根據有條件和無條件估計，作者分別設計了一個專門的引導項，既反映了編輯的方向，又最大化了對所需編輯效果的細粒度控制。

最后，LEDITS++還包括一個Mask項，由交叉注意層生成的Mask和噪聲估計導出的Mask取交集計算得到。Mask可以捕捉與編輯概念相關的圖像區域，對于多次編輯特別有效。這里也推薦工坊推出的新課程《徹底搞懂視覺-慣性SLAM：VINS-Fusion原理精講與源碼剖析》。

3. 和其他SOTA方法對比如何？

不同編輯方法的指令對齊和圖像相似度權衡的比較，側重CLIP得分(越高越好)與LPIPS相似度(越低越好)，也就是圖中越靠近左上角效果越好。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

圖像

圖像

+關注

關注
2

文章
1084

瀏覽量
40461
AI

AI

+關注

關注
87

文章
30887

瀏覽量
269065
開源

開源

+關注

關注
3

文章
3348

瀏覽量
42496

原文標題：放下你的PhotoShop！無限圖像編輯已開源！

文章出處：【微信號：3D視覺工坊，微信公眾號：3D視覺工坊】歡迎添加關注！文章轉載請注明出處。

開源鴻蒙技術分論壇在武漢成功舉辦

舉行。本次論壇通過南北向開發賦能，融合前沿的行業案例經驗，生動展現了開源鴻蒙在驅動技術創新與產業升級中的優勢與無限潛能。開源技術引領變革，構建枝繁葉茂生態體系在萬物智聯的時代浪潮中，開源

發表于 12-24 13:38 ?122次閱讀

與鴻同行，探索無限！開源鴻蒙技術分論壇在武漢成功舉辦

。本次論壇通過南北向開發賦能，融合前沿的行業案例經驗，生動展現了開源鴻蒙在驅動技術創新與產業升級中的優勢與無限潛能。開源技術引領變革，構建枝繁葉茂生態體系在萬物智聯的

發表于 12-23 21:29 ?160次閱讀

高倍金相自動測量顯微鏡無限遠光學系統

高倍金相自動測量顯微鏡無限遠光學系統在無限遠處形成圖像，是通過在物鏡與目鏡之間的主鏡筒中設置鏡筒透鏡，構建了一個能夠形成中間圖像的光學系統。并可以靈活添加各種輔助組件，豐富了顯微鏡的功

發表于 12-14 20:31 ?233次閱讀

字節發布SeedEdit圖像編輯模型

近日，字節跳動公司在其豆包大模型團隊的官方網站上，正式公布了其最新的通用圖像編輯模型——SeedEdit。這款創新性的圖像編輯模型，為用戶提供了前所未有的便捷圖像編輯體驗。據官方介紹

發表于 11-12 10:43 ?259次閱讀

圖像采集卡的接口類型有哪些？

圖像采集卡又稱圖像捕獲卡，是一種能獲取數字視頻圖像信息并進行存儲和播放的硬件設備。它的作用是將圖像信號采集到計算機中，以數據文件的形式保存在硬盤上，是

發表于 10-24 17:07 ?182次閱讀

vim編輯器如何使用

Vim編輯器是一個功能強大的文本編輯器，它基于Vi進行改進，并增加了許多新特性。Vim編輯器的使用主要涉及其不同的工作模式及相應操作。以下是Vim編輯器的基本使用方法：一、Vim

發表于 08-30 14:58 ?448次閱讀

Matepad pro12.2 已上市半個月，但是還沒有在開源網站看到該項目的開源信息，違背開源精神

Matepad pro12.2 已上市半個月，本人自己也購買了同款12+256的pad，想要同步學習下這款pad的一些體驗還不錯的功能點，但是目前為止還沒有在開源網站看到該項目的開源信息，也查詢不到

發表于 08-27 17:25

Adobe在Illustrator和Photoshop設計軟件中引入新工具和生成性AI功能

Adobe正在其Illustrator和Photoshop設計軟件中引入一些新工具和生成性AI功能，旨在幫助加快創意工作流程。Illustrator最引人注目的更新來自Adobe最新的Firefly

發表于 07-29 17:10 ?848次閱讀

esp32無限重啟的原因？

esp32無限重啟，重啟記錄顯示 Software reset due to exception/panic，有誰知道這是什么原因重啟嗎？

發表于 06-25 08:13

微軟AI新成果：將不可編輯PDF轉化為可編輯文檔

市面現有相關軟件雖能將PDF轉為可編輯版，但易喪失原始布局。微軟研究論文名為《從不可編輯文檔生成可編輯文檔的方法和系統》，其獨特之處在于運用AI技術保持了字體、色彩、布局及圖像格式等視

發表于 05-30 10:11 ?691次閱讀

蘋果擬提升照片應用AI技術，以實現Photoshop級別編輯功能

蘋果官方網站于今日更換了“起飛吧”頁面LOGO，用戶可通過鼠標涂抹掉部分或整個標識。此舉被視為同時為推廣新款Apple Pencil及增強后的編輯功能進行宣傳。

發表于 05-07 17:18 ?711次閱讀

開放原子開源大賽—基于OpenHarmony的團結引擎應用開發賽正式啟動！

所有開發者開放，只要完成注冊并認證，即可報名參與。你將有機會深入實踐OpenHarmony開源項目與Unity中國團結引擎，更有機會贏取豐厚的獎勵與榮譽激勵。賽事共設立了62個獎項，總獎金池高達45萬元

發表于 03-13 10:45

谷歌模型怎么用PS打開文件和圖片

）或ONNX模型（.onnx）等。這些模型文件是二進制的，并且是為特定的機器學習框架設計的，而不是為圖像編輯軟件如PS設計的。

發表于 02-29 18:25 ?1453次閱讀

谷歌模型怎么PS打開文件格式不變

要將谷歌模型與Photoshop結合使用，并保持文件格式不變，這通常涉及將谷歌模型生成的圖像或圖形導入到Photoshop中進行進一步編輯或處理。

發表于 02-29 18:09 ?874次閱讀

三星AI手機有多神？引入智能顯示，自動調節亮度、顏色…

Galaxy S24系列配備了Galaxy AI（設備端人工智能）以及三星Gauss（高斯）等生成式人工智能。換句話說，關鍵功能可以通過設備上的人工智能來解決，而無需聯系外部服務器。生成式人工智能支持需要更多計算的任務，例如高級搜索或圖像編輯。

發表于 01-19 15:49 ?1227次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

放下你的PhotoShop！無限圖像編輯已開源！

評論

開源鴻蒙技術分論壇在武漢成功舉辦

與鴻同行，探索無限！開源鴻蒙技術分論壇在武漢成功舉辦

高倍金相自動測量顯微鏡無限遠光學系統

字節發布SeedEdit圖像編輯模型

圖像采集卡的接口類型有哪些？

vim編輯器如何使用

Matepad pro12.2 已上市半個月，但是還沒有在開源網站看到該項目的開源信息，違背開源精神

Adobe在Illustrator和Photoshop設計軟件中引入新工具和生成性AI功能

esp32無限重啟的原因？

微軟AI新成果：將不可編輯PDF轉化為可編輯文檔

蘋果擬提升照片應用AI技術，以實現Photoshop級別編輯功能

開放原子開源大賽—基于OpenHarmony的團結引擎應用開發賽正式啟動！

谷歌模型怎么用PS打開文件和圖片

谷歌模型怎么PS打開文件格式不變

三星AI手機有多神？引入智能顯示，自動調節亮度、顏色…