Stability AI的最新圖像生成模型Stable Cascade承諾比其業(yè)界領先的前身Stable Diffusion更快、更強大,而Stable Diffusion是許多其他文本到圖像生成AI工具的基礎。
Stable Cascade可以生成照片并提供其創(chuàng)建的確切圖像的變體,或者嘗試提高現(xiàn)有圖片的分辨率。其他文本到圖片的編輯功能還包括圖像修復和外畫(模型只對圖片的特定部分進行填充編輯),以及可視邊緣(用戶可利用現(xiàn)有圖片的邊緣制作新照片)。
新模型可在GitHub上供研究人員使用,但不能用于商業(yè)用途。在谷歌甚至蘋果等公司發(fā)布自己的圖像生成模型時,新模型也帶來了更多選擇。
與Stability的旗艦Stable Diffusion模型不同,Stable Cascade不是一個大型語言模型,而是三個依賴于Würstchen架構(gòu)的不同模型。
Comparison of inference time Stable Cascade v other models,Stability AI
將請求分解成更小的比特后,請求所需的內(nèi)存更少(在那些很難找到的GPU上訓練的時間也更少),運行速度更快,同時在"提示對齊和美學質(zhì)量"方面表現(xiàn)更佳。創(chuàng)建一幅圖像大約需要10秒,而目前使用的SDXL模型需要22秒。
Stability AI公司幫助普及了Stable Diffusion方法,同時也成為了幾起訴訟的對象,指控Stable Diffusion在未經(jīng)權利持有人許可的情況下對受版權保護的數(shù)據(jù)進行訓練。該公司于12月開始通過訂閱的方式提供商業(yè)許可,并表示這是幫助其研究獲得資金所必需的。
審核編輯:劉清
-
人工智能
+關注
關注
1792文章
47508瀏覽量
239225 -
語言模型
+關注
關注
0文章
532瀏覽量
10300 -
圖像生成
+關注
關注
0文章
22瀏覽量
6902
原文標題:Stability AI試圖通過新的圖像生成人工智能模型保持領先地位
文章出處:【微信號:IEEE_China,微信公眾號:IEEE電氣電子工程師】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論