電子發燒友網報道(文/李彎彎)生成式AI是指利用現有文本、音頻文件或圖像等創建新內容的技術。生成式AI可從其數據中學習內容或對象,并運用數據生成全新的、完全原創的、逼真的工件,留下與訓練數據相似的特征,不是簡單的重復。
生成式AI的關鍵技術是生成式對抗網絡(GANs, Generative Adversarial Networks ),其本質是一種深度學習模型,是近年來復雜分布上無監督學習最具前景的方法之一。
在原理上,生成式對抗網絡使用兩個神經網絡相互對立,一個生成器和一個判別器。生成器或生成網絡,負責生成類似于源數據的新數據或內容,判別器或判別網絡則負責區分源數據和生成數據。經過交替周期訓練,生成器不斷學習生成更逼真的數據,判別器則更善于區分假數據和真實數據。漸漸地,雙方在對抗中不斷完善。
AI作畫是生成式AI的典型應用案例。今年9月15日,一位國外游戲設計師的作品《太空歌劇院》奪得美國科羅拉多州博覽會藝術比賽數字類別的一等獎。這幅畫作完全由AI繪圖軟件根據文字指令生成。
近年來市面上涌現出了多款AI繪畫工具。比如由谷歌推出的Disco Diffusion,這是一款最早流行起來的AI繪圖工具。使用這個AI繪畫工具,僅僅通過文字輸入,就能輸出相應的圖片。
還有Midjourney,這家公司名稱也是Midjourney,創始人是David Holz,Midjourney 是一款輸入文字就可以生成高質量圖像的AI畫畫軟件,速度達到1分鐘出4張圖。很多藝術家會使用Midjourney生成自己想要圖像作為創作靈感參考。
還有由OpenAI開發DALL·E2,這款AI繪畫工具,幾分鐘就能創建高度逼真的圖像。OpenAI稱,該工具可用于創建插圖、設計產品。OpenAI是在美國成立的一家人工智能研究公司。OpenAI由伊隆·馬斯克(Elon Musk)和薩姆·奧特曼(Sam Altman,現任OpenAI CEO)于2015年共同創立,后馬斯克在2019年離開了OpenAI。
前不久國內也上線了一個微信小程序——盜夢師,這是一個能根據輸入文本生成圖片的AI平臺,由藍振忠博士帶領的西湖大學深度學習實驗室和西湖心辰科技有限公司共同推出。
據介紹,用戶輸入文字描述后,盜夢師便可生成1:1、9:16和16:9三種比例的圖片,還有24種繪畫風格可以選擇,除了基礎的油畫、水彩、素描等繪畫種類,還包括賽博朋克、蒸汽波、像素藝術、吉卜力和CG渲染等特別風格。
除了AI作畫,生成式AI的應用案例還包括生成音頻、生成視頻、生成文本、醫療保健等,行業分析師預計,這種技術將被廣泛用于各行各業,并產生數萬億美元的經濟價值。Gartner發布的2022年AI技術成熟度曲線顯示:生成式AI、AI大模型等技術在萌芽2年多后已快速步入期望膨脹階段。
生成式AI的發展可能會使云服務商和芯片廠商受益。生成式AI是計算密集型技術,據了解,Meta和谷歌已經聘請該領域諸多杰出人才,希望將這種先進技術整合到公司的產品中。
今年9月,Meta公司首次推出Make-A-Video。Make-A-Video是Meta內部開發的人工智能系統,可以以利用給定的幾個詞或幾行文字生成一個幾秒鐘的短視頻。最近,谷歌也發布了名為Phenaki的程序代碼,可以將文本轉換為時長幾分鐘的視頻。
生成式AI需要英偉達、AMD、英特爾等的芯片支持,進行AI模型訓練和部署。英偉達首席執行官黃仁勛在日前的會議上談到,生成式AI是公司最新芯片的關鍵用途。
不過生成式AI也面臨一些挑戰,比如AI繪畫的原創性和所有權的問題,今年8月29日,一個名叫mimic的AI繪畫網站上線了測試版,允許用戶上傳15至100張圖像讓AI進行學習,然后輸出相同畫風的AI畫作。然而一些未經授權的畫作也被上傳學習,把AI生成的畫作當做自己的創作進行售賣。AI作畫需要利用大量現有圖像進行培訓,現如今,原始圖像的創建者是否對原創風格生成的圖像擁有版權仍在爭論中。
-
AI
+關注
關注
87文章
31359瀏覽量
269761 -
生成式AI
+關注
關注
0文章
510瀏覽量
515
發布評論請先 登錄
相關推薦
評論