国际完美世界下载,大主宰天蚕土豆,完结小说

3 月 19 日，Google 在其官方博客上發(fā)布了關于 VLOGGER AI 模型的相關信息。這是一款利用用戶提供的肖像照片和音頻內(nèi)容，使人物生動地呈現(xiàn)音頻內(nèi)容并具備豐富面部表情的人工智能程序。

具體來說，VLOGGER AI 采用一種適應虛擬肖像的多模態(tài) Diffusion 模型，通過 MENTOR 數(shù)據(jù)庫進行訓練，涵蓋了超80萬個人物肖像及超過2200小時的視頻數(shù)據(jù)。得益于此，VLOGGER 可以生成各種族、各年齡段、穿著多樣、姿態(tài)各異的肖像視頻。

研發(fā)團隊指出，相較于之前的同類產(chǎn)品，VLOGGER 的獨特之處在于無需針對每個使用者進行單獨培訓，且不受限于人臉檢測和裁剪，能產(chǎn)出完整的圖像，且能夠處理更多元化的情境如可見的身軀或者其他身份特征，這對于真實再現(xiàn)人物交流過程至關重要。

谷歌將 VLOGGER 視為通往“通用聊天機器人”未來的關鍵一步，使人工智能能以自然的語音、手勢和眼神等方式與人類交互。除此之外，VLOGGER 還可用作報告、教育領域以及旁白等方面的輔助工具，并能對已有的電影進行剪輯和表情調(diào)整。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴