在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

單憑一張照片就能把片中人隨意擺成任何姿勢一鍵健身就要出現了?

中科院長春光機所 ? 來源:未知 ? 作者:易水寒 ? 2018-07-17 10:31 ? 次閱讀

和一鍵換妝、一鍵美顏一樣,我們可能離“一鍵健身”不遠了。

怎么說?

近日,MIT(麻省理工學院)的研究人員發明了一項新技術,單憑一張照片,就能把片中人,隨意擺成任何姿勢。AI的想象力和腦補力,竟然能達到窺一片而知全貌了?

沒錯,讓人驚喜的是,這項技術的合成效果還非常好,頗有以假亂真的氣勢——

穿著瑜伽服打棒球?

又穿著瑜伽服打高爾夫?

棒球比賽期間突然做起瑜伽?

可能你也猜到,后面這些圖都是假象,在MIT中了今年CVPR Oral的論文Synthesizing Images of Humans in Unseen Poses中,研究人員提出一種模塊化的生成神經網絡,用從人類運動視頻中提取的成對圖像和姿勢訓練之后,它能夠為一個人合成出沒做過的新姿勢。

更有趣的是,這個模型在沒有經過刻意訓練的情況下,還能生成一段連續的視頻。

只用一張照片,就能將照片中人像皮影戲一樣操控,并且在被遮擋的情況下,人物和背景合成都非常自然,這到底是如何做到的?

步驟拆解

單憑一張照片合成人物姿勢不是易事。姿勢變換帶來身體的移動,影響著人物周圍的陰影變化和背景露出,若人物肢體若被遮擋,還需自行想象腦補身體邊界……

總之兩個字:麻煩。

對人類來說這尚且還是個繁瑣復雜的工作,對AI來說更是如此。怎么辦?

MIT小伙伴們用260多段視頻中截取出來的成對圖片和姿勢,訓練了一個監督學習模型。

將源圖像和它對應的2D姿勢信息,以及目標姿勢輸入到這個模型中,它就能合成出一張輸出圖像,把源圖像上的人物形象和目標姿勢結合在一起。

這個方法的精髓,就在于把這個艱巨的大任務分成四塊簡單的、模塊化的子任務,大概如下圖所示:

制造新姿勢的流程分五步。

第一步得表示姿勢,研究人員將2D的姿勢Ps和Pt表示成3D形式RH×W×J,其中H代表輸入圖像的高度,W代表寬度,每個J通道都包含一個以不同節點(x,y)為中心的高斯凸起。這種方法能快速利用姿態輸入的空間特性,而不僅僅是個扁平、密集的表示。

表示完動作后,就需要對圖像整體大局進行原圖分割,為合成動作做準備了。

運動時身體每個部分軌跡不同通常會分段仿射運動場出現,通過將原圖Is分割成前景層和背景層,并將前景的身體部位分割成頭、上臂、下臂、大腿、小腿和軀干等部分,基于UNet-style架構將原圖分割。

之后進行前景空間變形,將這些被拆分的身體重新組合起來。

之后進行前景合成,將轉換后的主體部分合并,進一步細化外觀。下圖顯示了這個階段的Mask Mt(第3列)和yfg(第4列)的幾個輸出示例。

可以看出,即使一開始是很夸張的姿勢,合成出效果看起來也很真實。可惜的是,高爾夫球桿、網球拍等持有物,在合成后不會被保留。

此時,完事具備,就差背景了。背景合成也就是填補前景動作中開始被遮擋的部分,如上圖第五列所示~

整個網絡的架構就是這樣了,接下來我們去看看研究人員具體是如何訓練它的。

精挑細選的數據集

模型準備就緒,還欠數據。

于是,他們從YouTube上尋找了一些視頻。其中包括136段打高爾夫的、60段練瑜伽或者健身的、70段打棒球的。

他們挑選的視頻有個共同特點:背景基本靜止、只有人在動。這樣,模型才能更好地完成任務。

把它們混在一起,再經過一些縮放、旋轉、反轉之類的擴增操作,就形成了要用的數據集,從中留出10%,用作測試集。

就是用這些數據,幾位科學家檢驗了他們模型的合成能力。

花式秀能力,開始

測試方法很簡單,從視頻里選一幀提取出人物的動作,找另一幀圖像,讓模型把里面的人扭成這個動作,看看效果如何。

作者們在論文里說:顯然是我們的效果比較好嘛,有圖為證。

和同行前輩UNet相比,這種新方法合成出來的圖像更不容易出錯。比如說上圖第一行,UNet合成出來的網球少年衣服已經泛黃;第4行,健身小姐姐身后出現了重重重影。

從數據上看,這種新方法也取得了比UNet更低的錯誤率、更好的SSIM得分。

但這顯然還不是這個模型的全部實力。

上圖展示的,都是從一個網球動作到另一個網球動作,從一個健身動作到另一個健身動作,而且,還都是,靜止的圖像。

你大概還記得文章開頭展示的那些。當然沒騙你,給模型一張圖片和一系列目標姿勢,生成視頻當然也沒問題啦~

視頻里的系列動作拆解開來,就是上圖這樣。考驗眼力的時刻到了:你能猜出哪兩行是真實的、哪兩行是合成的嗎?

答案是,1、3行是合成的動作,2、4行是真實的。

連貫起來,就是這樣:

膩害~撒花!假裝運動這么輕松,有視頻都不一定有真相了~

Wait,這依然不是它的全部實力。

開頭展示的穿著瑜伽服打棒球,當然也是它的杰作。

這個模型,可以為畫中人合成不同類別的姿勢。輸入分別來自不同類別的源圖像和目標動作,結果雖說充滿違和感,但還是那么令人信服。

網球場上做瑜伽,瑜伽墊上打高爾夫……

別忘了,他們訓練這個模型只用了3類運動、260多段視頻,要是訓練數據在充足一點,怕是真能一鍵假裝去運動了。

傳送門

這篇Synthesizing Images of Humans in Unseen Poses,被CVPR 2018作為oral論文接收,論文一作,是MIT博士后Guha Balakrishnan,他的碩士和博士學位都來自MIT。

研究團隊全體成員都來自MIT,包括研究生Amy Zha、博士后Adrian V. Dalca,以及Balakrishnan的碩士和博士導師:John Guttag和Fredo Durand。

團隊的另外兩位成員也來自MIT,一位是研究生Amy Zhao,另一位是博士后Adrian V. Dalca。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    30887

    瀏覽量

    269068
  • MIT
    MIT
    +關注

    關注

    3

    文章

    253

    瀏覽量

    23392

原文標題:只需一張照片,運動視頻分分鐘偽造出來 | MIT新算法

文章出處:【微信號:cas-ciomp,微信公眾號:中科院長春光機所】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    AVR一鍵下載升級

    AVR一鍵下載升級!多線程1拖N量產型AVR USB ISP一鍵下載(USBASP生產型)生產型1拖多AVR USB一鍵下載AVR單片機是目前市面上流行的主流單片機,它使用精簡指令集
    發表于 04-27 12:20

    一鍵還原系統

    電腦,打開老毛桃一鍵還原程序即可看到程序自動檢測到剛剛備份系統。以后當系統中毒或是出現其它問題時點擊(請在還原之前提前備份好系統盤的個人資料,還原時將對C盤原有數據進行覆蓋。)即可將系統恢復到之前備份
    發表于 06-18 20:41

    刺繡機器人——只要你拍張照就能繡出你的臉

    ` 大連的家企業,生產種刺繡機器人,這種機器人能快速地進行彩繡,8股彩線自由切換,根本不用人操心。另外這個刺繡機器人還有個獨門絕活,只要給它一張照片,從數碼相機里導入系統,它就能
    發表于 01-22 15:08

    如何讀取某文件夾內第幾張照片

    各位大神,個文件夾內有數量未知的好多張照片,我想做個程序 首先能統計此文件夾內有多少張照片,然后可以選擇讀取此文件夾內第幾張照片,例如讀取 第三
    發表于 09-06 16:06

    一張圖看懂阿里云智能媒體管理產品

    數據,更好支撐內容檢索。近日,阿里云發布智能媒體管理(Intelligent Media Managemen)服務, 通過離線處理能力關聯授權的云存儲,提供便捷的海量多媒體數據一鍵分析,并通過該分析過程構建價值元數據,更好支撐內容檢索。通過
    發表于 01-09 12:04

    【PHYTEC開發板試用體驗】3 通過開發板拍一張照片

    還是挺全的,可以看的出來我們的攝影頭驅動已經裝好了。3. 應用程序3.1 簡介嗯,接下來我們就可以寫個上層應用程序,來驗證下這個驅動是不是好的?功能很簡單,我們按照我們的想法來拍一張照片,因為有
    發表于 06-12 14:43

    一張照片就可識別用戶身份準確率達99.5%

    有研究表明利用一張照片就可以輕松識別用戶的身份和用戶使用的智能手機型號,類似于種PRNU指紋。據悉測試的準確率達到了99.5%,這種識別技術將會被用于身份驗證。
    發表于 12-18 10:58 ?1.3w次閱讀

    華為推出便攜照片打印機采用了Zink無墨打印技術可實現一鍵打印

    華為便攜照片打印機的機身尺寸十分小巧,該產品內置500mAh電池,次充電可以打印23張照片。基于Zink無墨打印技術,使用華為便攜照片打印機時僅需1分鐘即可打印整
    發表于 12-30 10:00 ?1.4w次閱讀

    你社交網站上的照片 也許已經被用來訓練人工智能

    在他看來,這意味著使用照片就要得到照片中人物的明確同意。
    的頭像 發表于 04-25 14:44 ?2239次閱讀

    三星開發新技術 用一張照片就能做出Deepfakes音視頻剪輯

    據國外媒體報道,通常制作出令人信服的Deepfakes音視頻剪輯需要大量的數據集對模型進行反復訓練。目前三星人工智能中心的研究人員已經設計出種方法,在有限訓練數據集的情況下就能制作出栩栩如生的假視頻,有時只需要一張特定的
    的頭像 發表于 05-27 16:42 ?3226次閱讀

    一張照片進行AI“換臉”之后,可以突破刷臉支付的安全系統嗎?

    對于引起廣泛爭議的用戶個人隱私和支付安全等問題,“ZAO”運營團隊稱,“ZAO”所呈現的“換臉”效果,是根據用戶提交的頭像照片,通過后期技術疊加所實現的虛構圖像,并沒有采集任何個人生物識別特征;刷臉支付安全門檻極高,僅通過一張照片
    的頭像 發表于 09-12 14:20 ?5306次閱讀

    一張照片揭示即將推出的Realme X9的纖薄外形

    今天,該品牌在印度和歐洲的首席執行官Madhav Sheth在其Twitter上分享一張照片。它揭示即將推出的Realme X9的纖薄外形。根據圖片,新的智能手機將厚達六信用卡,
    的頭像 發表于 01-27 15:02 ?2456次閱讀

    如何通過一張照片來獲取ip地址?

    接著我還想說明下如何使用SQLi來獲取ip地址。其實使用照片來盜取ip地址十分快捷,我們沒有理由去使用SQLi這種方法,但是為了讓讀者獲取到更多的知識,我還是說明下吧:
    的頭像 發表于 12-14 10:31 ?5216次閱讀

    一張照片定制自己的3D數字化身?

    。僅需一張圖片甚至句文字描述,RODIN 擴散模型就能秒級生成 3D 化身,讓低成本定制 3D 頭像成為可能,為 3D 內容創作領域打開了更多想象空間。相關論文“RODIN: A
    的頭像 發表于 03-22 00:15 ?516次閱讀

    百度文心言支持一鍵生成專屬數字分身

    百度文心言APP正式上線項令人矚目的新功能:用戶只需一張照片、錄制三句話,就能輕松擁有
    的頭像 發表于 02-03 09:33 ?798次閱讀
    主站蜘蛛池模板: 色综合中文字幕| 美剧免费在线观看| 国产男人搡女人免费视频| 日韩亚洲欧洲在线rrrr片| 国产精品久久久久久久9999| 成人免费aaaaa毛片| 亚洲色图2| 四虎国产精品永免费| 欧美日韩视频综合一区无弹窗| 久久婷婷综合中文字幕| 国产美女激情视频| 午夜视频在线| 国产亚洲精品久久久久久牛牛| 午夜影院7cdy| 日本一区二区免费看| 亚洲线精品一区二区三区| 色五夜婷婷| bt天堂在线www中文在线| 日本特级黄录像片| 视频在线观看h| 婷婷99视频精品全部在线观看| 热久久综合这里只有精品电影| 国产乱辈通伦影片在线播放| 国产综合视频在线| 亚洲三级小视频| 成人网久久| 黄网在线观看免费| 欧美激情二区三区| 日日噜噜夜夜狠狠久久aⅴ| 黄色生活毛片| 偷操| 丁香六月综合网| 精彩视频一区二区三区| 色多多·com| 天天舔天天射天天干| 欧美在线视频免费播放| 99久久精品免费看国产免费| 日本免费色网站| 一级片在线免费看| 亚洲激情四射| 日韩xx00|