琅琊榜海宴小说,有声小说,完美世界有声小说

和一鍵換妝、一鍵美顏一樣，我們可能離“一鍵健身”不遠了。

怎么說？

近日，MIT（麻省理工學院）的研究人員發明了一項新技術，單憑一張照片，就能把片中人，隨意擺成任何姿勢。AI的想象力和腦補力，竟然能達到窺一片而知全貌了？

沒錯，讓人驚喜的是，這項技術的合成效果還非常好，頗有以假亂真的氣勢——

穿著瑜伽服打棒球？

又穿著瑜伽服打高爾夫？

棒球比賽期間突然做起瑜伽？

可能你也猜到，后面這些圖都是假象，在MIT中了今年CVPR Oral的論文Synthesizing Images of Humans in Unseen Poses中，研究人員提出一種模塊化的生成神經網絡，用從人類運動視頻中提取的成對圖像和姿勢訓練之后，它能夠為一個人合成出沒做過的新姿勢。

更有趣的是，這個模型在沒有經過刻意訓練的情況下，還能生成一段連續的視頻。

只用一張照片，就能將照片中人像皮影戲一樣操控，并且在被遮擋的情況下，人物和背景合成都非常自然，這到底是如何做到的？

步驟拆解

單憑一張照片合成人物姿勢不是易事。姿勢變換帶來身體的移動，影響著人物周圍的陰影變化和背景露出，若人物肢體若被遮擋，還需自行想象腦補身體邊界……

總之兩個字：麻煩。

對人類來說這尚且還是個繁瑣復雜的工作，對AI來說更是如此。怎么辦？

MIT小伙伴們用260多段視頻中截取出來的成對圖片和姿勢，訓練了一個監督學習模型。

將源圖像和它對應的2D姿勢信息，以及目標姿勢輸入到這個模型中，它就能合成出一張輸出圖像，把源圖像上的人物形象和目標姿勢結合在一起。

這個方法的精髓，就在于把這個艱巨的大任務分成四塊簡單的、模塊化的子任務，大概如下圖所示：

制造新姿勢的流程分五步。

第一步得表示姿勢，研究人員將2D的姿勢Ps和Pt表示成3D形式RH×W×J，其中H代表輸入圖像的高度，W代表寬度，每個J通道都包含一個以不同節點(x,y)為中心的高斯凸起。這種方法能快速利用姿態輸入的空間特性，而不僅僅是個扁平、密集的表示。

表示完動作后，就需要對圖像整體大局進行原圖分割，為合成動作做準備了。

運動時身體每個部分軌跡不同通常會分段仿射運動場出現，通過將原圖Is分割成前景層和背景層，并將前景的身體部位分割成頭、上臂、下臂、大腿、小腿和軀干等部分，基于UNet-style架構將原圖分割。

之后進行前景空間變形，將這些被拆分的身體重新組合起來。

之后進行前景合成，將轉換后的主體部分合并，進一步細化外觀。下圖顯示了這個階段的Mask Mt(第3列)和yfg(第4列)的幾個輸出示例。

可以看出，即使一開始是很夸張的姿勢，合成出效果看起來也很真實。可惜的是，高爾夫球桿、網球拍等持有物，在合成后不會被保留。

此時，完事具備，就差背景了。背景合成也就是填補前景動作中開始被遮擋的部分，如上圖第五列所示~

整個網絡的架構就是這樣了，接下來我們去看看研究人員具體是如何訓練它的。

精挑細選的數據集

模型準備就緒，還欠數據。

于是，他們從YouTube上尋找了一些視頻。其中包括136段打高爾夫的、60段練瑜伽或者健身的、70段打棒球的。

他們挑選的視頻有個共同特點：背景基本靜止、只有人在動。這樣，模型才能更好地完成任務。

把它們混在一起，再經過一些縮放、旋轉、反轉之類的擴增操作，就形成了要用的數據集，從中留出10%，用作測試集。

就是用這些數據，幾位科學家檢驗了他們模型的合成能力。

花式秀能力，開始

測試方法很簡單，從視頻里選一幀提取出人物的動作，找另一幀圖像，讓模型把里面的人扭成這個動作，看看效果如何。

作者們在論文里說：顯然是我們的效果比較好嘛，有圖為證。

和同行前輩UNet相比，這種新方法合成出來的圖像更不容易出錯。比如說上圖第一行，UNet合成出來的網球少年衣服已經泛黃；第4行，健身小姐姐身后出現了重重重影。

從數據上看，這種新方法也取得了比UNet更低的錯誤率、更好的SSIM得分。

但這顯然還不是這個模型的全部實力。

上圖展示的，都是從一個網球動作到另一個網球動作，從一個健身動作到另一個健身動作，而且，還都是，靜止的圖像。

你大概還記得文章開頭展示的那些。當然沒騙你，給模型一張圖片和一系列目標姿勢，生成視頻當然也沒問題啦~

視頻里的系列動作拆解開來，就是上圖這樣。考驗眼力的時刻到了：你能猜出哪兩行是真實的、哪兩行是合成的嗎？

答案是，1、3行是合成的動作，2、4行是真實的。

連貫起來，就是這樣：

膩害~撒花！假裝運動這么輕松，有視頻都不一定有真相了~

Wait，這依然不是它的全部實力。

開頭展示的穿著瑜伽服打棒球，當然也是它的杰作。

這個模型，可以為畫中人合成不同類別的姿勢。輸入分別來自不同類別的源圖像和目標動作，結果雖說充滿違和感，但還是那么令人信服。

網球場上做瑜伽，瑜伽墊上打高爾夫……

別忘了，他們訓練這個模型只用了3類運動、260多段視頻，要是訓練數據在充足一點，怕是真能一鍵假裝去運動了。

傳送門

這篇Synthesizing Images of Humans in Unseen Poses，被CVPR 2018作為oral論文接收，論文一作，是MIT博士后Guha Balakrishnan，他的碩士和博士學位都來自MIT。

研究團隊全體成員都來自MIT，包括研究生Amy Zha、博士后Adrian V. Dalca，以及Balakrishnan的碩士和博士導師：John Guttag和Fredo Durand。

團隊的另外兩位成員也來自MIT，一位是研究生Amy Zhao，另一位是博士后Adrian V. Dalca。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

AI

AI

+關注

關注
87

文章
30887

瀏覽量
269068
MIT

MIT

+關注

關注
3

文章
253

瀏覽量
23392

原文標題：只需一張照片，運動視頻分分鐘偽造出來 | MIT新算法

文章出處：【微信號：cas-ciomp，微信公眾號：中科院長春光機所】歡迎添加關注！文章轉載請注明出處。

AVR一鍵下載升級了！

AVR一鍵下載升級了！多線程1拖N量產型AVR USB ISP一鍵下載(USBASP生產型)生產型1拖多AVR USB一鍵下載AVR單片機是目前市面上流行的主流單片機，它使用精簡指令集

發表于 04-27 12:20

一鍵還原系統

電腦，打開老毛桃一鍵還原程序即可看到程序自動檢測到剛剛備份了系統。以后當系統中毒或是出現其它問題時點擊（請在還原之前提前備份好系統盤的個人資料，還原時將對C盤原有數據進行覆蓋。）即可將系統恢復到之前備份

發表于 06-18 20:41

刺繡機器人——只要你拍張照就能繡出你的臉

` 大連的一家企業，生產一種刺繡機器人，這種機器人能快速地進行彩繡，8股彩線自由切換，根本不用人操心。另外這個刺繡機器人還有個獨門絕活，只要給它一張照片，從數碼相機里導入系統，它就能繡

發表于 01-22 15:08

如何讀取某文件夾內第幾張照片

各位大神，一個文件夾內有數量未知的好多張照片，我想做個程序首先能統計此文件夾內有多少張照片，然后可以選擇讀取此文件夾內第幾張照片，例如讀取第三張

發表于 09-06 16:06

一張圖看懂阿里云智能媒體管理產品

數據，更好支撐內容檢索。近日，阿里云發布了智能媒體管理（Intelligent Media Managemen）服務，通過離線處理能力關聯授權的云存儲，提供便捷的海量多媒體數據一鍵分析，并通過該分析過程構建價值元數據，更好支撐內容檢索。通過

發表于 01-09 12:04

【PHYTEC開發板試用體驗】3 通過開發板拍一張照片

還是挺全的，可以看的出來我們的攝影頭驅動已經裝好了。3. 應用程序3.1 簡介嗯，接下來我們就可以寫一個上層應用程序，來驗證一下這個驅動是不是好的？功能很簡單，我們按照我們的想法來拍一張照片，因為有

發表于 06-12 14:43

一張照片就可識別用戶身份準確率達99.5%

有研究表明利用一張照片就可以輕松識別用戶的身份和用戶使用的智能手機型號，類似于一種PRNU指紋。據悉測試的準確率達到了99.5%，這種識別技術將會被用于身份驗證。

發表于 12-18 10:58 ?1.3w次閱讀

華為推出便攜照片打印機采用了Zink無墨打印技術可實現一鍵打印

華為便攜照片打印機的機身尺寸十分小巧，該產品內置500mAh電池，一次充電可以打印23張照片。基于Zink無墨打印技術，使用華為便攜照片打印機時僅需1分鐘即可打印整

發表于 12-30 10:00 ?1.4w次閱讀

你社交網站上的照片也許已經被用來訓練人工智能了

在他看來，這意味著使用照片就要得到照片中人物的明確同意。

發表于 04-25 14:44 ?2239次閱讀

三星開發新技術用一張照片就能做出Deepfakes音視頻剪輯

據國外媒體報道，通常制作出令人信服的Deepfakes音視頻剪輯需要大量的數據集對模型進行反復訓練。目前三星人工智能中心的研究人員已經設計出一種方法，在有限訓練數據集的情況下就能制作出栩栩如生的假視頻，有時只需要一張特定的

發表于 05-27 16:42 ?3226次閱讀

一張照片進行AI“換臉”之后，可以突破刷臉支付的安全系統嗎？

對于引起廣泛爭議的用戶個人隱私和支付安全等問題，“ZAO”運營團隊稱，“ZAO”所呈現的“換臉”效果，是根據用戶提交的頭像照片，通過后期技術疊加所實現的虛構圖像，并沒有采集任何個人生物識別特征；刷臉支付安全門檻極高，僅通過一張照片

發表于 09-12 14:20 ?5306次閱讀

一張照片揭示了即將推出的Realme X9的纖薄外形

今天，該品牌在印度和歐洲的首席執行官Madhav Sheth在其Twitter上分享了一張照片。它揭示了即將推出的Realme X9的纖薄外形。根據圖片，新的智能手機將厚達六張信用卡，

發表于 01-27 15:02 ?2456次閱讀

如何通過一張照片來獲取ip地址？

接著我還想說明一下如何使用SQLi來獲取ip地址。其實使用照片來盜取ip地址十分快捷，我們沒有理由去使用SQLi這種方法，但是為了讓讀者獲取到更多的知識，我還是說明一下吧：

發表于 12-14 10:31 ?5216次閱讀

一張照片定制自己的3D數字化身？

。僅需一張圖片甚至一句文字描述，RODIN 擴散模型就能秒級生成 3D 化身，讓低成本定制 3D 頭像成為可能，為 3D 內容創作領域打開了更多想象空間。相關論文“RODIN: A

發表于 03-22 00:15 ?516次閱讀

百度文心一言支持一鍵生成專屬數字分身

百度文心一言APP正式上線了一項令人矚目的新功能：用戶只需一張照片、錄制三句話，就能輕松擁有一個

發表于 02-03 09:33 ?798次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

單憑一張照片就能把片中人隨意擺成任何姿勢一鍵健身就要出現了？

評論

AVR一鍵下載升級了！

一鍵還原系統

刺繡機器人——只要你拍張照就能繡出你的臉

如何讀取某文件夾內第幾張照片

一張圖看懂阿里云智能媒體管理產品

【PHYTEC開發板試用體驗】3 通過開發板拍一張照片

一張照片就可識別用戶身份準確率達99.5%

華為推出便攜照片打印機采用了Zink無墨打印技術可實現一鍵打印

你社交網站上的照片也許已經被用來訓練人工智能了

三星開發新技術用一張照片就能做出Deepfakes音視頻剪輯

一張照片進行AI“換臉”之后，可以突破刷臉支付的安全系統嗎？

一張照片揭示了即將推出的Realme X9的纖薄外形

如何通過一張照片來獲取ip地址？

一張照片定制自己的3D數字化身？

百度文心一言支持一鍵生成專屬數字分身