在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

JD和OPPO的研究人員們提出了一種姿勢引導的時尚圖像生成模型

nlfO_thejiangme ? 來源:lq ? 2019-08-02 14:50 ? 次閱讀

時尚總在引領潮流。

人工智能、增強現實、可穿戴、虛擬試妝等技術的加持下,時尚行業特別是在線時尚行業獲得了飛速的發展。為了吸引客戶更多的目光、更棒的視覺體驗、更好地展現商品,高清大圖、模特多角度擺拍已經成了服裝、箱包、鞋類、美妝等線上商家的宣傳標配。在網上購物時,大家都想看看模特衣服在各種角度姿勢下的樣子,但是越多越全面的姿勢擺拍也就意味著越大的投入。為了降低宣傳成本,很多研究開始聚焦于如何合成高質量的逼真圖像。

在這篇文章中來自北卡羅來納大學、JD和OPPO的研究人員們提出了一種姿勢引導的時尚圖像生成模型,可以基于模特當前姿勢,生成出其他各種不同姿勢下的相同著裝的新圖像!也許在這樣技術的幫助下,模特再也不用辛苦一分鐘拍二十個動作了~

生成新姿勢下的時尚圖像

研究人員的主要目的在于訓練一個生成模型,將模特在當前姿勢上的圖像遷移到其他的目標姿勢上去,實現對于衣著等商品的全面展示。

這一模型主要由生成器和判別器構成,與先前工作不同的是這一模型架構中包含了兩個不同的判別器!其中生成器由兩個編碼器構成,分別用于從圖像和對應的動作關鍵點特征圖進行編碼,而解碼器則用于從動作和衣著的特征中合成目標圖像。對于判別器來說,除了判定生成圖像是否逼真外、還需要判定動作與生成圖像的連續性以保證生成圖像動作的連續性和魯棒性。

模型的主要架構,生成器的編碼器包含了對于圖像的編碼器Ei和對動作的編碼器Ep,基于U-Net和bi-LSTM共同構建而成,而兩個判別器分別用于判定圖像的真偽并保證生成圖像與動作間的連續性。

時尚圖像生成器

生成器中主要包含了兩個編碼器和一個解碼器用于處理圖像和對應姿勢,生成器探索了輸入圖像的視覺語義特征和位姿信息,并生成對應姿勢下的新圖像。圖像編碼器:圖像編碼器的目標是從單張或多張圖像中湖區語義編碼信息。研究人員首先使用了ResNet作為主干網絡抽取不同尺度的特征,包括紋理、顏色、邊緣線條信息等。隨后將這些特征輸入到雙邊長短時記憶網絡(bc-LSTM)中用于從相同衣著不同視角的模特圖像中抽取共同的特征,將不同種類的圖像特征進行轉換,同時對不同特征下的背景和噪聲進行處理。最終得到了可以表達圖像視覺語義信息的編碼Ci,用于后續圖像的生成。位姿編碼器:模型同時需要位姿數據來為生成圖像進行引導,研究人員利用了18個關鍵點來表示人體位姿,用不同顏色的直線相連并以RGB的格式進行表示。通過U-Net的架構和3*3的卷積從位姿圖中抽取高層次語義特征Cp并在解碼過程中通過跳接層連接進行特征共享。解碼器:其主要目的是通過圖像編碼Ci 和動作編碼Cp重建出逼真的圖像。首先將圖像編碼與位姿編碼的編碼拼接在一起,并基于U-Net架構和跳接層將視覺語義信息與動作編碼信息匹配起來,進行有效的圖像生成。判別器:其主要目標是引導模型生成比先前模型更逼真圖像。在訓練過程中研究人員利用兩個判別器來同時進行對抗訓練,主要采用了與PatchGAN類似的實現。其中Di用于判別生成圖像是否逼真,與先前的模型類似;而Dp則用于判定生成圖像與對應動作的連續性。Dp的輸出是真實圖像與對應位姿和這一位姿下生成的圖像,用于判定圖像是否與位姿匹配,它對于生成與位姿對應的時尚圖像具有重要的作用,能幫助網絡生成更為復雜的動作姿勢,同時保持連續性和魯棒性。

結果展示

通過DeepFashion和Market-1501數據的訓練后研究人員得到了不錯的結果。

Deep Fasion 數據集

Market-1501數據集

生成的結果與先前方法的比較,其中S和M代表了單張和多張圖像輸入的生成結果:

在數據集上的表現還不錯,從源圖像生成了新的姿勢:

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 解碼器
    +關注

    關注

    9

    文章

    1143

    瀏覽量

    40742
  • 圖像
    +關注

    關注

    2

    文章

    1084

    瀏覽量

    40468
  • 模型
    +關注

    關注

    1

    文章

    3243

    瀏覽量

    48842

原文標題:從姿勢到圖像——基于人體姿勢引導的時尚圖像生成算法

文章出處:【微信號:thejiangmen,微信公眾號:將門創投】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    一種圖像語義分層處理框架,可以實現像素級別的圖像語義理解和操縱

    這多虧了密歇根大學和谷歌大腦的研究人員,他們提出了一種新的圖像語義處理分層框架,首先根據圖像中給定對象的邊界框,學習
    的頭像 發表于 08-27 08:52 ?7106次閱讀

    美國普渡大學和哈佛大學的研究人員出了項新發明 新...

    據物理學家組織網報道,美國普渡大學和哈佛大學的研究人員出了項極為應景的新發明:一種外形如同顆圣誕樹
    發表于 02-03 20:30

    研究人員提出了一種柔性可拉伸擴展的多功能集成傳感器陣列

    研究人員提出了一種柔性可拉伸擴展的多功能集成傳感器陣列,成功將電子皮膚的探測能力擴展到7,實現溫度、濕度、紫外光、磁、應變、壓力和接近等多種外界刺激的實時同步監測。
    的頭像 發表于 01-24 15:15 ?7243次閱讀
    <b class='flag-5'>研究人員</b><b class='flag-5'>提出了</b><b class='flag-5'>一種</b>柔性可拉伸擴展的多功能集成傳感器陣列

    特倫托大學與Inria合作:使用GAN生成人體的新姿勢圖像

    使用GAN(對抗生成網絡)生成人體的新姿勢圖像研究人員提出的可變形跳躍連接和最近鄰損失函數,更
    的頭像 發表于 01-29 16:34 ?9616次閱讀
    特倫托大學與Inria合作:使用GAN<b class='flag-5'>生成</b>人體的新<b class='flag-5'>姿勢</b><b class='flag-5'>圖像</b>

    OpenAI的研究提出了一種新的生成模型,能快速輸出高清、真實的圖像

    為下游任務提供了有用的隱藏空間。自回歸模型的隱藏層有著位置的邊緣分布,使其更難對數據進行正確操作。在GAN中,數據點經常不能直接表現在隱藏空間中,因為它們沒有編碼器,可能無法支持數據分布。在可逆生成模型和VAE上就沒有這種情況。
    的頭像 發表于 07-12 08:43 ?8263次閱讀

    以色列研究人員開發出了一種能夠識別不同刺激的新型傳感系統

    據麥姆斯咨詢報道,海法以色列理工學院的研究人員開發出了一種能夠識別并區分不同刺激的創新型傳感系統。該系統基于折紙藝術,結合了以色列理工學院開發的智能墨水材料。
    發表于 05-21 08:45 ?907次閱讀

    研究人員提出了系列新的點云處理模塊

    為了探索這些問題的解決辦法、來自倫敦大學學院的研究人員提出了系列新的點云處理模塊,從效率、信息共享和點云卷積操作等方面進行了研究,得到了
    的頭像 發表于 08-02 14:44 ?3061次閱讀
    <b class='flag-5'>研究人員</b><b class='flag-5'>們</b><b class='flag-5'>提出了</b><b class='flag-5'>一</b>系列新的點云處理模塊

    Facebook的研究人員提出了Mesh R-CNN模型

    研究的目標是通過單張圖像輸入,對圖像中的物體進行檢測、獲取不同物體的類別、掩膜和對應的三維網格,并對真實世界中的復雜模型進行有效處理。在
    的頭像 發表于 08-02 15:51 ?3886次閱讀
    Facebook的<b class='flag-5'>研究人員</b><b class='flag-5'>提出了</b>Mesh R-CNN<b class='flag-5'>模型</b>

    研究人員出了一種新的基于深度學習的策略

    蘇黎世聯邦理工學院的研究人員最近推出了一種新的基于深度學習的策略,該策略可以在不需要大量真實數據的情況下在機器人中實現觸覺傳感。在arXiv上預先發表的篇論文中概述了他們的方法,該方
    的頭像 發表于 03-26 15:47 ?2610次閱讀

    研究人員開發出了一種稱為LB-WayPtNav-DH的機器人導航新框架

    加州大學伯克利分校的研究人員最近開發了一種新的框架,該框架可以增強辦公室,房屋或博物館等室內環境中人類的機器人導航能力。他們的模型在arXiv上預先發表的篇論文中
    發表于 04-09 11:18 ?935次閱讀

    研究人員開發了一種新穎的機器學習管道

    研究人員通過一種特殊的神經網絡模型,它以“基本塊”(計算指令的基本摘要)形式訓練標記的數據,以自動預測其持續時間使用給定的芯片執行以前看不見的基本塊。結果表明,這種神經網絡模型的性能要
    的頭像 發表于 04-15 16:42 ?1851次閱讀

    微軟亞洲研究院的研究提出了一種模型壓縮的新思路

    近日,來自微軟亞洲研究院自然語言計算組的研究提出了一種與顯式地利用蒸餾損失函數來最小化教師模型
    的頭像 發表于 11-24 09:48 ?1657次閱讀

    一種基于改進的DCGAN生成SAR圖像的方法

    針對SAR圖像識別軟件,通過改進 DCGAN模型生成器與單判別器對抗的結構,采用多生成器與單判別器進行對抗,設計了控制各生成
    發表于 04-23 11:01 ?21次下載
    <b class='flag-5'>一種</b>基于改進的DCGAN<b class='flag-5'>生成</b>SAR<b class='flag-5'>圖像</b>的方法

    MIT研究人員提出了一種制造軟氣動執行器的新方法

    麻省理工學院 (MIT) 的研究人員創造了一種新的制造技術,可以制造出更具成本效益的軟氣動執行器。
    的頭像 發表于 05-06 16:38 ?1643次閱讀
    MIT<b class='flag-5'>研究人員</b><b class='flag-5'>提出了</b><b class='flag-5'>一種</b>制造軟氣動執行器的新方法

    生成式 AI 研究通過引導圖像結構控制為創作者賦能

    新的研究正在通過個文本引導圖像編輯工具來提升生成式 AI 的創造性潛能。這項創新性的研究
    的頭像 發表于 07-24 19:30 ?563次閱讀
    主站蜘蛛池模板: 九色综合久久综合欧美97| 国产福利2021最新在线观看| 精品黄色片| 美女扒开尿口让男人30视频| 日产乱码免费一卡二卡在线| 97久久人人| 8050午夜网| 婷婷丁香色| 99色在线播放| 啪啪免费网| 四虎hu| 97爱爱爱| 中文字幕精品一区二区2021年| 天堂资源中文在线| 爱爱免费网址| 91午夜在线观看| 三级毛片在线看| 天天爽夜夜爽人人爽免费 | 夜夜爽爽爽| 国产欧美日韩haodiaose| 深爱激情婷婷| 午夜爽| 欧美一二三区在线| 久久婷婷综合中文字幕| 精品免费视在线视频观看| 伊人网色| 操碰人人| 又粗又大撑满了好爽| 欧美一级片网址| 免费不卡毛片| 五月亭亭激情五月| 夜夜操com| 国产美女叼嘿视频免费看| 国产精品亚洲一区二区三区在线播放 | 欧美一级特黄啪啪片免费看| 天天干天天插| 在线麻豆国产传媒60在线观看| 国产成人精品高清在线| 最猛91大神ben与女教师| 免费网站色| 午夜视频h|