在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一張照片生成3D頭像!蘋果新模型擊敗StyleGAN2

OpenCV學堂 ? 來源:量子位 ? 2023-05-06 10:38 ? 次閱讀

隨便一張照片,就可生成3D頭像。而且光線真實,任意角度可調。

這是蘋果的最新科技生成框架FaceLit。

fd9facbe-eb53-11ed-90ce-dac502259ad0.gif

正如其名,FaceLit的特色就是可以將人臉“點亮”。

“自帶光環”的FaceLit在易用性上也不輸同類,甚至更勝一籌——

進行3D建模時,需要的照片素材無需專門選擇角度,數量上也只需一張。

甚至對表情、發型、眼鏡等元素進行調節時,也不需要額外素材。

而傳統的頭像合成工具或者需要多張圖片才能工作,或者對照片角度有刁鉆的要求。

正是憑借這一創新,FaceLit獲得了3.5的FID評分,較同類產品直接高出了25%。

改進式EG3D合成人像,光線信息單獨處理

下面就來看一下FaceLit具體是如何實現頭像合成的。

總的來說,蘋果采用了將人物本體與光線分別處理再進行疊加的策略。

早期的三維人像合成工具在轉換過程中可能產生形變。

而爆火的NeRF通過將場景拆分成具體因素,提高了3D圖像合成效果,改善了這一問題。

但蘋果團隊認為,在可控性方面,NeRF仍存有不足之處。

于是,在EG3D框架的基礎上,蘋果創造了FaceLit的合成模型。

EG3D通過三平面解碼器,賦予了二維卷積神經網絡生成渲染3D模型所需深度參數的能力。

蘋果團隊對標準的EG3D訓練方式進行了擴展,并將之轉化成了FaceLit框架。

00bb8828-eb54-11ed-90ce-dac502259ad0.png

△FaceLit與傳統EG3D渲染流程對比圖

標準的ED3G使用相機位置p參數作為基本輸入參數。

在建立GAN2操作時,蘋果在EG3D的基礎上加入了光照參數l。

00e63d20-eb54-11ed-90ce-dac502259ad0.png

△不同p(左→右)與l(上→下)值下的初始圖像

蘋果選擇了經過球形諧波方式簡化后的Phong反射模型作為處理光源的物理基礎。

光照參數l就是在這一基礎之上獨立處理得到的。

在自然界中,反射包括鏡面反射和漫反射兩種形式。

014e408c-eb54-11ed-90ce-dac502259ad0.png

△不同鏡面反射率條件下的效果對比

因此,蘋果在ED3G模型中加入了鏡面反射解碼器和漫反射解碼器。

它們替代了可以直接得到顏色c、密度σ數據的三平面解碼器。

017c55c6-eb54-11ed-90ce-dac502259ad0.png

△反射解碼器流程示意圖

通過對GAN2產生的數據進行再次解碼,可以得到鏡面反射率ks和漫反射率kd。

然后再通過兩種反射著色器得到顏色c,密度σ則由漫反射解碼器計算得出。

最終,FaceLit以與三平面解碼器相同的參數(c,w,σ)渲染圖像,并進行分辨率優化。

有的放矢設計訓練策略,數據無需人工標注

生成框架已有,那就來到訓練階段,其特點在于訓練過程中無需人工標注。

方法論層面,在訓練時,團隊使用了FFHQ、MetFaces和CelebA-HQ數據集。

對于不同的數據集,蘋果使用了不同的訓練方式。

FFHQ包含了7萬余條人臉數據,其訓練分為兩個階段:先在較低的分辨率下訓練,再提高分辨率再次進行。

對于包含2萬數據量的CelebA-HQ,訓練不需要分階段進行。

而對于更小的MetFAces,則只需要通過ADA擴容的方式,使用預訓練的FFHQ進行優化調整即可。

定性地看,訓練結果在機位、光源和反射高光等方面都有出色的表現,圖中的細節也有所增強。

01901eb2-eb54-11ed-90ce-dac502259ad0.png

△FaceLit生成的頭像(左側四列)唇齒部位的細節進行了明顯重構

定量結果同樣表明,FaceLit在FID、KID等指標上均優于包括標準EG3D在內的傳統生成方式。

在使用FFHQ作為訓練集的條件下,各生成方式的表現如下表,不難看出FaceLit擁有最低的FID和KID值。

01f9d1c2-eb54-11ed-90ce-dac502259ad0.png

而相比于英偉達的StyleGAN2,FaceLit的表現依舊出色:

021608d8-eb54-11ed-90ce-dac502259ad0.png

光線準確度方面,FaceLit在使用三種不同訓練數據集的情況下,與人工設定的標準值平均均方誤差均低于0.01。

023169e8-eb54-11ed-90ce-dac502259ad0.png

網友:人們低估了蘋果AI

消息發出后,便有網友認為“這是對更重磅產品的預熱”。

更有網友直接推測,FaceLit的出現標示著人工智能將進軍AR和VR領域,蘋果的混合現實將最終實現商用……

0246e052-eb54-11ed-90ce-dac502259ad0.png

也有網友認為,FaceLit不會商用,否則蘋果才不會以論文的形式發表。

0264b2e4-eb54-11ed-90ce-dac502259ad0.png

針對FaceLit本身,也有網友表示,除了LLM,其他都是浮云,他們(蘋果)如果不開發LLM,就沒有未來。

0288f942-eb54-11ed-90ce-dac502259ad0.png

但這位網友同時也說,蘋果可能已經在做(LLM)了。

相應的,也有網友稱人們“低估了蘋果在AI領域的深度”。

02a894fa-eb54-11ed-90ce-dac502259ad0.png

所以各位網友對蘋果在AI領域還有什么樣的期待呢?

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 解碼器
    +關注

    關注

    9

    文章

    1144

    瀏覽量

    40835
  • 模型
    +關注

    關注

    1

    文章

    3279

    瀏覽量

    48976
  • 3D圖像
    +關注

    關注

    0

    文章

    38

    瀏覽量

    10756

原文標題:一張照片生成3D頭像!蘋果新模型擊敗StyleGAN2,表情光線都能調,網友:要用于MR?

文章出處:【微信號:CVSCHOOL,微信公眾號:OpenCV學堂】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    中國傳動網:全球首3D打印唱片發布 歌聲也可3D打印

    KeleOkereke宣布,他將采用Ghassaei的方法為定于下周發布的首新歌3D打印一張唱片。得知Autodesk的創客空間Pier9新進了套Stratasys公司頂級的
    發表于 12-17 16:36

    Labview中如何導入3D模型

    Labview中如何導入3D模型,例如3Dmax生成模型。嘗試過用.STL格式導入Labview。但是
    發表于 01-26 13:13

    關于利用2D圖片利用投影的方法創建3D模型

    例如攝影機拍攝3圖,利用第一張和第三構建出3D結構,測試第二圖中的特征距離該
    發表于 10-08 22:21

    Altium畫好的PCB文件,怎么刪除3D模型

    一張畫好的PCB文件,元件庫自帶了3D模型,請問下,如果要把整個PCB文件的3D模型都刪除的話,要怎么刪除?
    發表于 01-16 11:02

    浩辰3D軟件入門教程:如何比較3D模型

    。浩辰3D軟件不僅提供了完備的零件、裝配、仿真、工程圖、鈑金、焊接等數十種設計模塊,還提供了「比較模型」和「比較圖紙」功能,讓這過程高效且精確。01「比較模型」在
    發表于 12-15 13:45

    AD的3D模型繪制功能介紹

    共提供了4種類型,類型1常規型,類型2時圓柱體模型,類型3是外部模型,類型4是球體模型。我們根
    發表于 01-14 16:48

    【PHYTEC開發板試用體驗】3 通過開發板拍一張照片

    還是挺全的,可以看的出來我們的攝影頭驅動已經裝好了。3. 應用程序3.1 簡介嗯,接下來我們就可以寫個上層應用程序,來驗證下這個驅動是不是好的?功能很簡單,我們按照我們的想法來拍一張照片
    發表于 06-12 14:43

    視覺處理,2d照片3d模型

    首先,太陽高度是恒定的。 照片每像素的亮度可求。我們只需要求出太陽與眼睛到物體的夾角就能求出3d模型。 最多就是各種物質的反射率。 英偉達的oir芯片就是做汽車視覺的,大家去取取經。 有時,2
    發表于 05-21 17:13

    一張照片就可識別用戶身份準確率達99.5%

    有研究表明利用一張照片就可以輕松識別用戶的身份和用戶使用的智能手機型號,類似于種PRNU指紋。據悉測試的準確率達到了99.5%,這種識別技術將會被用于身份驗證。
    發表于 12-18 10:58 ?1.3w次閱讀

    一張照片進行AI“換臉”之后,可以突破刷臉支付的安全系統嗎?

    對于引起廣泛爭議的用戶個人隱私和支付安全等問題,“ZAO”運營團隊稱,“ZAO”所呈現的“換臉”效果,是根據用戶提交的頭像照片,通過后期技術疊加所實現的虛構圖像,并沒有采集任何個人生物識別特征;刷臉支付安全門檻極高,僅通過一張照片
    的頭像 發表于 09-12 14:20 ?5337次閱讀

    一張照片揭示了即將推出的Realme X9的纖薄外形

    今天,該品牌在印度和歐洲的首席執行官Madhav Sheth在其Twitter上分享了一張照片。它揭示了即將推出的Realme X9的纖薄外形。根據圖片,新的智能手機將厚達六信用卡,并堆疊在起。
    的頭像 發表于 01-27 15:02 ?2468次閱讀

    首個能根據單圖像生成較高分辨率3D人臉模型的系統

    分辨率的3D人臉模型。 AvatarMe是首個能根據單圖像生成較高分辨率3D人臉模型的系統。在
    的頭像 發表于 01-27 17:02 ?3647次閱讀
    首個能根據單<b class='flag-5'>一</b>圖像<b class='flag-5'>生成</b>較高分辨率<b class='flag-5'>3D</b>人臉<b class='flag-5'>模型</b>的系統

    一張照片定制自己的3D數字化身?

    。僅需一張圖片甚至句文字描述,RODIN 擴散模型就能秒級生成 3D 化身,讓低成本定制 3D
    的頭像 發表于 03-22 00:15 ?545次閱讀

    3D人體生成模型HumanGaussian實現原理

    3D 生成領域,根據文本提示創建高質量的 3D 人體外觀和幾何形狀對虛擬試穿、沉浸式遠程呈現等應用有深遠的意義。傳統方法需要經歷系列人工制作的過程,如
    的頭像 發表于 12-20 16:37 ?1659次閱讀
    <b class='flag-5'>3D</b>人體<b class='flag-5'>生成</b><b class='flag-5'>模型</b>HumanGaussian實現原理

    歡創播報 騰訊元寶首發3D生成應用

    1 騰訊元寶首發3D生成應用 只需一張照片,便能迅速打造獨無二的3D角色。7月16日,騰訊旗下大模型
    的頭像 發表于 07-18 11:39 ?785次閱讀
    歡創播報 騰訊元寶首發<b class='flag-5'>3D</b><b class='flag-5'>生成</b>應用
    主站蜘蛛池模板: 日本人69xxx| 老司机色网| 精品久久看| 国产99久9在线视频| 1024亚洲视频| 色偷偷男人天堂| 爱爱456高清国语在线456| 欧美xxxx日本| 亚洲福利一区福利三区| 99在线热播精品免费| 亚洲成a人v在线观看| 欧美福利一区| 国内激情自拍| 男女那啥的视频免费| 一级伦奸视频| 中文字幕第页| 一区二区三区无码高清视频| 加勒比一到三区| 日本最猛黑人xxxx猛交| 一区二区三区在线免费| 5g影院天天爽 | 中文天堂网在线www| 天天做.天天爱.天天综合网| 久久影视精品| xxxx大片| 伊人草| 中文字幕婷婷| 天堂国产| 深爱激情五月网| 欧美 日韩 中文字幕| 色www| 久久久久久久综合| 伊人天天干| 在线观看高清免费播放| 欧美视频图片| 亚洲一区二区三区免费| 五月天婷婷导航| 就去干综合| 国产网站在线免费观看| 午夜免费在线观看| 色网址在线观看|