在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

港中大IDEA開源首個大規(guī)模全場景人體數(shù)據(jù)集Human-Art

CVer ? 來源:CVer ? 作者:CVer ? 2023-04-11 14:13 ? 次閱讀

編者按:

自古以來,人類形象已被廣泛記錄在繪畫、雕塑等形式多樣的藝術(shù)作品中,但目前大多數(shù)以人為中心計算機視覺任務(wù),都僅僅關(guān)注了現(xiàn)實世界中的真實照片,而忽略了人在虛擬場景下的表征。

針對于此,IDEA 研究院的 CVPR 2023 入選論文之一“Human-Art: A Versatile Human-Centric Dataset Bridging Natural and Artificial Scenes”,提出了首個同時包含現(xiàn)實和虛擬場景的大規(guī)模全場景人體數(shù)據(jù)集 Human-Art,現(xiàn)已正式開源。

本期《IDEA有研知》為你詳細介紹Human-Art 數(shù)據(jù)集及下游任務(wù)表現(xiàn)。另外,本文作者在博士階段首篇投稿論文即中CVPR,文末“科研有門道”環(huán)節(jié)將帶你一同聽聽她的科研心得~

話不多說

先來看看 Human-Art 輔助訓(xùn)練的模型效果

天馬行空的兒童簡筆畫,大人未必數(shù)得清

用Human-Art訓(xùn)練的模型能輕松辨認計算

創(chuàng)作中國傳統(tǒng)皮影畫,已有模型束手無策?

用Human-Art訓(xùn)練一下,一鍵即可生成

左:原始Stable Diffusion模型生成圖

右:使用包含Human-Art數(shù)據(jù)微調(diào)后的模型生成圖

上圖給定文本:

“一張描述了三個人坐在中國亭子的皮影戲圖片”

上圖給定文本:

“一張描述了三個女人走路的色彩豐富的皮影戲圖片”

Human-Art 數(shù)據(jù)集現(xiàn)已正式開源

涵蓋5個真實場景和15個虛擬場景

代碼地址:

https://github.com/IDEA-Research/HumanArt

項目主頁:

https://idea-research.github.io/HumanArt/

5萬張圖像,超12.3萬個人物形象,

Human-Art為CV領(lǐng)域拓展虛擬場景

在照相機發(fā)明前,人類形象已在各類藝術(shù)創(chuàng)作載體上被記錄和呈現(xiàn)。從古代的壁畫到紙上的水墨畫、油畫,以及姿態(tài)豐富的人體雕塑,再到如今AIGC創(chuàng)作出各種各樣的虛擬人物,大量的藝術(shù)作品同樣提供了與人體相關(guān)的、豐富多樣的視覺數(shù)據(jù)。

然而,現(xiàn)有的計算機視覺任務(wù)、訓(xùn)練的數(shù)據(jù)集等大多只關(guān)注到了真實世界的照片,這導(dǎo)致相關(guān)模型在更豐富的場景下,常常出現(xiàn)性能下降甚至完全失效的問題。即使是SOTA性能的人體檢測模型,面對虛擬場景的人體數(shù)據(jù)時也往往令人大失所望,檢測準確率不足20%。

已有工作關(guān)注到了虛擬場景數(shù)據(jù)集稀缺的問題,如ClassArch、Sketch2Pose、People-Art等數(shù)據(jù)集納入了人造場景下的數(shù)據(jù),但都存在數(shù)據(jù)規(guī)模小(最多的ClassArch也僅收集了1513張照片),僅能支持單一場景的人體檢測任務(wù)等不足。

0271e530-d827-11ed-bfe3-dac502259ad0.png

Human-Art數(shù)據(jù)集與常用數(shù)據(jù)集的對比

經(jīng)過近半年的工作,本文研究團隊收集了來自5個現(xiàn)實場景和15個虛擬場景的5萬張高質(zhì)量圖像,提出了首個同時包含現(xiàn)實和虛擬場景,具有人體框、人體關(guān)鍵點、自接觸點及文本描述的多場景大規(guī)模數(shù)據(jù)集Human-Art,彌補了先前數(shù)據(jù)集場景不足等問題。

Human-Art選取的場景,包括3個3D虛擬場景和12個2D虛擬場景。圖片風(fēng)格除了常見的油畫、水墨畫等繪畫外,還有線條簡單的兒童簡筆畫、素描畫,形象大小各異的卡通畫,造型和服裝繁復(fù)的手辦模型,以及中國傳統(tǒng)的皮影等等。不同的場景都存在一定的數(shù)據(jù)處理難題,部分場景如雕塑、壁畫的人物形象殘缺或極難辨認等,需要研究團隊耗費大量時間和人力解決。(小編:聽說搭建數(shù)據(jù)集初期收集了近100萬張圖片,需要靠作者肉眼快速辨認才完成初篩……)經(jīng)年累月斑駁褪色、細節(jié)難辨的壁畫

也是Human-Art數(shù)據(jù)集涵蓋的場景之一

Human-Art 每張圖片標注了人體框、21 個人體關(guān)鍵點、自接觸點及文本描述信息。為方便學(xué)術(shù)界和工業(yè)界的使用,Human-Art定義的21個人體關(guān)鍵點擴展了真實人體數(shù)據(jù)集MSCOCO中定義的17個關(guān)鍵點,新增4個腳趾尖、手指尖關(guān)鍵點。

Human-Art的21個標注點信息

Human-Art 可支持多項人體相關(guān)的計算機視覺任務(wù),如全場景人體檢測、全場景人體 2D/3D 姿態(tài)估計、全場景人體圖片生成,并為各項下游任務(wù)提供基準結(jié)果。相信未來將有助于提升各類模型在虛擬場景下訓(xùn)練的性能,也可以為更多研究方向如 out-of-distribution(OOD)問題等提供幫助,為學(xué)術(shù)界帶來更多思考。

支持多項以人為主的下游視覺任務(wù),

經(jīng)Human-Art訓(xùn)練的模型表現(xiàn)如何?

下游任務(wù)一:人體檢測

人體檢測(Human Detection)是從場景中識別并框出人物。過往的檢測方案存在兩個問題:一是大多選用通用的物體數(shù)據(jù)集訓(xùn)練,沒有特別針對人做檢測,二是使用的數(shù)據(jù)集通常僅僅包含現(xiàn)實場景,人體檢測器在虛擬風(fēng)格上的泛化性極差。

Human-Art中的圖片均以人為中心,支持對風(fēng)格更具包容性的人體檢測器訓(xùn)練。為了論證Human-Art數(shù)據(jù)集對于多風(fēng)格訓(xùn)練的作用,研究團隊在四個檢測器(Faster R-CNN、YOLOX、Deformable DETR、DINO)上進行了實驗。

02eedcf2-d827-11ed-bfe3-dac502259ad0.png

四種主要檢測器

使用Human-Art訓(xùn)練測試結(jié)果

可以看到,未經(jīng)過Human-Art訓(xùn)練的檢測器在多風(fēng)格人體數(shù)據(jù)上表現(xiàn)極差,而經(jīng)過訓(xùn)練后,F(xiàn)aster R-CNN檢測準確率在皮影風(fēng)格上的提升可以高達56%,平均準確率提升達到31%。

下游任務(wù)二:2D人體姿態(tài)估計

人體姿態(tài)估計(Human Pose Estimation)是通過圖片還原其中人體關(guān)鍵點的位置,主要劃分為2D人體姿態(tài)估計和3D人體姿態(tài)估計。復(fù)雜姿態(tài)、遮擋和多樣化的背景,使其仍然相當(dāng)具有挑戰(zhàn)性。

2D人體姿態(tài)估計可以被主要分為三類:自頂向下的方法(top-down)、自底向上的方法(bottom-up),以及單階段方法(one-stage)。與人體檢測類似,人體姿態(tài)識別也存在在虛擬風(fēng)格上的泛化性問題。

031a2e8e-d827-11ed-bfe3-dac502259ad0.png

2D人體姿態(tài)估計中

使用Human-Art訓(xùn)練前后對比

研究團隊在實驗中對比了三類方法在Human-Art上的結(jié)果。由于自頂向下的方法嚴重依賴于檢測器,使用未經(jīng)訓(xùn)練的人體姿態(tài)檢測器直接測試后的表現(xiàn)較難提升。相比之下,自底向上和單階段方法訓(xùn)練的檢測器達到了更高精度,如自底向上方法HigherHRNet在多風(fēng)格數(shù)據(jù)上的結(jié)果相比自頂向下的SOTA方法ViTPose有約6個點的提升,單階段方法ED-Pose框架訓(xùn)練的模型準確率更是高出近10個點。(拓展了解:ICLR 2023入選論文ED-Pose)

下游任務(wù)三:3D人體姿態(tài)估計

單目3D人體姿態(tài)估計的深度信息檢測一直是任務(wù)難題,Human-Art標注的自接觸點信息能優(yōu)先緩解這一問題。自接觸點通過合理的深度優(yōu)化,將接觸區(qū)域映射到粗略SMPL模型(一種常用3D人體姿態(tài)的表征方法)的頂點上,最小化接觸頂點之間的距離。

Human-Art標注的自接觸關(guān)鍵點

能幫助優(yōu)化3D人體姿態(tài)估計

下游任務(wù)四:圖片生成

Stable Diffusion等模型的提出,讓圖片生成任務(wù)成為領(lǐng)域內(nèi)外的話題熱點。然而現(xiàn)有生成的人物類圖像,仍存在如多手多腳/少手少腳、肢體位置錯亂等問題,且無法更為精準地控制生成地人體姿態(tài)等。

Human-Art提供了豐富的以人為中心的圖片及對應(yīng)標注,能為生成具有合理結(jié)構(gòu)人體的圖片提供了良好先驗。同時,由于其豐富的標注,Human-Art可以有效輔助可控生成(如Text2Image、Pose & Text2Image),例如使用姿態(tài)信息(Pose)和文本(Text)信息訓(xùn)練作為條件指導(dǎo)生成。

Pose & Text2Image模型效果對比

圖中Ours為基于Stable Diffusion改進的模型

在Human-Art及其他數(shù)據(jù)上共同訓(xùn)練的結(jié)果

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 計算機視覺
    +關(guān)注

    關(guān)注

    8

    文章

    1699

    瀏覽量

    46051
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1208

    瀏覽量

    24749

原文標題:CVPR 2023 | 港中大&IDEA開源首個大規(guī)模全場景人體數(shù)據(jù)集Human-Art

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    個大規(guī)模電路是怎么設(shè)計出來的???

    組合成電路,比如一個電視機的電路板上電子元件縱橫交錯,怎么設(shè)計組合成那樣的,還有各與器件參數(shù)大小怎么算的?數(shù)字電路的各個門,模擬電路的三極管,單個是簡單,就是不明白怎么組合成大規(guī)模電路的。書上就那么幾個簡單的電路圖,網(wǎng)上也查詢過,還是沒得出答案,誰能幫忙解決下。非常感謝!!!
    發(fā)表于 12-24 20:34

    大規(guī)模特征構(gòu)建實踐總結(jié)

    背景一般大公司的機器學(xué)習(xí)團隊,才會嘗試構(gòu)建大規(guī)模機器學(xué)習(xí)模型,如果去看百度、頭條、阿里等分享,都有提到過這類模型。當(dāng)然,大家現(xiàn)在都在說深度學(xué)習(xí),但在推薦、搜索的場景,據(jù)我所知,ROI并沒有很高,大家
    發(fā)表于 11-19 09:35

    大規(guī)模MIMO的利弊

    (Multiple-Input Multiple-Output,MIMO)時,數(shù)據(jù)的傳輸速率可能會下降50%以上。大規(guī)模MIMO被認為是5G網(wǎng)絡(luò)的關(guān)鍵支持技術(shù)之一。MIMO是無線通信中已被確立起來的技術(shù),利用該
    發(fā)表于 06-18 07:54

    大規(guī)模MIMO的性能

    軌跡產(chǎn)生的容量斜坡仍然比需求線平坦。面對此挑戰(zhàn),3GPP 標準實體近來提出了數(shù)據(jù)容量“到2020 年增長1000 倍”的目標,以滿足演進性或革命性創(chuàng)意的需要。這種概念要求基站部署極大規(guī)模的天線陣
    發(fā)表于 07-17 07:54

    大規(guī)模數(shù)據(jù)的相似度計算原理

    Spark MLlib 之 大規(guī)模數(shù)據(jù)的相似度計算原理探索
    發(fā)表于 06-04 08:19

    國內(nèi)唯一開源基金會“開放原子開源基金會“正式成立!

    還公布了OpenHarmony項目,華為方面表示,將向開放原子開源基金會捐贈鴻蒙源代碼、文檔、開發(fā)環(huán)境。 開源的鴻蒙項目名為 OpenHarmony。OpenHarmony 是一款定位面向全場景
    發(fā)表于 09-10 17:24

    鴻蒙OS適用的全場景到底什么意思?

    上,未來會有越來越多的智能設(shè)備使用開源的鴻蒙OS。華為消費者業(yè)務(wù)CEO余承東在介紹鴻蒙OS開發(fā)初衷時表示:“隨著全場景智慧時代的到來,華為認為需要進一步提升操作系統(tǒng)的跨平臺能力,包括支持全場景、跨多
    發(fā)表于 09-25 09:25

    請教大神如何去管理大規(guī)模數(shù)據(jù)

    請教大神如何去管理大規(guī)模數(shù)據(jù)
    發(fā)表于 05-11 06:56

    鴻蒙開源全場景應(yīng)用開發(fā)資料匯總

    1、鴻蒙開源全場景應(yīng)用開發(fā)——視頻編解碼面對鴻蒙這一全新的生態(tài),廣大消費者在積極嘗鮮的同時,家中不可避免會出現(xiàn)安卓設(shè)備和鴻蒙設(shè)備并存的現(xiàn)象,短期內(nèi)可能不會形成全鴻蒙的生態(tài)環(huán)境。因此,在未來的一段時間
    發(fā)表于 03-23 10:09

    一個benchmark實現(xiàn)大規(guī)模數(shù)據(jù)上的OOD檢測

    有效,可以探索在該規(guī)模數(shù)據(jù)上的OOD檢測。其實論文high-level的idea很好理解,因為相對于小規(guī)模數(shù)據(jù)
    發(fā)表于 08-31 15:11

    全球首個港口全面數(shù)字孿生技術(shù)底座“津鴻”系統(tǒng)發(fā)布

    ”,對港口行業(yè)智慧化轉(zhuǎn)型升級具有重要意義。三方強強聯(lián)合據(jù)了解,“津鴻”是以鴻蒙系統(tǒng)為內(nèi)核、面向港口工業(yè)互聯(lián)網(wǎng)應(yīng)用場景,基于開放原子開源基金會的OpenHarmony,專門面向港口行業(yè)打造的全場景分布式
    發(fā)表于 12-14 17:06

    中大規(guī)模集成組合邏輯構(gòu)件

    中大規(guī)模集成組合邏輯構(gòu)件:本章系統(tǒng)的討論采用MSI、LSI及VLSI通用的74系列集成芯片設(shè)計各種常用的組合邏輯電路的方法。主要內(nèi)容有編碼器、譯碼器、數(shù)值比較器、數(shù)據(jù)選擇器、奇
    發(fā)表于 09-01 08:57 ?15次下載

    個大規(guī)模超文本網(wǎng)絡(luò)搜索引擎剖析(英文版)

    個大規(guī)模超文本網(wǎng)絡(luò)搜索引擎剖析(英文版)
    發(fā)表于 04-30 14:09 ?0次下載

    我國首個大規(guī)模微發(fā)光二極管芯片項目將在2021年順利投產(chǎn)

    據(jù)湖北省葛店經(jīng)濟技術(shù)開發(fā)區(qū)消息,三安光電 Mini/Micro LED芯片產(chǎn)業(yè)化項目預(yù)計明年三月項目將投產(chǎn)見效。這是我國首個大規(guī)模微發(fā)光二極管芯片項目,產(chǎn)品主要供應(yīng)三星、華為、蘋果等公司。
    的頭像 發(fā)表于 11-10 15:57 ?2844次閱讀

    首個5G全場景應(yīng)用智慧港口項目廈門落地

    日前,首個5G全場景應(yīng)用智慧港口項目廈門遠海碼頭5G智慧港口項目在廈門落地,廈門綠色智慧升級之路又多了一道亮麗風(fēng)景線。 遠海碼頭5G智慧港口項目以5G通信技術(shù)為引領(lǐng),協(xié)同云平臺、大
    的頭像 發(fā)表于 11-10 16:33 ?1764次閱讀
    主站蜘蛛池模板: 亚洲香蕉影视在线播放| 永久毛片| 日日噜噜噜夜夜爽爽狠狠视频| 黄网站色视频大全免费观看| 免费福利片2022潦草影视午夜| 午夜影院18| 天天色国产| 人人插人人| 波多野结衣福利| 日本黄页在线观看| 嘿嘿午夜| 额去鲁97在线观看视频| 国产午夜毛片一区二区三区| yy8090韩国日本三理论免费| 国产精品任我爽爆在线播放6080 | 日韩欧美高清一区| 免费国产zzzwww色| 日本xxxxx黄区免费看动漫| 亚洲国产欧美日韩一区二区三区| 香港三级理论在线观看网站| 日韩欧美一区二区三区不卡视频 | 国产在线成人一区二区| 亚洲成年人在线| 日韩三级在线免费观看| 美女全黄网站免费观看| 日本免费小视频| 日韩在线网| 久久久精品久久久久久久久久久| 国产馆精品推荐在线观看| 九九精品久久久久久噜噜| www性| www四虎影院| 色就操| 日本人善交69xxx| 欧美乱理伦另类视频| 亚洲啪啪免费视频| 亚洲毛片儿| 男男宿舍高h炒肉bl| 四虎新网站| 日韩a一级欧美一级| 国产一级特黄aa大片爽爽|