在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

百度推智能數據服務平臺EasyData,具有高級智能數據清洗功能

如意 ? 來源:51cto ? 作者:佚名 ? 2020-09-07 10:55 ? 次閱讀

在進行AI模型開發時,數據的數量與質量直接影響模型效果。在實地數據采集之后,企業往往需要從大量數據中篩選出符合訓練要求的相關數據,剔除質量差或不相關的數據,這個步驟被稱為數據清洗。

通常來講,在清洗數據時主要會清理掉對訓練任務沒有用途的數據,例如在訓練工廠工人佩戴安全帽識別模型時,希望在視頻抽幀后的大量圖片中僅保留有工人出現的圖片進行標注訓練。在這一步驟上,傳統做法是進行人工篩選,人力投入較多且容易發生遺漏;隨著人工智能發展,目前許多平臺,如百度大腦AI開放平臺,已經提供人臉檢測、人體檢測的通用接口,用戶可以先調用接口處理數據,篩選出采集到人像的數據,再進入到具體的檢測識別步驟。那么,是否有一個集成了各項數據處理能力,盡量減少人工干預,能夠自動完成視頻數據采集、抽幀、數據清洗、智能標注,從而高效提取高質量訓練數據的解決方案呢?

關注到有越來越多的用戶對數據處理有強烈需求,今年4月,百度全新推出智能數據服務平臺EasyData,集數據采集、數據清洗、數據標注等功能于一身,完成上述數據處理工作之后,可以在EasyDL平臺進行模型訓練、模型部署。

針對數據清洗這一具體功能,EasyData目前上線了去相似、去模糊、旋轉、裁剪和鏡像這5種基礎的數據清洗功能。那么除了常規能力之外,EasyData還有什么業內獨家的終極秘技?

從應用出發,高級清洗功能讓數據處理事半功倍

在園區智能管理等場景下,需要監測工廠園區、林區中是否有人闖入,或檢查工人是否佩戴安全帽。為了滿足此類場景下的圖片清洗需求,EasyData上線了高級清洗功能,將無人臉、無人體出現的數據進行過濾。EasyData聯動百度大腦AI開放平臺提供的前沿技術能力,用戶僅需在百度智能云上開通相應的服務(人臉檢測和人體檢測都可以免費試用),就可以通過簡單的配置,在EasyData平臺上直接使用這些功能進行自動數據清洗。

1、過濾無人臉圖片

如果以前沒有用過百度智能云的人臉檢測服務,第一次使用高級清洗的功能會提示“申請免費試用”,點擊鏈接會進入百度智能云人臉檢測的頁面,按照提示,開通服務后,再回到EasyData的頁面就可以正常使用了。

和基礎的數據清洗服務一樣,過濾無人臉圖片也是以數據集為單位的。在數據清洗頁面選擇過濾無人臉圖片,點擊保存,提交任務就可以進行清洗。如果勾選了“保留標簽”,那么不僅會把沒有人臉的圖片過濾,還會將人臉畫框同步至清洗后的數據集。

例如下圖,清洗前的數據集除了人臉圖片,還有一些風景照、車輛等其他物體的照片,人臉過濾會把這些沒有人臉的圖片過濾,保留下來包含人臉的圖片,包括戴口罩、被遮擋的人臉也可以識別出來。

過濾無人體圖片同樣會用到百度智能云的人體檢測能力,在使用之前需要在百度智能云上開通相應的服務。過濾無人體圖片會用到兩個接口,人體檢測和屬性分析(https://ai.baidu.com/tech/body/attr)和人像分割(https://ai.baidu.com/tech/body/seg)。數據集模板為圖像分類和物體檢測的數據集會調用人體檢測和屬性分析接口,數據集模板為圖像分割的數據集會調用人像分割接口。百度智能云上的人像分割接口返回的是人像圖片對應的二值圖片(人像為1,背景為0),在后端會執行相應的標簽轉換,返回的二值圖片轉換成對應的標簽。

關注廣泛需求,提供多種基礎數據清洗功能

1、去相似圖片

用攝像頭自動采集圖片的時候,由于長時間在同一個場景下,即使做了抽幀處理,還是會有大量的相似圖片。大量的相似圖片,數據價值低,而且占用了大量的存儲空間,而人工篩選,耗時費力,容易出錯。EasyData平臺推出的去相似圖片利用圖片的相似檢索特征,計算圖片的兩兩相關性,可以自動地判斷相似圖片、保留不相似的圖片,具體操作也十分簡便。

如下圖所示,去相似前的數據集里有8張圖片,根據圖片的相似度,圖片可以分成3類。清洗完成后的數據集中有3張圖片,分別是清洗前的3類圖片中的一張。

2、去模糊圖片

相機抖動、物體快速移動都會造成拍出來的圖片不清晰、產生低質圖片。通過人工挑選的方法去除模糊圖片缺乏統一的標準,容易漏刪或多刪。利用EasyData的去模糊圖片,可以輕易地去除模糊圖片。

以示例圖片為例,清洗前有5張圖片,畫質不一,清洗后保留下來兩張高質量的圖片。此外,如果用戶認為有部分模糊圖片沒有去除,或者高質量的圖片沒有保留下來,可以考慮調整清晰度的分值,重新清洗。

對于普通清洗,可以在一個清洗任務中提交多個清洗操作,例如同時勾選去相似、去模糊功能,即可同時去除相似和模糊的圖片。

目前的數據清洗服務所能支持的最大數據集大小是5萬張圖片。基于EasyData平臺的大數據處理平臺,對于基礎清洗服務,2萬張圖片的數據集,僅需1小時可以完成清洗;5萬張圖片的數據集,只需2小時即可完成清洗。對于高級清洗服務來說,清洗效率也可以通過配置QPS靈活調整清洗效率,更方便快捷。

考慮到智能園區管理等場景中,有對視頻進行截幀、自動上傳的需求,EasyData平臺也免費提供SDK,供用戶進行下載,可以將SDK接入業務現場的數據采集終端,在平臺設置截幀時間與間隔,自動將原始視頻數據截為圖片數據并上傳至EasyData平臺進行后續處理。

EasyData是百度大腦推出的業內首個提供軟硬一體、端云協同的智能數據采集與處理平臺,支持圖片、文本、音頻和視頻四類數據的處理,其中圖片數據支持了采集、清洗、標注一站式處理,覆蓋模型開發中的各類數據管理需求。EasyData處理后的數據可直接應用于EasyDL模型訓練,通過EasyDL預訓練模型和自動遷移學習機制,高效開發AI模型。
責編AJX

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    31262

    瀏覽量

    269632
  • 百度
    +關注

    關注

    9

    文章

    2273

    瀏覽量

    90562
  • 人臉識別
    +關注

    關注

    76

    文章

    4014

    瀏覽量

    82084
  • 數據分析
    +關注

    關注

    2

    文章

    1455

    瀏覽量

    34090
收藏 人收藏

    評論

    相關推薦

    ElfBoard開源項目|百度智能平臺的人臉識別項目

    百度智能平臺的人臉識別項目,旨在利用其強大的人臉識別服務實現自動人臉識別。選擇百度智能云的原因
    的頭像 發表于 12-24 10:54 ?445次閱讀
    ElfBoard開源項目|<b class='flag-5'>百度</b><b class='flag-5'>智能</b>云<b class='flag-5'>平臺</b>的人臉識別項目

    百度將發布AI智能眼鏡

    近日,有知情人士透露,百度旗下的人工智能品牌小計劃在即將舉行的百度世界大會上推出一款全新的AI智能眼鏡。這款眼鏡將內置先進的人工
    的頭像 發表于 11-11 14:50 ?501次閱讀

    百度智能云榮獲A級工業互聯網“雙跨”平臺企業

    的是,百度智能云在本次評價中表現突出,榮獲A級工業互聯網“雙跨”平臺企業稱號。這不僅是對百度智能云在工業互聯網領域技術實力和創新能力的高度認
    的頭像 發表于 11-11 13:53 ?297次閱讀

    百度智能云發布千帆大模型平臺3.0

    2024年百度云智大會上,百度智能云震撼發布千帆大模型平臺3.0,標志著其在AI領域又一里程碑式的進步。新版平臺不僅實現了全面升級,更交出了
    的頭像 發表于 09-26 14:51 ?467次閱讀

    百度舸AI計算平臺4.0震撼發布

    在2024年百度云智大會的璀璨舞臺上,百度智能云重磅推出了舸AI異構計算平臺的全新力作——4.0版本。此次升級,標志著
    的頭像 發表于 09-26 14:46 ?496次閱讀

    百度發布智能代碼助手“文心快碼”

    在近日舉辦的WAVE SUMMIT大會上,百度公司震撼發布了全新的智能代碼助手——“文心快碼”。這款基于百度文心大模型的強大工具,結合了海量的編程數據,旨在為開發者提供一站式的代碼
    的頭像 發表于 07-01 11:20 ?937次閱讀

    http讀取百度返回的json數據時丟失數據怎么處理?

    我在使用百度ai開放平臺的語音識別功能,讀取返回的數據時,使用esp_http_client_read(client, http_data, 1024);讀到的
    發表于 06-24 07:00

    特斯拉將與百度合作,高級輔助駕駛技術

    一位知情人士向第一財經透露,百度智圖科技有限公司所提交的GS(2023)4634號高級駕駛輔助地圖即為雙方合作成果,特斯拉與百度地圖的合作具有“獨家性”且深度定制化。
    的頭像 發表于 04-30 16:24 ?410次閱讀

    百度智能云與全球知名咨詢服務機構畢馬威簽署戰略合作協議

    近日,在首屆“百度智能云GENERATE全球生態大會”上,百度智能云與全球知名咨詢服務機構畢馬威簽署戰略合作協議。
    的頭像 發表于 04-14 09:24 ?829次閱讀

    百度智能云攜手烏鎮共建AI數據產業基地

    近日,百度智能云與桐鄉市烏鎮大數據高新技術產業園區簽署合作協議,雙方將發揮各自優勢,以人工智能標注產業為基礎,共建百度
    的頭像 發表于 04-01 16:12 ?670次閱讀

    百度智能云正式發布了《百度智能云水業大模型白皮書》

    3月28日,由E20環境平臺主辦的2024(第二十二屆)水業戰略論壇在北京召開。會上,百度智能云正式發布了《百度智能云水業大模型白皮書》(以
    的頭像 發表于 03-29 09:20 ?1394次閱讀
    <b class='flag-5'>百度</b><b class='flag-5'>智能</b>云正式發布了《<b class='flag-5'>百度</b><b class='flag-5'>智能</b>云水業大模型白皮書》

    漳州市長魏東到訪百度,與百度智能云共商漳州新質生產力發展

    發展,就百度智能云(漳州)人工智能基礎數據產業基地、生態合作項目,百度智能云與漳州在文旅、交通、
    的頭像 發表于 03-25 11:27 ?901次閱讀

    百度智能云宣布發布多款大模型

    百度智能云近日發布了一系列重要消息,其千帆平臺迎來了一系列升級,為用戶帶來了更加豐富的功能和體驗。其中,千帆AppBuilder AI原生應用開發
    的頭像 發表于 03-22 11:29 ?924次閱讀

    一圖講透百度智能云千帆大模型平臺全面升級!

    【一圖講透】百度智能云千帆大模型平臺全面升級!
    的頭像 發表于 03-22 10:44 ?527次閱讀
    一圖講透<b class='flag-5'>百度</b><b class='flag-5'>智能</b>云千帆大模型<b class='flag-5'>平臺</b>全面升級!

    華為智能座艙與百度地圖簽署生態合作協議

    華為智能座艙與百度地圖正式簽署生態合作協議,共同在智能座艙領域打造車機版百度地圖。這一合作將手機端百度地圖的豐富體驗延伸至車端,為用戶提供更
    的頭像 發表于 01-19 15:25 ?853次閱讀
    主站蜘蛛池模板: 自拍偷拍福利| 五月天婷婷亚洲| 7777在线| 国产农村妇女毛片精品久久久| 性欧美日韩| 69精品久久久久| 波多野结衣一级特黄毛片| 511韩国理论片在线观看| 免费网址视频在线看| 亚洲视频在线免费看| 九九免费久久这里有精品23| 在线观看亚洲天堂| 亚洲一成人毛片| 男女午夜特黄毛片免费| 怡红院黄色| 三级毛片在线看| 伦理一区二区三区| 成人永久免费视频| 天天操天天操天天干| 99福利| 狼人狠狠干| 成人免费久久精品国产片久久影院| 欧美第四色| 扒开双腿猛进湿润18p| 四虎影院.com| 久久夜色精品国产噜噜小说| 成年视频在线观看| 成人在线综合网| 天天射天天干天天插| 不卡午夜| 日本不卡在线视频高清免费| 亚洲国产福利| 免费一级大片| 在线视频精品视频| 国产成人精品午夜二三区| 黄色网网址| 亚洲视屏一区| 色综合一区| 国产高清一区二区三区四区| 天天操狠狠操| 中文字幕一区2区3区|