在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

微軟開源的計算機視覺庫

新機器視覺 ? 來源:機器之心 ? 2020-08-28 11:34 ? 次閱讀

本文介紹了微軟開源的計算機視覺庫,它囊括了計算機視覺領(lǐng)域的最佳實踐、代碼示例和豐富文檔。

近年來,計算機視覺領(lǐng)域突飛猛進,在人臉識別、圖像理解、搜索、無人機、地圖、半自動和自動駕駛方面得到廣泛應(yīng)用。而這些應(yīng)用的核心部分是視覺識別任務(wù),如圖像分類、目標(biāo)檢測和圖像相似度。 在各種計算機視覺模型和應(yīng)用層出不窮的當(dāng)下,如何把握發(fā)展脈絡(luò),跟進領(lǐng)域前沿發(fā)展呢?微軟創(chuàng)建了一個庫,提供構(gòu)建計算機視覺系統(tǒng)的大量示例和最佳實踐指導(dǎo)原則。 項目地址:https://github.com/microsoft/computervision-recipes 這個庫旨在構(gòu)建一個全面的集合,涵蓋利用了計算機視覺算法、神經(jīng)架構(gòu)和系統(tǒng)運行方面近期進展的工具和示例。 該庫沒有從頭開始創(chuàng)建實現(xiàn),而是基于已有的 SOTA 庫發(fā)展而來,并圍繞加載圖像數(shù)據(jù)、優(yōu)化和評估模型、擴展至云端構(gòu)建了額外的工具函數(shù)。此外,微軟團隊表示,希望通過該項目回答計算機視覺領(lǐng)域的常見問題、指出頻繁出現(xiàn)的缺陷問題,并展示如何利用云進行模型訓(xùn)練和部署。 該庫中所有示例以 Jupyter notebooks 和常見工具函數(shù)的形式呈現(xiàn)。所有示例均使用 PyTorch 作為底層深度學(xué)習(xí)庫。

Jupyter notebooks 地址:https://github.com/microsoft/computervision-recipes/blob/master/scenarios

工具函數(shù)地址:https://github.com/microsoft/computervision-recipes/blob/master/utils_cv

目標(biāo)群體 該庫的目標(biāo)群體是具備一定計算機視覺知識背景的數(shù)據(jù)科學(xué)家和機器學(xué)習(xí)工程師,因為庫的內(nèi)容以 source-only(僅源代碼)的形式呈現(xiàn),支持自定義機器學(xué)習(xí)建模。這個庫提供的工具函數(shù)和示例旨在為現(xiàn)實世界的視覺問題提供解決方案加速器。 示例 該庫支持不同的計算機視覺場景,如基于單張圖像運行,示例如下:

或基于視頻序列的動作識別等場景,示例如下:

場景 該庫涵蓋常用的計算機視覺場景,包含如下類別:

對于每個主要場景(base),該項目均提供使用戶高效構(gòu)建自己模型的工具。這需要使用者完成一些任務(wù),如基于自己的數(shù)據(jù)微調(diào)模型的簡單任務(wù),或者難例挖掘甚至模型部署等更復(fù)雜的任務(wù)。 1. 圖像分類任務(wù) 該目錄提供了構(gòu)建圖像分類系統(tǒng)的示例和最佳實踐,旨在讓用戶能夠在自己的數(shù)據(jù)集上輕松快速地訓(xùn)練高準(zhǔn)確率分類器。 這里提供的示例 notebook 具備預(yù)置的默認(rèn)參數(shù),可以很好地處理多個數(shù)據(jù)集。該目錄還提供了有關(guān)常見缺陷和最佳實踐的大量文檔。 此外,該庫還展示了如何使用微軟的云計算平臺 Azure,加快在大型數(shù)據(jù)集上的訓(xùn)練速度或?qū)⒛P筒渴馂?web 服務(wù)。

2. 圖像相似度 該目錄提供了構(gòu)建圖像相似度系統(tǒng)的示例和最佳實踐,旨在使用戶能夠基于自己的數(shù)據(jù)集方便快捷地訓(xùn)練高精度模型。 下圖為圖像檢索示例,其中左圖為查詢圖像,右面為與之最相似的 6 幅圖像:

3. 目標(biāo)檢測 該目錄提供了構(gòu)建目標(biāo)檢測系統(tǒng)的示例和最佳實踐,旨在使用戶能夠基于自己的數(shù)據(jù)集方便快捷地訓(xùn)練高準(zhǔn)確率模型。

該庫使用了 torchvision 的 Faster R-CNN 實現(xiàn),它被證明能夠很好地處理多種計算機視覺問題。 項目作者建議使用者在具備 GPU 的機器上運行示例,雖然 GPU 在技術(shù)層面上并非必需,但是如果不使用 GPU,即使只用幾十個圖像,訓(xùn)練過程也會變得非常緩慢。 4. 關(guān)鍵點檢測 該目錄包含構(gòu)建關(guān)鍵點檢測系統(tǒng)的示例和最佳實踐指導(dǎo)原則,并展示了如何使用預(yù)訓(xùn)練模型進行人體姿勢估計。 該目錄使用了 Mask R-CNN 的擴展,可以同時檢測物體及其關(guān)鍵點。其底層技術(shù)與上述目標(biāo)檢測方法類似,即基于 Torchvision 的 Mask R-CNN。

5. 圖像分割 該目錄提供了構(gòu)建圖像分割系統(tǒng)的示例和最佳實踐,旨在使用戶能夠基于自己的數(shù)據(jù)集方便快捷地訓(xùn)練高準(zhǔn)確率模型。

這里的實現(xiàn)使用了 fastai 的 UNet 模型,其中 CNN 主干(如 ResNet)在 ImageNet 數(shù)據(jù)集上經(jīng)過預(yù)訓(xùn)練,因此使用者只需少量標(biāo)注訓(xùn)練樣本就可以對其進行微調(diào)。 6. 動作識別 該目錄包含構(gòu)建基于視頻的動作識別系統(tǒng)所需要的資源,旨在使用戶能夠在自定義數(shù)據(jù)集上輕松快速地訓(xùn)練出高準(zhǔn)確率的快速模型。 動作識別(也叫「活動識別」)包括從一系列幀中對多種動作進行分類,例如「閱讀」或「飲酒」:

動作識別是一個熱門的研究領(lǐng)域,每年都有大量的方法發(fā)表。其中一個突出的方法是 R(2+1)D 模型,它能夠獲得高準(zhǔn)確率,且比其他方法快得多。(參見論文《Large-scale weakly-supervised pre-training for video action recognition》) 該目錄中的實現(xiàn)和預(yù)訓(xùn)練權(quán)重均基于這個 GitHub 庫(https://github.com/moabitcoin/ig65m-pytorch),并添加了一些功能,以使自定義模型的訓(xùn)練和評估更加用戶友好。這里在預(yù)訓(xùn)練時使用的是 IG-Kinetics 數(shù)據(jù)集。 7. 多目標(biāo)跟蹤 該目錄提供了構(gòu)建和推斷多目標(biāo)跟蹤系統(tǒng)的示例和最佳實踐,旨在使用戶能夠基于自定義數(shù)據(jù)集輕松訓(xùn)練高準(zhǔn)確率跟蹤模型。 該庫集成了 FairMOT 跟蹤算法,該算法在近期的 MOT 基準(zhǔn)測試中表現(xiàn)出了很強的跟蹤性能,同時也推理速度也很快。 8. 人群計數(shù) 該目錄提供了多個人群計數(shù)算法的 production-ready 版本,不同算法被統(tǒng)一在一組一致性 API 下。

對多個基于專用數(shù)據(jù)集的人群計數(shù)模型實現(xiàn)進行評估后,該項目將模型范圍縮小到兩個選項:Multi Column CNN model (MCNN) 和 OpenPose 模型。二者均符合速度要求。

對于高密度人群圖像,MCNN 模型取得了良好的效果;

對于低密度場景,OpenPose 表現(xiàn)良好。

而當(dāng)人群密度未知時,該項目采用啟發(fā)式方法。在滿足以下條件時使用 MCNN 進行預(yù)測:OpenPose 預(yù)測大于 20,MCNN 大于 50。反之,則使用 OpenPose 預(yù)測。模型的閾值可以根據(jù)使用者的場景進行更改。

此外,該目錄還展示了依賴項、安裝過程、測試及性能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6619

    瀏覽量

    104223
  • 計算機視覺
    +關(guān)注

    關(guān)注

    8

    文章

    1699

    瀏覽量

    46050
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8428

    瀏覽量

    132837

原文標(biāo)題:PyTorch實現(xiàn),GitHub 4000星:這是微軟開源的計算機視覺庫

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    計算機視覺有哪些優(yōu)缺點

    計算機視覺作為人工智能領(lǐng)域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像和視頻中的信息。這一技術(shù)的發(fā)展不僅推動了多個行業(yè)的變革,也帶來了諸多優(yōu)勢,但同時也伴隨著一些挑戰(zhàn)和局限性。以下是對
    的頭像 發(fā)表于 08-14 09:49 ?1053次閱讀

    機器視覺計算機視覺有什么區(qū)別

    機器視覺計算機視覺是兩個密切相關(guān)但又有所區(qū)別的概念。 一、定義 機器視覺 機器視覺,又稱為計算機
    的頭像 發(fā)表于 07-16 10:23 ?573次閱讀

    計算機視覺的五大技術(shù)

    計算機視覺作為深度學(xué)習(xí)領(lǐng)域最熱門的研究方向之一,其技術(shù)涵蓋了多個方面,為人工智能的發(fā)展開拓了廣闊的道路。以下是對計算機視覺五大技術(shù)的詳細解析,包括圖像分類、對象檢測、目標(biāo)跟蹤、語義分割
    的頭像 發(fā)表于 07-10 18:26 ?1462次閱讀

    計算機視覺的工作原理和應(yīng)用

    計算機視覺(Computer Vision,簡稱CV)是一門跨學(xué)科的研究領(lǐng)域,它利用計算機和數(shù)學(xué)算法來模擬人類視覺系統(tǒng)對圖像和視頻進行識別、理解、分析和處理。其核心目標(biāo)在于使
    的頭像 發(fā)表于 07-10 18:24 ?2161次閱讀

    機器人視覺計算機視覺的區(qū)別與聯(lián)系

    機器人視覺計算機視覺是兩個密切相關(guān)但又有所區(qū)別的領(lǐng)域。 1. 引言 在當(dāng)今科技迅猛發(fā)展的時代,機器人和計算機視覺技術(shù)在各個領(lǐng)域發(fā)揮著越來越
    的頭像 發(fā)表于 07-09 09:27 ?705次閱讀

    計算機視覺與人工智能的關(guān)系是什么

    引言 計算機視覺是一門研究如何使計算機能夠理解和解釋視覺信息的學(xué)科。它涉及到圖像處理、模式識別、機器學(xué)習(xí)等多個領(lǐng)域的知識。人工智能則是研究如何使計算
    的頭像 發(fā)表于 07-09 09:25 ?705次閱讀

    計算機視覺與智能感知是干嘛的

    引言 計算機視覺(Computer Vision)是一門研究如何使計算機能夠理解和解釋視覺信息的學(xué)科。它涉及到圖像處理、模式識別、機器學(xué)習(xí)等多個領(lǐng)域,是人工智能的重要組成部分。智能
    的頭像 發(fā)表于 07-09 09:23 ?996次閱讀

    計算機視覺和機器視覺區(qū)別在哪

    計算機視覺和機器視覺是兩個密切相關(guān)但又有明顯區(qū)別的領(lǐng)域。 一、定義 計算機視覺 計算機
    的頭像 發(fā)表于 07-09 09:22 ?486次閱讀

    計算機視覺和圖像處理的區(qū)別和聯(lián)系

    計算機視覺和圖像處理是兩個密切相關(guān)但又有明顯區(qū)別的領(lǐng)域。 1. 基本概念 1.1 計算機視覺 計算機視覺
    的頭像 發(fā)表于 07-09 09:16 ?1392次閱讀

    計算機視覺屬于人工智能嗎

    屬于,計算機視覺是人工智能領(lǐng)域的一個重要分支。 引言 計算機視覺是一門研究如何使計算機具有視覺
    的頭像 發(fā)表于 07-09 09:11 ?1360次閱讀

    深度學(xué)習(xí)在計算機視覺領(lǐng)域的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)作為其中的核心技術(shù)之一,已經(jīng)在計算機視覺領(lǐng)域取得了顯著的成果。計算機視覺,作為計算機科學(xué)的一個重要分支,
    的頭像 發(fā)表于 07-01 11:38 ?881次閱讀

    機器視覺計算機視覺的區(qū)別

    在人工智能和自動化技術(shù)的快速發(fā)展中,機器視覺(Machine Vision, MV)和計算機視覺(Computer Vision, CV)作為兩個重要的分支領(lǐng)域,都扮演著至關(guān)重要的角色。盡管它們在
    的頭像 發(fā)表于 06-06 17:24 ?1378次閱讀

    計算機視覺的主要研究方向

    計算機視覺(Computer Vision, CV)作為人工智能領(lǐng)域的一個重要分支,致力于使計算機能夠像人眼一樣理解和解釋圖像和視頻中的信息。隨著深度學(xué)習(xí)、大數(shù)據(jù)等技術(shù)的快速發(fā)展,計算機
    的頭像 發(fā)表于 06-06 17:17 ?1032次閱讀

    計算機視覺的十大算法

    隨著科技的不斷發(fā)展,計算機視覺領(lǐng)域也取得了長足的進步。本文將介紹計算機視覺領(lǐng)域的十大算法,包括它們的基本原理、應(yīng)用場景和優(yōu)缺點。這些算法在圖像處理、目標(biāo)檢測、人臉識別等領(lǐng)域有著廣泛的應(yīng)
    的頭像 發(fā)表于 02-19 13:26 ?1285次閱讀
    <b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>的十大算法

    機器視覺、工業(yè)視覺計算機視覺這三者的關(guān)系

    機器視覺、工業(yè)視覺計算機視覺這三者的關(guān)系
    的頭像 發(fā)表于 01-24 10:51 ?1366次閱讀
    機器<b class='flag-5'>視覺</b>、工業(yè)<b class='flag-5'>視覺</b>和<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>這三者的關(guān)系
    主站蜘蛛池模板: 啪啪网视频| 成人三级视频| 亚洲国产七七久久桃花| 怡红院影院| 久久久久88色偷偷| 四虎影视免费看| 奇米福利视频| 99视频网址| 黄色激情小说视频| 欧洲人体超大胆露私视频| 亚洲天堂网站在线| 午夜激情婷婷| hdhdhd69日本xxx| 国产小视频免费| 人人干人人做| 天天爽夜夜爽8888视频精品| 国产欧美色图| 六月婷婷久久| 日本黄大乳片免费观看| 婷婷天堂| 五月婷婷激情综合| 欲色网站| 国产精品久久久久国产精品三级| 91男女视频| aaa成人| 最好看的2019中文字幕免费高清| 一区三区三区不卡| 欧美xx高清| 1000又爽又黄禁片在线久| 国内精品手机在线观看视频| 亚洲 另类 在线 欧美 制服| 亚洲男人的性天堂| 欧美色图一区二区| 轻点太大了好深好爽h文| 欲色综合| 免费的毛片| 狠狠躁夜夜躁人人爽天天段| 99色在线播放| 九九热国产| 视频在线免费观看| aaaaa级毛片免费视频|