盗墓笔记txt全集下载,唐家三少,风凌天下

數據集是機器學習算法的命脈——從某種意義上講，數據集對于自動駕駛等人工智能應用領域，最重要的是它們的質量最高。同時，數據集也衍生出自動駕駛行業新的商業模式。

這就是為什么nuTonomy今天發布了一個名為nuScenes的自動駕駛數據集，它聲稱其規模和精確度超過了KITTI、百度的ApolloScape和Udacity自動駕駛汽車數據集等公共數據集。

Scale為nuScenes提供了數據注釋，公司首席執行官表示，這是有史以來發布的最健壯的開放源碼，基于多傳感器自動駕駛數據集。

NuTonomy編輯了1000多個場景，其中包含140萬幅圖像、40萬次激光雷達掃描（判斷物體之間距離）和110萬個三維邊界框（用RGB相機、雷達和激光雷達組合檢測的物體）。

它們已經通過Scale的傳感器融合注釋API進行了細致的標簽，該API利用人工智能和人類團隊進行數據注釋，并且從本周開始面向行業開源。

近年來，越來越多的公司在加入這個行列。比如，早些時候全球紅外系統供應商Flir發布了基于熱成像儀拍攝的1萬多張帶標注圖片。Mapillary公司發布了25000張街道級別的圖像，以及加州大學伯克利分校上傳了10萬張基于RGB相機拍攝的視頻序列。

之所以被稱之為比之前其他公司和機構發布的數據集更為全面，是因為此次數據搜集使用了6個攝像頭、1個激光雷達、 5個毫米波雷達、GPS及慣導系統，包括對于自動駕駛系統有挑戰性的復雜道路、天氣條件等。

參與此次數據標注的Scale公司，自2016年成立以來，已經為包括Lyft、Voyage、通用汽車、Zoox和Embark在內的客戶標出了超過20億英里的行駛里程。

今年8月，Scale宣布了一輪1800萬美元融資，迄今該公司已籌集到2270萬美元，報告稱去年公司收入增長了15倍。

數據標注的對象通常有圖像、語音、文本、視頻、雷達等。圖像類主要針對視覺識別類公司，所要標注的圖像內容包括人像、建筑物、植物、道路、交通標志、車輛等，每項內容下面，又會根據不同的特征進行不同標簽的標注。

業內人士表示，一般而言，客戶會有自己的需求，公司依規而行。目前在國內，阿里巴巴、騰訊、百度等大型互聯網公司，擁有海量的數據標注需求，單個訂單量都是以億元為單位。如此大的訂單，基本都是分包給不同的數據標注公司進行處理，國內外還沒有一家公司能夠處理這樣大的訂單。

另外還有自動駕駛公司，以及視覺圖像處理的公司，也有著數據標注的強烈的需求，他們需要用標注后的數據來訓練人工智能，而人工智能的日趨成熟，是永無止境的。

業內人士透露，數據標注是一個簡單又困難的事情。簡單之處在于，確定了篩選規則以后，操作人員只需依規操作即可，沒有執行上的難度，而困難之處在于，數據標注本質上是要獲得更準確，更精細化的數據結果，高質量的數據是業內急需的。

“在數據采集上，由原來的普通行車記錄儀的數據采集，到現在已有諸多公司開始使用特殊采集設備采集行車數據。在數據標注上，原來的2D標注到3D標注，再到語義分割，3D點云的標注需求，對數據的要求越來越專業”，龍貓數據CEO昝智表示，“我們也正不斷開發新的標注工具，適配自動駕駛行業的發展。”

昝智表示，未來至少10年內，各領域對AI數據的獲取需求只增不減。在發展的不同階段，龍貓數據也將不斷關注技術更新，適配新的需求。

而在在行業內特斯拉是第一家規模化采集數據的汽車制造商，他們很早就用自己的車輛來收集數據，為無人駕駛技術研發提供基礎數據。

由于沒有獲取車輛數據源的通道，目前有很多汽車廠商都在模仿特斯拉的做法，通過在自己公司生產的車輛上安裝采集設備，獲取車輛數據并回傳到平臺，這是一種最直接的方式，也是相對比較明智的做法。

目前，全球主流的自動駕駛測試數據集包括Cityscapes、Imagenet（ILSVRC）、COCO、PASCAL VOC、CIFAR、MNIST、KITTI、LFW等。

Cityscapes

Cityscapes是由奔馳與2015年推出的，提供無人駕駛環境下的圖像分割數據集。用于評估視覺算法在城區場景語義理解方面的性能。

Cityscapes包含50個城市不同場景、不同背景、不同季節的街景，提供5000張精細標注的圖像、20000張粗略標注的圖像、30類標注物體。用PASCAL VOC標準的 intersection-over-union（IoU）得分來對算法性能進行評價。

Cityscapes是目前公認的自動駕駛領域內最具權威性和專業性的圖像語義分割評測集之一，其關注真實場景下的城區道路環境理解，任務難度更高且更貼近于自動駕駛等熱門需求。

KITTI

KITTI是由德國卡爾斯魯厄理工學院和豐田芝加哥技術研究院于2012年聯合創辦，是目前國際上最大的自動駕駛場景下的計算機視覺算法評測數據集。

KITTI用于評測3D目標（機動車、非機動車、行人等）檢測、3D 目標跟蹤、道路分割等計算機視覺技術在車載環境下的性能。

KITTI包含市區、鄉村和高速公路等場景采集的真實圖像數據，每張圖像中多達15輛車和30個行人，還有各種程度的遮擋。

ILSVRC

ILSVRC也就是通常所說的Imagenet數據集，是美國斯坦福的計算機科學家李飛飛模擬人類的識別系統建立的。

它是目前深度學習圖像領域應用較多的一個數據集，關于圖像分類、定位、檢測等研究工作大多基于此數據集展開。Imagenet數據集有1400多萬幅圖片，涵蓋2萬多個類別；其中有超過百萬的圖片有明確的類別標注和圖像中物體位置的標注。

COCO

COCO（common objects Dataset）數據集，它由微軟贊助，除了基本的圖像的標注信息外，還有對圖像的語義文本描述，COCO數據集的特點是開源，這使得它在近三來在圖像分割語義理解領域取得了巨大的進展，Google的開源show and tell生成模型就是在此數據集上測試的。

PASCAL VOC

PASCAL VOC是視覺對象的分類識別和檢測的一個基準測試，提供了檢測算法和學習性能的標準圖像注釋數據集和標準的評估系統。

雖然它在2012年后便不再舉辦，但其數據集圖像質量好，標注完備，非常適合用來測試算法性能。

CIFAR

CIFAR（Can ada Institude For Advanced Research）包括CIFAR 10和CIFAR 100兩個數據集，它們被標記為8000萬個微型圖像數據集的子集。

這些數據集是由Vinod Nair、Alex Krizhevsky和Geoffrey Hinton收集的。CIFAR對于圖像分類算法測試來說是一個非常不錯的中小規模數據集。

MNIST

MNIST（THE MNIST DATABASE of handwritten digits）號稱深度學習領域的“Hello World!”，是一個手寫的數字數據集。當前主流深度學習框架幾乎無一例外將MNIST數據集的處理作為介紹及入門第一教程。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

機器學習

機器學習

+關注

關注
66

文章
8423

瀏覽量
132750
數據集

數據集

+關注

關注
4

文章
1208

瀏覽量
24727
自動駕駛

自動駕駛

+關注

關注
784

文章
13844

瀏覽量
166571

原文標題：自動駕駛數據集也是一門好生意 | GGAI產品

文章出處：【微信號：ilove-ev，微信公眾號：高工智能汽車】歡迎添加關注！文章轉載請注明出處。

從《自動駕駛地圖數據規范》聊高精地圖在自動駕駛中的重要性

自動駕駛地圖作為L3級及以上自動駕駛技術的核心基礎設施，其重要性隨著智能駕駛技術的發展愈發顯著。《自動駕駛地圖數據規范》（DB11/T 20

發表于 01-05 19:24 ?504次閱讀

從《<b class='flag-5'>自動駕駛</b>地圖<b class='flag-5'>數據</b>規范》聊高精地圖在<b class='flag-5'>自動駕駛</b>中的重要性

標貝科技：自動駕駛中的數據標注類別分享

自動駕駛訓練模型的成熟和穩定離不開感知技術的成熟和穩定，訓練自動駕駛感知模型需要使用大量準確真實的數據。據英特爾計算，L3+級自動駕駛每輛汽車每天產生的

發表于 11-22 15:07 ?914次閱讀

標貝科技：<b class='flag-5'>自動駕駛</b>中的<b class='flag-5'>數據</b>標注類別分享

標貝科技：自動駕駛中的數據標注類別分享

發表于 11-22 14:58 ?600次閱讀

自動駕駛汽車安全嗎？

隨著未來汽車變得更加互聯，汽車逐漸變得更加依賴技術，并且逐漸變得更加自動化——最終實現自動駕駛，了解自動駕駛汽車的安全問題變得非常重要，這樣你才能回答“自動駕駛汽車安全嗎”和“

發表于 10-29 13:42 ?541次閱讀

自動駕駛HiL測試方案案例分析--ADS HiL測試系統#ADAS #自動駕駛 #VTHiL

自動駕駛

北匯信息POLELINK

發布于 :2024年10月22日 15:20:19

Autobrains推出自動駕駛定位技術

近日，人工智能汽車解決方案提供商Autobrains宣布推出其最新創新——自動駕駛定位技術Air2Road。

發表于 10-17 16:45 ?502次閱讀

FPGA在自動駕駛領域有哪些優勢?

領域的主要優勢：高性能與并行處理能力： FPGA內部包含大量的邏輯門和可配置的連接，能夠同時處理多個數據流和計算任務。這種并行處理能力使得FPGA在處理自動駕駛中復雜的圖像識別、傳感器數據處理等

發表于 07-29 17:11

FPGA在自動駕駛領域有哪些應用？

的數據處理和預處理，實現實時計算和反饋。二、數據傳輸與處理FPGA在自動駕駛中扮演著數據傳輸和處理的角色。它能夠支持多種傳感器（如激光雷達、攝像頭、GPS等）的

發表于 07-29 17:09

雷諾集團攜手文遠知行推出自動駕駛小巴載人服務

雷諾集團近日宣布與自動駕駛領軍企業文遠知行（WeRide）達成深度合作，計劃大規模商業化部署L4級自動駕駛技術，并推出自動駕駛小巴載人服務。據悉，雷諾集團是文遠知行的重要戰略投資人。

發表于 05-16 09:36 ?400次閱讀

未來已來，多傳感器融合感知是自動駕駛破局的關鍵

的Robotaxi運營。這標志著L4級自動駕駛迎來了新的里程碑，朝著商業化落地邁進了一大步。中國的車企也不甘落后：4月7日，廣汽埃安與滴滴自動駕駛宣布合資公司——廣州安滴科技有限公司獲批工商執照。廣汽埃安

發表于 04-11 10:26

滴滴自動駕駛與廣汽埃安聯手推出L4自動駕駛量產車型

安滴科技總部設在廣州黃浦區，滴滴自動駕駛和廣汽埃安各持有該公司50%股權。張雄先生出任董事長，孟醒先生則是總經理。這家新的公司旨在充分利用雙方資源，融合生產新能源汽車的豐富經驗以及高級研究中心的自動駕駛技術

發表于 04-07 16:36 ?579次閱讀

文遠知行與聯想車計算戰略合作，推進自動駕駛商業化落地

文遠知行與聯想車計算達成戰略合作，共同推進L4級別自動駕駛解決方案的商業化落地，這一舉措無疑為自動駕駛領域注入了新的活力。這次合作不僅彰顯了雙方在自動駕駛技術方面的深厚積累，也預示著

發表于 03-20 10:19 ?539次閱讀

自動駕駛數據集的生成模型之WoVoGen框架原理

生成多攝像頭的街景視頻對于增加自動駕駛數據集至關重要，解決了對廣泛而多樣的數據的迫切需求。由于多樣性的限制和處理光照條件的挑戰，傳統的基于渲染的方法越來越多的被基于擴散的方法所取代。

發表于 01-25 15:26 ?601次閱讀

<b class='flag-5'>自動駕駛</b><b class='flag-5'>數據</b><b class='flag-5'>集</b>的生成模型之WoVoGen框架原理

自動駕駛領域的數據集匯總

發自動駕駛論文哪少的了數據集，今天筆者將為大家推薦一篇最新的綜述，總結了200多個自動駕駛領域的數據集

發表于 01-19 10:48 ?1018次閱讀

萬集激光基于車路協同的自動駕駛方案亮相

如何同時兼顧安全與成本？是自動駕駛的一大難題。萬集獨創基于C-V2X的車路協同自動駕駛解決方案給出了自己的答案。通過將道路的實時交通信息應用進來，可以降低單車智能對于過多傳感器的依賴和過多數據

發表于 01-15 11:37 ?1056次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

數據集衍生出自動駕駛行業新的商業模式

評論

從《自動駕駛地圖數據規范》聊高精地圖在自動駕駛中的重要性

標貝科技：自動駕駛中的數據標注類別分享

標貝科技：自動駕駛中的數據標注類別分享

自動駕駛汽車安全嗎？

自動駕駛HiL測試方案案例分析--ADS HiL測試系統#ADAS #自動駕駛 #VTHiL

Autobrains推出自動駕駛定位技術

FPGA在自動駕駛領域有哪些優勢?

FPGA在自動駕駛領域有哪些應用？

雷諾集團攜手文遠知行推出自動駕駛小巴載人服務

未來已來，多傳感器融合感知是自動駕駛破局的關鍵

滴滴自動駕駛與廣汽埃安聯手推出L4自動駕駛量產車型

文遠知行與聯想車計算戰略合作，推進自動駕駛商業化落地

自動駕駛數據集的生成模型之WoVoGen框架原理

自動駕駛領域的數據集匯總

萬集激光基于車路協同的自動駕駛方案亮相