怎样写网络小说,小说阅读网站,盗墓笔记小说全集

給定目標硬件，如何確定最優的速度-精度折衷邊界？換言之：給定推斷延時的限制，模型能達到的最高精度是多少？給定精度要求，模型所需的最短延時是多少？

回顧馭勢聯合新加坡國立大學推出東風網絡的理解

為此，馭勢科技 AI研究院聯合新加坡國立大學提出了偏序關系剪枝（Partial Order Pruning）方法，直接考慮模型在目標硬件上的延時，利用偏序關系假設對搜索空間進行剪枝，平衡模型的寬度與深度，以提高速度-精度折衷的邊界。應用該方法所得的東風（DF）骨干網絡，取得了目標硬件（TX2）上的最優速度-精度折衷。應用該方法于語義分割網絡Decoder的結構搜索，所得的東風分割網絡（DF-Seg）也取得了TX2/1080Ti上最優的速度-精度折衷。

在實際運用當中，具備多重實用價值，主要體現在以下幾個方面：

（一）DF/DF-Seg網絡的實用價值

（1）DF網絡取得了目標硬件（TX2）上最優的速度-精度折衷。

回顧馭勢聯合新加坡國立大學推出東風網絡的理解

（2）DF網絡節約顯存。以DF2A網絡為例，其精度介于ResNet50/101之間，而僅需1/3至1/2的顯存（以BVLC Caffe測試）。

回顧馭勢聯合新加坡國立大學推出東風網絡的理解

（3）DF網絡結構簡單，僅使用基本的殘差模塊，相當于更“精耕細作”的ResNet。

回顧馭勢聯合新加坡國立大學推出東風網絡的理解

（4）DF-Seg網絡是TX2/1080Ti/Titan X(Maxwell)上速度-精度折衷最好的分割網絡。

回顧馭勢聯合新加坡國立大學推出東風網絡的理解

省時間、省顯存、結構簡單，使得DF/DF-Seg網絡有助于在嵌入式設備TX2上部署高精度、低延時、多路圖像并行處理的CNN模型；有助于高端GPU上的視頻處理、大規模圖像數據處理等任務的部署；有助于科研人員，尤其是計算資源不足的科研人員，節省計算資源，實現更復雜的算法。

（二）偏序關系剪枝算法的實用價值

DF網絡更適合GPU平臺，我們也利用偏序關系剪枝算法，在驍龍845 CPU平臺上進行了骨干網絡結構與分割網絡Decoder結構的搜索，所得語義分割網絡得到了目前CPU平臺上最好速度-精度折衷。

回顧馭勢聯合新加坡國立大學推出東風網絡的理解

以下為該論文內容翻譯：

一、偏序關系剪枝算法

（一）搜索空間設計與模型結構編碼

回顧馭勢聯合新加坡國立大學推出東風網絡的理解

圖2(a)為本文的模型搜索空間，圖2(b)為本文使用的殘差模塊結構。網絡由6個Stage構成，Stage1~5均通過設步長為2降低輸入特征的分辨率，Stage6通過全局池化與全連接層產生分類結果。本文的模型搜索不搜索基本模塊的結構，而是在基本殘差模塊的基礎上，對網絡整體的寬度與深度進行平衡。在Stage3~5，模型分別包含L/M/N個殘差模塊，Stage s中的第i個殘差模塊的寬度記為，因此本文將一個結構表示為：

回顧馭勢聯合新加坡國立大學推出東風網絡的理解

（二）模型延時估計與子搜索空間

圖2(a)所表達的搜索空間記為s，實踐中我們僅關心延時在中的子集，即。為估計各網絡的延時，我們使用TensorRT提供的性能分析工具，在目標硬件TX2上，測量了不同的殘差模塊所需的延時，并建立一個查找表

回顧馭勢聯合新加坡國立大學推出東風網絡的理解

。這里，分別是輸入輸出特征的通道數，而

回顧馭勢聯合新加坡國立大學推出東風網絡的理解

是相應的空間尺寸。利用該查找表將各殘差模塊延時進行加和記為對一個網絡延時的估計。在圖3(a)中，我們對若干網絡的估計延時與實際延時進行了比較，可見估計延時與實際延時基本一致。

回顧馭勢聯合新加坡國立大學推出東風網絡的理解

（三）偏序關系假設

我們借用集合論中的偏序（Partial Order）關系來描述模型結構之間的聯系：集合中的元素為不同的模型結構（見圖2（a）），集合中的二元關系定義為：若x比y更淺且更窄，則稱x是y的前序，記為。如此，整個搜索空間中的模型結構就滿足了嚴格偏序關系，包括反自反性、反對稱行、傳遞性。圖4給出了若干模型結構間偏序關系的示意圖。偏序關系假設為：若x是y的前序（意味著x比y更淺且更窄），則x的速度更快，精度更低。這可以寫為：

回顧馭勢聯合新加坡國立大學推出東風網絡的理解

在圖3(b)中，我們基于已訓練的模型，對偏序關系假設的合理性進行了驗證，其中，

回顧馭勢聯合新加坡國立大學推出東風網絡的理解

，

回顧馭勢聯合新加坡國立大學推出東風網絡的理解

。可見，在本實驗所關心的模型子空間中，偏序關系假設是合理的。

（四）偏序關系剪枝

基于偏序關系假設，我們可以在模型搜索中對搜索空間進行剪枝。圖5是該剪枝過程的一個示意圖。集合為已訓練的模型結構，集合中的模型代表了當前迭代中所能達到的最優速度-精度折衷邊界。對于一個非邊界模型

回顧馭勢聯合新加坡國立大學推出東風網絡的理解

，其任意前序模型

回顧馭勢聯合新加坡國立大學推出東風網絡的理解

，應有：

回顧馭勢聯合新加坡國立大學推出東風網絡的理解

而我們已有速度-精度折衷更好的邊界點：

回顧馭勢聯合新加坡國立大學推出東風網絡的理解

因此w的部分前序元素，延時將比高，而精度將比低，也即處于圖5的陰影部分。這些中的模型結構無法提供更好的速度-精度折衷，可以據此對搜索空間進行剪枝：。如此反復迭代，在迭代中不斷對搜索空間進行剪枝，直至速度-精度折衷的邊界趨于穩定，如算法1所描述。

回顧馭勢聯合新加坡國立大學推出東風網絡的理解

（五）語義分割網絡的Decoder設計

本文中語義分割網絡的結構設計如圖6所示，在Stage 5中加入了pyramid pooling module，使用圖6(b)所示的Fusion node融合不同分辨率的特征，其中Channel Controller(CC)為1x1卷積，用以控制Decoder在不同分辨率下的寬度。不同的，構成了不同復雜度的Decoder結構。這些Decoder結構之間也存在著偏序關系假設，因此也可以使用偏序關系剪枝算法對搜索空間進行剪枝。

回顧馭勢聯合新加坡國立大學推出東風網絡的理解

二、實驗數據

（一）TX2上的骨干網絡搜索

我們在TX2上進行骨干網絡的搜索，最終選取3個最有代表性的網絡，記為3個東風（DF）骨干網絡。如圖7與表1所示，DF網絡取得了TX2上最好的速度-精度折衷。

DF1網絡FLOPs明顯高于MobileNet于ShuffleNet等，但在TX2上實際延時更低。這是因為FLOPs作為間接指標，僅考慮了浮點計算量而沒有考慮內存訪問的延時。以ShuffleNetV2與DF1為例，其內存訪問代價（也即中間層的特征），分別為4.9M與2.9M。

NASNet與PNASNet在網絡結構搜索中均未考慮模型延時，所得模型結構復雜，內存訪問量大，實際延時較高。有一些同期工作（ProxylessNAS/FBNet）也在模型搜索中考慮了模型延時，DF網絡在速度-精度折衷上也優于這些模型。這是因為：一、這些模型未針對TX2平臺進行模型搜索；二、這些網絡均基于MobileNetV2的inverted bottleneck模塊，相比本文使用的殘差模塊，內存訪問量更高。

回顧馭勢聯合新加坡國立大學推出東風網絡的理解

（二）TX2/1080Ti上的Decoder網絡結構搜索

基于TX2上搜索的東風骨干網絡，我們也在TX2/1080Ti上分別進行了Decoder結構搜索。如表3所示，東風分割網絡（DF-Seg）是目前1080Ti上速度-精度折衷最好的語義分割網絡。DF-Seg網絡的速度（FPS）與精度（mIoU）均在1024x2048的分辨率下，使用TensorRT提供的性能分析工具在1080Ti上進行測試。為與ICNet公平對比，在FPS(Caffe)欄中使用“Caffe Time”工具，在Titan X(Maxwell)上進行速度測試。表4與表5分別為Titan X(Maxwell)/TX2上的速度測試，DF-Seg的速度大幅優于現有結果，能夠在TX2上實現對720P分辨率圖像的30FPS的語義分割。

回顧馭勢聯合新加坡國立大學推出東風網絡的理解

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

算法

算法

+關注

關注
23

文章
4625

瀏覽量
93124
網絡

網絡

+關注

關注
14

文章
7589

瀏覽量
89026
結構

結構

+關注

關注
1

文章
117

瀏覽量
21615

新加坡云服務器網絡中斷的常見原因有哪些

新加坡云服務器網絡中斷的常見原因包括以下幾方面：硬件故障，網絡設備故障：數據中心內部的路由器、交換機等網絡設備出現故障，會導致云服務器無法正常連接

發表于 01-13 17:03 ?74次閱讀

清華大學深圳國際研究生院、新加坡國立大學：研發新型的超材料生物傳感器件最新設計制備

研究背景隨著交通運輸的快速發展和汽車數量的激增，交通安全問題日益受到關注。根據統計數據，人類因素如嗜睡、疲勞等每年導致美國約10萬起交通事故，嚴重影響了公眾的生命安全和社會穩定。因此，研究如何提高駕駛安全性，尤其是通過監測駕駛員的生理狀態，成為了一個重要的研究領域。在這一背景下，生物傳感器技術作為一種新興的監測手段，引起了科學家的廣泛關注。生物傳感器是能夠檢測生物標志物并提供實時反饋的設備，主要用于監

發表于 01-02 18:14 ?208次閱讀

東風日產與Momenta合作推出高階智駕方案

日前，東風日產官宣攜手全球領先的自動駕駛公司Momenta，聯合打造基于端到端智駕大模型的行業領先高階智駕方案。東風日產與Momenta的合作，是東風日產智能化轉型的關鍵一步，標志其正

發表于 11-22 16:56 ?625次閱讀

從新加坡到深圳：南洋理工大學（NTU）與VoiceAI的深度對話

近日，來自新加坡南洋理工大學的數十名師生到訪聲揚科技深圳總部，與聲揚科技“硬核科研團”展開深度交流。公司聯合創始人、總經理張偉彬博士出席交流會，與新加坡南洋理工

發表于 11-13 14:29 ?423次閱讀

【廈門同昌源】受邀參加中國-新加坡健康電子先進材料雙邊論壇（S3AM-2024）

（IMRE）執行院長羅賢俊院士、廈門大學柔性電子（未來技術）研究院（廈大IFE）常務副院長霍峰蔚教授、新加坡國立大學劉小鋼院士擔任大會主席。廈門同昌源電子受邀參加本次

發表于 11-12 01:06 ?342次閱讀

Commvault與Pure Storage聯合推出網絡就緒解決方案

混合云網絡彈性和數據保護解決方案的領先提供商Commvault（納斯達克代碼：CVLT）宣布與Pure Storage聯合推出一項網絡就緒解決方案。該解決方案能夠在幫助企業遵守不斷變化的嚴格法規方面發揮關鍵作用。

發表于 10-15 09:16 ?513次閱讀

比亞迪騰勢D9登陸新加坡,正式進軍右舵國家市場

10月11日最新消息，比亞迪騰勢汽車于昨日在新加坡市場正式亮相，標志著其正式進軍右舵駕駛國家。　　昨日，右舵版騰勢D9在新加坡正式發布，其售價區間為296，888新元至341，

發表于 10-11 17:07 ?954次閱讀

中科馭數受邀出席中國科學院大學校友論壇

近日，第五屆中國科學院大學校友創新論壇正式舉行，本次論壇聚焦科技前沿領域，旨在搭建高端對話平臺，促進產學研深度融合。在大算力時代——AI技術前沿沙龍上，中科馭數高級副總裁、CTO盧文巖博士受邀

發表于 09-29 09:45 ?345次閱讀

中科馭數分析DPU在云原生網絡與智算網絡中的實際應用

CCF Chip 2024，精彩不能停！7月21日下午，中科馭數在第二屆中國計算機學會（CCF）芯片大會的“馭數專屬時刻”仍在繼續，馭數組織承辦“DPU技術趨勢和應用——DPU在云原生與智算網

發表于 08-02 11:21 ?740次閱讀

同星智能贊北京理工大學東風日產方程式賽車隊（BITFSAE）

BITFSAE東風日產方程式賽車隊北京理工大學東風日產方程式賽車隊（BITFSAE）成立于2009年，是一支由賽車技術興趣愛好者及汽車相關專業人才組成的學生科技創新隊伍，連續13年參加中國汽車

發表于 06-18 08:21 ?414次閱讀

卓馭科技與高通推出成行平臺全新智能駕駛解決方案

深圳市卓馭科技（卓馭科技）與高通技術公司宣布深化技術合作，共同推動汽車行業的智能駕駛技術革新。此次合作，雙方利用Snapdragon Ride平臺，推出了全新的智能駕駛產品。

發表于 05-06 14:26 ?721次閱讀

新加坡國立大學醫院將于2025年上半年啟用AI消化系統健康中心

新中心將配置計算機輔助檢測、診斷及質量控制三大AI系統。據介紹，這三套系統協同工作，有望更有效地識別早期胃腸病變，并實現對這些病變的實時量化評分癌癥診斷。

發表于 05-06 14:13 ?539次閱讀

Living Well Digitally：由新加坡國立大學可信互聯網和社區中心發起并由 DQ 提供支持的全球倡議

新加坡2024年4月20日 /美通社/ -- 2024年4月17日，新加坡國立大學?(NUS) 可信互聯網與社區中心?(CTIC) 啟動了一項開創性的新計劃，"Living Well

發表于 04-21 23:12 ?374次閱讀

在CPU芯片領域，中國將迎來新型服務器的發展機遇，

? 傳感新品【新加坡國立大學: 開發多功能超寬帶、多波長壓縮成像傳感器】為了尋求一種能夠適應多種波長同時保持高分辨率的一體化成像傳感器，新加坡國立大學劉小鋼教授團隊提出了一種普適性

發表于 03-21 17:23 ?571次閱讀

數勢聯動百川，發布首批大模型聯合解決方案，推動中國大模型價值落地

近日，行業領先的數據智能產品提供商北京數勢云創科技有限公司（以下簡稱“數勢科技”）和國內通用大模型廠商北京百川智能科技有限公司（以下簡稱“百川”）聯合發布大模型數據分析垂直領域應用解決方案。本次發布

發表于 02-28 11:40 ?502次閱讀