在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

算法資源波動比肩過山車?

sanyue7758 ? 來源:速石科技 ? 2023-02-24 11:47 ? 次閱讀

第三集:算法仿真

算法是芯片系統(tǒng)進行的整體戰(zhàn)略規(guī)劃,決定了芯片各個模塊功能定義及實現(xiàn)方式,指引著整個芯片設(shè)計的目標(biāo)和方向。可謂,牽一發(fā)而動全身。

不管是模擬IC還是數(shù)字IC設(shè)計,算法仿真都是一步。通常,會由算法工程師組成獨立的算法團隊。

df522438-b351-11ed-bfe3-dac502259ad0.png

CPU/GPU本應(yīng)該是算法仿真的???,但因為歷史比較悠久,發(fā)展成熟,市場幾乎被英偉達AMD壟斷,很多IC設(shè)計公司選擇直接采購IP的方式跳過這一步。

近幾年,無線通信芯片成為了算法業(yè)務(wù)的最大甲方。因為這類芯片的信號編解碼與頻譜遷移時方式十分復(fù)雜,再加上種類繁多,各國的通信協(xié)議、標(biāo)準(zhǔn)、頻率也在不斷變化。隨著我國5G通信標(biāo)準(zhǔn)的放開,算法仿真的地位與日俱進。

另一個涉及大量算法業(yè)務(wù)的場景是AI芯片,應(yīng)用場景小到手機智能家電,大至汽車。

跟前兩篇數(shù)字和模擬IC的設(shè)計場景相比,算法仿真有著非常不一樣的表現(xiàn)。

所以我們單獨把ta拉出來,結(jié)合一家無線通信芯片公司實際業(yè)務(wù)場景,看看算法仿真有哪四大特性,以及從動態(tài)視角出發(fā),看我們怎么算法工程師解決問題,提高研發(fā)效率。

算法仿真的本質(zhì)

算法(Algorithm),是指在數(shù)學(xué)和計算機科學(xué)間,一種被定義好的、計算機可施行指示的步驟和次序。算法代表著用系統(tǒng)的方法描述解決問題的策略機制,解決一個問題可以有很多種算法。

舉個栗子。

求解下圖黃色區(qū)域圖形面積,我們有三種算法。

df9b9e06-b351-11ed-bfe3-dac502259ad0.png

方法一:你可以直接用三角形的面積公式解。這種方法快速、直觀,小學(xué)文化程度即可,但局限性也高、不通用,不適用于圖像復(fù)雜的情況;

方法二:也可以用符號計算求不定積分。求解析解方法,適用于各類不定積分中有解析表達式的函數(shù)圖像。計算門檻較高,大多手算,很少有計算工具。而且實際工程應(yīng)用場景中,很多函數(shù)沒有解析解;

方法三:用數(shù)值計算方式解積分,求數(shù)值解。數(shù)值計算法適用范圍最廣,可以求任意函數(shù)曲線的定積分,將函數(shù)一段段分解,再算出面積。不同的分解方法就代表不同的算法。這種方法只能求數(shù)值解,無法求解析解,且計算量巨大適合機器計算,不適合人工計算,在工程領(lǐng)域應(yīng)用甚廣。

e07cb38c-b351-11ed-bfe3-dac502259ad0.png

在芯片設(shè)計領(lǐng)域,算法仿真的本質(zhì)是評估不同數(shù)值計算解法的工作量、計算效率適用范圍,選出最優(yōu)算法,使ta不僅要滿足算得最快、最準(zhǔn),還要能確保功能、精度、效率、吞吐量等指標(biāo)

算法仿真是一個不斷迭代、優(yōu)化的過程,一般都要反復(fù)調(diào)整參數(shù),進行N次回歸測試。

一家算法團隊的小目標(biāo)

一家線通信芯片公司算法團隊,開局情況如下:

算法部門共有15人,全公司有480核共享本地資源,各部門按需提前申請使用。

根據(jù)公司的業(yè)務(wù)發(fā)展目標(biāo),大致估算出未來新算法項目任務(wù)總數(shù)為1283980。

假設(shè)一:全公司本地資源均歸他們用,每個人的資源上限是32核;

假設(shè)二:單case運行時間為10小時;

假設(shè)三:回歸測試次數(shù)為1次;

假設(shè)四:1個case只有1個job,且只用1個核。

e0948e94-b351-11ed-bfe3-dac502259ad0.png

總運行時間達到3.05年。 啊這。。可能打開方式不對,再來:增加假設(shè)五:人均資源上限逐漸提升到120核;

假設(shè)六:算法團隊人數(shù)逐步擴張至46人;

e0af5fe4-b351-11ed-bfe3-dac502259ad0.png

總運行時間約96.92天。

嗯,這回挺好。

想得是挺美,小目標(biāo)怎么實現(xiàn)?

現(xiàn)實一:公司共享本地資源不可能只歸算法部門專用;

現(xiàn)實二:單case運行時間,難以估計;且1個case往往不止1個job,且1個job未必只用1個核;

現(xiàn)實三:回歸測試只有1次,幾乎不太可能,總?cè)蝿?wù)數(shù)可能數(shù)倍增長;

現(xiàn)實四:本地機房從480核要擴張十幾倍,可不止是買買買硬件,機房建設(shè)、運維人力、硬件維保、存儲網(wǎng)絡(luò)、環(huán)境部署等等,都不是小事;

現(xiàn)實五:算法工程師要求非常高,招聘難度極大。

真是,沒一個字讓人愛聽的。

如果是日常模擬/數(shù)字芯片設(shè)計,想做算力規(guī)劃,咱們還是有思路的,可以看看這篇:解密一顆芯片設(shè)計的全生命周期算力需求

但算法仿真這里,此路不通。

我們來看看算法仿真的特性:

算法仿真的四大特性

下圖是這家無線通信芯片公司算法團隊9個月實際日平均資源用量波動總覽圖:

e117d48e-b351-11ed-bfe3-dac502259ad0.png

01

需求不可測

從個人角度出發(fā),算法團隊每個人的算法任務(wù)都是互相獨立,互不影響的。算法確定之后,每一輪的計算量基本確定(case分解成的job數(shù),job占用的核數(shù)基本確定),每個算法任務(wù)的單次耗時與回歸測試次數(shù)都是不一樣的,這導(dǎo)致最后的資源需求完全不可測。

如果再疊加團隊使用因素,資源的不可測性也會被成倍地放大。如果原先個人的資源使用區(qū)間是0到250核小時;如果團隊內(nèi)有20人,那不可測區(qū)間就放大至0至5000核小時。

02

短時間使用量波動巨大

除了算法任務(wù)需求的不可測性,資源使用量的波動還受實際算法任務(wù)的進度影響。

每個算法工程師的工作獨立且進度不一,有時可能大量任務(wù)同時批量運行,也可能部分在調(diào)試,部分在運行,甚至可能一個在運行的任務(wù)都沒有。

不同工程師的工作進度差異與所用算法不一,不僅導(dǎo)致了波峰、波谷間的資源使用量差距極大,而且這樣的波動可能發(fā)生在極短時間內(nèi)。

極限情況:所有工程師都在頂格跑任務(wù),5520核的資源量瞬間拉滿(100%);而下一刻只有10%的工程師在跑任務(wù),且每人都只使用自己配額80%的資源量,那總資源僅使用了一部分。

不同公司的算法團隊之間,因為團隊規(guī)模與業(yè)務(wù)差異,資源用量差異也非常大。

03

資源需求類型多樣

算法仿真整體來說,對資源的各方面需求并不算高。

但不同算法的需求都不一樣:

有的需要單核4G內(nèi)存的機型,有的要單核8G內(nèi)存的機型;

有的算法對存儲要求高,有的算法對存儲沒要求:

有的涉及圖形計算,甚至還需要用到GPU機型。

04

長期可持續(xù)狀態(tài)

上述三大特性,都不是突發(fā)現(xiàn)象,屬于算法團隊的日常工作狀態(tài)。

這一狀態(tài)的長期可持續(xù)性,我們需要對此做好足夠的準(zhǔn)備。

一種動態(tài)思路:增加時間維度

算法仿真的四大特性決定了:按這家公司原來的靜態(tài)處理方式,也就是把任務(wù)量當(dāng)成恒定的,通過加人加機器的方式來滿足研發(fā)需求,變得很不現(xiàn)實。哪怕頂格準(zhǔn)備資源,資源利用率也會長期處于較低狀態(tài)。

那按動態(tài)處理方式,也就是隨著時間變化,靈活根據(jù)需求匹配不同規(guī)模/類型資源的方式來動態(tài)滿足研發(fā)需求,從個人及團隊視角出發(fā),看我們怎么算法工程師解決問題,提高研發(fā)效率

01

算法工程師視角

1)資源無需申請,即開即用

再也不用跟同事?lián)屬Y源或者漫長的排隊等待了,也不用走繁瑣的資源申請流程。

2)資源選擇空間變大

選擇空間變大,資源類型變多,可用資源上限變高,可以靈活選擇更加適配算法任務(wù)的資源類型。

給大家打個樣:5000核大規(guī)模OPC上云,效率提升53倍

3)提交任務(wù)立馬就能跑,告別等待

提交任務(wù)立馬就能跑,一整套研發(fā)環(huán)境現(xiàn)成的,即開即用。靈活切換,今天跑一百,明天跑一萬,無需等待環(huán)境配置。

4)以前怎么用,現(xiàn)在就怎么用

跟本地相比無感知,用戶使用習(xí)慣沒有任何改變,不需要調(diào)整任何腳本。

5)任務(wù)跑得快,效率線性增長

多case高并發(fā)執(zhí)行。同一批算法任務(wù)之間互相獨立,可以做到效率線性提升。

02

團隊管理視角

1)動態(tài)方式解決資源不可測問題

算法任務(wù)的不可預(yù)測且波動巨大,導(dǎo)致了資源預(yù)測與規(guī)劃基本不可能。按傳統(tǒng)靜態(tài)處理方式來解決問題:

按頂格規(guī)劃,這筆賬都不用算,會造成黃色區(qū)域的巨大浪費;按中間取值準(zhǔn)備,當(dāng)某個時間點算法仿真短時間內(nèi)任務(wù)量激增,就會出現(xiàn)人機不匹配,不是有人力沒機器,就是有機器沒人力。這種錯配導(dǎo)致資源利用率極低,影響研發(fā)進度。

e12ce022-b351-11ed-bfe3-dac502259ad0.png

圖中3-5月,峰值算力就從200核攀升27倍達到5520核,隨即又迅速從5520核下跌到500核左右,這波動幅度簡直比過山車還劇烈,而且毫無規(guī)律。

我們的動態(tài)處理方式,會隨著時間變化,靈活根據(jù)當(dāng)前時間點任務(wù)需求匹配不同規(guī)模/類型資源的方式,動態(tài)滿足研發(fā)需求。不管500核還是5000核,我們都能實時根據(jù)需要,滿足整個團隊的大幅波動資源需求,保障日常算力和峰值算力任務(wù)調(diào)度效率。

2)Auto-Scale自動伸縮,隨用隨關(guān)不浪費

Fsched調(diào)度器的Auto-Scale功能,能解決團隊資源利用率與成本問題。

資源“自由”的同時不浪費。

一方面隨用戶任務(wù)需求,設(shè)置自動伸縮上下限,自動化調(diào)用資源完成任務(wù);Auto-Scale功能可以根據(jù)任務(wù)運算情況動態(tài)開啟云端資源,需要多少開多少,并在任務(wù)完成后自動關(guān)閉,讓資源的使用緊隨著用戶的需求自動擴張及縮小,最大程度匹配任務(wù)需求。

e1814810-b351-11ed-bfe3-dac502259ad0.png

這既節(jié)約了用戶成本,不需要時刻保持開機,也最大限度保證了任務(wù)最大效率運行。中間也不需要用戶干預(yù),手動操作。

另一方面我們還能監(jiān)控用戶提交的任務(wù)數(shù)量和資源需求,在團隊內(nèi)部進行資源及時適配,解決錯配問題。


如何大幅提升Virtuoso仿真效率?

3)提升團隊整體運營效率

我們的運營數(shù)據(jù)dashboard能讓團隊管理者監(jiān)控各個重要指標(biāo)變化,從全局角度掌握項目的整體任務(wù)及資源情況,為未來項目合理規(guī)劃、集群生命周期管理、成本優(yōu)化提供支持。還能根據(jù)不同成員或小組的業(yè)務(wù)緊迫程度和業(yè)務(wù)重要性,合理分配與控制用戶使用資源。

4)全球數(shù)據(jù)中心解決資源瓶頸

我們的全球數(shù)據(jù)中心,能持續(xù)穩(wěn)定地提供用戶所需資源類型及數(shù)量,分鐘級調(diào)度開啟上萬核計算資源,滿足業(yè)務(wù)緊迫度。用戶可以選擇自主選擇大內(nèi)存、高主頻等多樣化的資源類型來滿足不同算法需求。

一旦發(fā)現(xiàn)所選資源類型與算法任務(wù)不匹配,還可隨時中止任務(wù)、更換資源類型,任務(wù)進度不受影響。

e19695d0-b351-11ed-bfe3-dac502259ad0.jpg ?





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模擬IC
    +關(guān)注

    關(guān)注

    8

    文章

    172

    瀏覽量

    29405
  • EDA工具
    +關(guān)注

    關(guān)注

    4

    文章

    268

    瀏覽量

    31855
  • 數(shù)字IC
    +關(guān)注

    關(guān)注

    1

    文章

    38

    瀏覽量

    12598
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1898

    瀏覽量

    35122

原文標(biāo)題:算法資源波動比肩過山車?那一定是你的打開方式不對

文章出處:【微信號:處芯積律,微信公眾號:處芯積律】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    請問關(guān)于SigmaStudio的算法資源主要有哪些?

    最近才開始接觸SigmaStudio和SigmaDSP,SigmaStudio的算法資源據(jù)說是很大的優(yōu)勢,這個我個人覺得是很重要的,沒有多少人愿意自己去開發(fā)這些算法,請問ADI的工程師大牛們,這些
    發(fā)表于 08-06 07:02

    PID算法控制的角度當(dāng)角度差較大時桿子振蕩波動太大

    我用的是四旋翼電機,做的平衡桿,用PID算法控制的角度可是當(dāng)角度差較大時桿子振蕩波動太大了,桿子根本沒法平衡,已經(jīng)毀了槳葉,落后別人好多了,調(diào)了一下午都不行,請問我還可以用PID算法嗎,還是用最笨的方法,我很著急,時間不多了,請
    發(fā)表于 04-01 06:36

    有什么現(xiàn)成的濾波算法來消除ADC采集溫度的波動

    圖上是adc采集多組原始數(shù)據(jù)的平均值,隨著溫度漸變也會上下波動,有什么現(xiàn)成的濾波算法來消除波動呢?ADC采集溫度用什么濾波算法
    發(fā)表于 07-27 10:23

    使用ST的FOC,給定3000速,速度波動在60左右速,有什么辦法減少速度波動

    請問各位大佬,使用的是ST的FOC控制算法,有編碼器,沒有帶負載時,速度波動很小,帶負載運行,發(fā)現(xiàn)無論再怎樣調(diào)PID,速度波動在60左右,但有什么辦法減少速度波動?
    發(fā)表于 10-20 17:45

    基于令牌的共享資源分配算法_雷鳴

    基于令牌的共享資源分配算法_雷鳴
    發(fā)表于 03-16 10:53 ?0次下載

    基于高斯過程回歸的云計算資源調(diào)度算法

    針對現(xiàn)有基于強化學(xué)習(xí)的云資源調(diào)度算法收斂速度慢的問題,在詳細分析云作業(yè)執(zhí)行流程后,采用了一種細粒度的云計算平臺模型,設(shè)計了一種基于高斯過程回歸和強化學(xué)習(xí)的云計算資源調(diào)度算法。
    發(fā)表于 11-02 16:50 ?15次下載
    基于高斯過程回歸的云計算<b class='flag-5'>資源</b>調(diào)度<b class='flag-5'>算法</b>

    基于噪聲功率波動的小波變換能量檢測算法

    (MFD)、循環(huán)平穩(wěn)特征檢測法(CFD)。能量檢測是最簡單的一種頻譜感知方法,它易于實現(xiàn),算法復(fù)雜度低。 實際環(huán)境中,噪聲功率波動性大,從而使能量檢測算法的穩(wěn)健性變差,算法出現(xiàn)信噪比門
    發(fā)表于 11-10 09:58 ?3次下載
    基于噪聲功率<b class='flag-5'>波動</b>的小波變換能量檢測<b class='flag-5'>算法</b>

    基于Spark的資源調(diào)度算法研究

    Spark作為流行的分布式數(shù)據(jù)處理框架,其資源的調(diào)度方式和資源的利用率直接關(guān)系到集群計算處理的效率和速度。針對Spark資源調(diào)度問題,在Spark自身考慮的資源因素內(nèi)存和空余核數(shù)下,提
    發(fā)表于 11-27 15:52 ?0次下載
    基于Spark的<b class='flag-5'>資源</b>調(diào)度<b class='flag-5'>算法</b>研究

    Mesos多資源調(diào)度DRF增強算法

    云計算集群環(huán)境下多資源分配的公平性是考量資源調(diào)度子系統(tǒng)最重要的指標(biāo)之一,DRF作為通用的多資源公平分配算法,在異構(gòu)異質(zhì)的集群環(huán)境下可能有失公平性。在研究Mesos框架中DRF多
    發(fā)表于 12-18 10:54 ?0次下載

    過山車立軸瞬態(tài)應(yīng)力分析

    針對過山車在高速運行過程巾,其連接車架和橋殼的關(guān)鍵件立軸受力具有瞬時多變性特點,傳統(tǒng)的靜力學(xué)分析方法無法滿足其安全性評估需求的問題。對過山車基于虛擬樣機聯(lián)合仿真技術(shù)進行了三維建模與ADAMS多體
    發(fā)表于 03-15 15:40 ?0次下載
    <b class='flag-5'>過山車</b>立軸瞬態(tài)應(yīng)力分析

    VR技術(shù)用于娛樂行業(yè),未來的過山車會怎樣?

    現(xiàn)如今,數(shù)字時代又為過山車帶來了新奇的體驗:將虛擬現(xiàn)實(VR)疊加在過山車體驗中,真實與虛擬相結(jié)合,帶來更進一步的刺激感受。當(dāng)體驗者被固定在座位上并乘坐實際的過山車時,他們會要求佩戴一個VR頭顯
    發(fā)表于 08-28 10:27 ?1439次閱讀

    OPPO Reno2的“過山車級防抖”

    這回“穩(wěn)”了!彩虹合唱團挑戰(zhàn)Reno2過山車防抖,表現(xiàn)喜人
    的頭像 發(fā)表于 08-28 10:30 ?2653次閱讀

    容器云中基于改進遺傳算法資源分配策略綜述

    容器云中基于改進遺傳算法資源分配策略綜述
    發(fā)表于 06-29 16:02 ?5次下載

    電機控制算法及模型資源下載

    電機控制算法及模型資源下載
    發(fā)表于 07-16 10:32 ?8次下載

    數(shù)字信號處理算法電子版資源下載

    數(shù)字信號處理算法電子版資源下載
    發(fā)表于 07-18 10:12 ?0次下載
    主站蜘蛛池模板: 黄色午夜影院| 欧美性黄色| 天天舔天天插| 影院成人区精品一区二区婷婷丽春院影视| 91免费在线视频| 色网站免费视频| www奇米影视com| 性欧美69| 亚洲第一中文字幕| 种子在线搜索| 天堂视频免费| 欧美久操| 丁香婷五月| 天天做天天干| 黄乱色伦| 中文字幕一区在线观看| 黄免费看| 色综合天天综合网国产国产人| 欧美成人生活片| 国产99色| 日日拍拍| 免费黄色大片在线观看| 国产成人毛片亚洲精品不卡| 婷婷综合久久中文字幕| 日本不卡免费新一区二区三区 | 成人午夜免费视频毛片| 丁香婷婷啪啪| 曰本又色又爽又黄三级视频| 日本黄视频在线观看| 特级片在线观看| 欧美黄色片一级| 大学生毛片| 免费一级片在线观看| 国产操女| 亚洲人成电影在线观看网| 欧美视频在线观在线看| 成人区精品一区二区毛片不卡| 全午夜免费一级毛片| 欧美性猛交xxxx免费| 一级一片免费播放| 美女视频永久黄网站免费观看国产|