在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

完整的Perf支持缺少了什么

lPCU_elecfans ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚 ? 2021-12-21 09:47 ? 次閱讀

RISC-V在云端、數(shù)據(jù)中心、汽車與網(wǎng)絡(luò)技術(shù)中的頻繁創(chuàng)新和亮相,已經(jīng)讓這一成長中的ISA一只腳邁入了高性能計算場景。然而缺少強大的性能監(jiān)測工具讓RISC-V的應(yīng)用優(yōu)化成了問題,尤其是在RISC-V如今不少軟件源于從非原生移植的情況下,運算性能不能發(fā)揮出百分百的實力成了令人頭疼的問題。

與此同時,英特爾ARM都擁有自己專用的性能監(jiān)控方案,讓開發(fā)者可以發(fā)揮出其硬件的全部效力,但RISC-V仍然依靠定制或廠商特定的方案,而缺少通用性能監(jiān)控軟件工具的完整支持。

Perf對RISC-V的支持

系統(tǒng)級的性能優(yōu)化往往是靠性能剖析和代碼優(yōu)化來實現(xiàn)的,前者是為了尋找性能瓶頸,后者則是為了改善軟件性能,因此這類性能分析/監(jiān)控工具成了處理器開發(fā)時必不可少的軟件。盡管RISC-V的ISA規(guī)范已經(jīng)定義了硬件性能監(jiān)控(HPM),但總體支持程度上仍未完善。

就以Linux上的性能分析工具Perf為例,該工具可以借助PMU(性能監(jiān)控單元)、tracepoint和內(nèi)核計數(shù)器來分析程序中的硬件事件,比如處理器時鐘周期、指令計數(shù)器等,也可以分析一些軟件事件,比如Page Fault等。

Perf分為兩種模式,一種是perf stat,一種是perf record。如今上游Linux的perf雖然已經(jīng)對RISC-V有了支持,但僅對perf stat有一些基本的支持。比如mcycle這一CSR用于處理器運行的時鐘周期計數(shù),而minstret這一CSR則用于退休指令計數(shù)。

RISC-V privileged規(guī)范中,RISC-V定義了幾種特權(quán)模式,分別是U-mode(用戶模式)、S-mode(管理員模式)和M-mode(機器模式)。但目前只有在機器模式下才能對這些寄存器進(jìn)行讀寫,管理員模式下缺乏可寫入的寄存器。

計數(shù)器卻又是每時每刻運行中的,所以現(xiàn)在可以做到周期和指令計數(shù),卻無法啟用、禁用和暫停計數(shù)器,無法使用任何可編程計數(shù)器和事件采樣。不僅如此,RISC-V的perf不僅無法處理計數(shù)器溢出,也不支持溢出中斷。雖然市面上很多RISC-V處理器已經(jīng)考慮到了這一點,采用定制的形式來完成部分任務(wù),比如Esperanto就為自己的ET-SoC-1千核RISC-V處理器加入了商業(yè)級的芯片除錯與性能監(jiān)控能力,但RISC-V規(guī)范本身缺少這些支持,這也就不利于當(dāng)下RISC-V的開源生態(tài)。

完整的Perf支持缺少了什么?

于是我們現(xiàn)在發(fā)現(xiàn)管理員模式下無法寫入計數(shù)器,也無法改變mcountinhibit來直接開啟或停止計數(shù)器,也無法改變mhpmcountern來開啟或禁用直接讀取。接著就是沒有中斷指示器,我們不知道哪一個計數(shù)器出現(xiàn)了數(shù)值溢出,也沒有事件篩選功能。那么針對這些問題的解決方案是什么,哪些措施才能實現(xiàn)完整的Perf支持呢?來自西部數(shù)據(jù)的Atish Patra在近期的RISC-V峰會上提出了他以及開發(fā)社區(qū)所青睞的答案——SBI PMU擴展和sscofpmf ISA擴展。

SBI PMU擴展將作為一個接口,讓管理員模式下的軟件發(fā)現(xiàn)硬件計數(shù)器的細(xì)節(jié),針對特定的perf事件來配置硬件計數(shù)器,在請求下開始或停止計數(shù)器。除此之外,SBI PMU擴展還引入了固件性能計數(shù)器來監(jiān)控固件事件,比如未對齊的存取指令數(shù)、RFENCE和IPI數(shù)等等。如今在RISC-V的SBI 1.0版本中我們也可以看到,PMU擴展已經(jīng)成了該規(guī)范的一部分。

接著是sscofpmf擴展,ss代表的是特權(quán)架構(gòu)和管理員級的擴展,cofpmf代表的是溢出計數(shù)和特權(quán)模式篩選。該擴展新增了一個32位的scountovf只讀寄存器,該寄存器存儲的是29個mhpmcounter的第63位(OF),如此一來就能準(zhǔn)確快速地判斷究竟是哪個事件的計數(shù)器溢出了。這一擴展已經(jīng)凍結(jié),目前處于審查狀態(tài),預(yù)計不久的將來就會批準(zhǔn),來自Linux內(nèi)核的支持工作也在推進(jìn)中。

小結(jié)

RISC-V作為一個尚處于發(fā)展初期的架構(gòu),在某些方面確實還有不及其前輩x86和ARM的地方,我們這次從性能監(jiān)控上就能看出一些端倪,但RISC-V自身的特性也為它帶來了不小的優(yōu)勢。

首先,RISC-V是站在巨人的肩膀上發(fā)展的,它可以有效地規(guī)避以上那些架構(gòu)走錯的老路。其次,開源開放讓RISC-V有了龐大的社區(qū)支持,像以上這些解決方案,其實已經(jīng)被多次提及,來自社區(qū)的力量勢必可以讓RISC-V走得更遠(yuǎn)。

審核編輯:何安淇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 監(jiān)測
    +關(guān)注

    關(guān)注

    2

    文章

    3625

    瀏覽量

    44590
  • RISC-V
    +關(guān)注

    關(guān)注

    45

    文章

    2292

    瀏覽量

    46247

原文標(biāo)題:優(yōu)化的關(guān)鍵,RISC-V中的性能監(jiān)控

文章出處:【微信號:elecfans,微信公眾號:電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    如何解決信號完整性問題

    如何解決信號完整性問題呢?是德科技在向您介紹信號完整性分析基礎(chǔ)知識的同時,我們還向您展示如何使用基本信號完整性(Signal Integrity - SI) 分析技術(shù)(例如眼圖、S參數(shù)、時域反射計(TDR) 和單脈沖響應(yīng))來解決
    的頭像 發(fā)表于 12-25 16:51 ?553次閱讀
    如何解決信號<b class='flag-5'>完整</b>性問題

    聽懂什么是信號完整

    2024年12月20日14:00-16:00中星聯(lián)華科技將舉辦“高速信號完整性分析與測試”-“碼”上行動系列線上講堂線上講堂。本期會議我們將為大家介紹高速串行總線傳輸基本框架,什么是信號完整性?高速
    的頭像 發(fā)表于 12-15 23:33 ?203次閱讀
    聽懂什么是信號<b class='flag-5'>完整</b>性

    ADS8866按照TI的3線MODE時序讀數(shù),讀出的數(shù)據(jù)少了3位,為什么?

    ADS8866按照TI的3線MODE時序讀數(shù),讀出的數(shù)據(jù)少了3位,附件是波形圖
    發(fā)表于 11-28 07:39

    高速電路中的信號完整性和電源完整性研究

    高速電路中的信號完整性和電源完整性研究
    發(fā)表于 09-25 14:44 ?0次下載

    高速高密度PCB信號完整性與電源完整性研究

    高速高密度PCB信號完整性與電源完整性研究
    發(fā)表于 09-25 14:43 ?5次下載

    高速PCB的信號完整性、電源完整性和電磁兼容性研究

    電子發(fā)燒友網(wǎng)站提供《高速PCB的信號完整性、電源完整性和電磁兼容性研究.pdf》資料免費下載
    發(fā)表于 09-19 17:37 ?0次下載

    你對村田的貼片電容器有多少了解?

    你對村田的貼片電容器有多少了解?
    的頭像 發(fā)表于 08-26 17:57 ?641次閱讀
    你對村田的貼片電容器有多<b class='flag-5'>少了</b>解?

    官方,buildroot文件系統(tǒng)支持gstreamer嗎?

    的camera或video時,提示找不到服務(wù) defaultServiceProvider::requestService(): no service found for ... 初始定位應(yīng)該是缺少
    發(fā)表于 08-19 09:10

    信號完整性與電源完整性-電源完整性分析

    電子發(fā)燒友網(wǎng)站提供《信號完整性與電源完整性-電源完整性分析.pdf》資料免費下載
    發(fā)表于 08-12 14:31 ?43次下載

    信號完整性與電源完整性-信號的串?dāng)_

    電子發(fā)燒友網(wǎng)站提供《信號完整性與電源完整性-信號的串?dāng)_.pdf》資料免費下載
    發(fā)表于 08-12 14:27 ?0次下載

    RTOS SDK中缺少uart_div_modify的定義怎么解決?

    RTOS SDK 中缺少 uart_div_modify 的定義
    發(fā)表于 07-18 07:43

    lwip RTOS sdk版本中缺少IGMP怎么解決?

    lwip RTOS sdk 版本中缺少 IGMP
    發(fā)表于 07-18 07:14

    在Dify中使用PerfXCloud大模型推理服務(wù)

    近日,Dify全面接入了Perf XCloud,借助Perf XCloud提供的大模型調(diào)用服務(wù),用戶可在Dify中構(gòu)建出更加經(jīng)濟、高效的LLM應(yīng)用。
    的頭像 發(fā)表于 07-15 09:28 ?949次閱讀
    在Dify中使用PerfXCloud大模型推理服務(wù)

    什么是信號完整

    在現(xiàn)代電子通信和數(shù)據(jù)處理系統(tǒng)中,信號完整性(Signal Integrity, SI)是一個至關(guān)重要的概念。它涉及信號在傳輸過程中的質(zhì)量保持,對于確保系統(tǒng)性能和穩(wěn)定性具有決定性的影響。本文將從信號完整性的定義、影響因素、測試方法、以及在實際應(yīng)用中的重要性等方面,對信號
    的頭像 發(fā)表于 05-28 14:30 ?1196次閱讀

    想通過perf工具來檢查2段不同代碼的內(nèi)存占用率,但一直沒找到,怎么辦?

    想通過perf工具來檢查2段不同代碼的內(nèi)存占用率,但一直沒找到,怎么辦?
    發(fā)表于 05-17 13:33
    主站蜘蛛池模板: 狠狠色噜噜狠狠狠狠狠色综合久久| 91精品国产91久久久久久青草| 2016天天干| 天天爱夜夜| 天天做天天爱天天爽| 天天综合色天天综合网| 午夜黄色一级片| 色屁屁www影院免费观看视频| 天天干天天色天天| 久久精品福利| 欧美小网站| 色吧在线视频在线观看| 国产美女精品久久久久中文| 国产精品久久久久久久成人午夜| 真人一级一级特黄高清毛片| 757一本到午夜宫| 在线观看视频播放| 很黄的网站在线观看| 毛片2016免费视频| 夜色福利久久久久久777777| 五月婷丁香| 欧美色性视频| 国语自产拍在线观看7m| 777国产精品永久免费观看| 天天天天射| 2021精品国产综合久久| 日本欧美一区二区三区免费不卡 | 国产三级日本三级在线播放| 在线观看免费高清| 国产网红主播精品福利大秀专区| 4438x成人网全国最大| 最近2018免费中文字幕视频| 天堂69亚洲精品中文字幕| 免费观看a黄一级视频| sese国产| 国产精品成人一区二区| 轻点灬大ji巴太粗太长了啊h | 91成人免费在线视频| 久久精品草| 热久久久久久| 日韩三级精品|