這一篇文章講一講,高級錯(cuò)誤報(bào)告(Advanced Error Reporting,AER)關(guān)于可校正和不可校正錯(cuò)誤的相關(guān)寄存器,以及Root如何處理來自其他PCIe設(shè)備的錯(cuò)誤消息等內(nèi)容。
? 高級可校正錯(cuò)誤處理(Advanced Correctable Error Handling)
o 高級可校正錯(cuò)誤狀態(tài)
高級可校正錯(cuò)誤狀態(tài)寄存器如下圖所示,當(dāng)相關(guān)錯(cuò)誤發(fā)生后,硬件會自動地將對應(yīng)bit置1。軟件可以通過向?qū)?yīng)bit寫1,來清零。
o 高級可校正錯(cuò)誤屏蔽
高級可校正錯(cuò)誤屏蔽寄存器如下圖所示,默認(rèn)情況下,這些bit的值都是0。也就是說,只要發(fā)生相關(guān)錯(cuò)誤,且該錯(cuò)誤報(bào)告功能被使能,則相關(guān)錯(cuò)誤便會被報(bào)告(不被屏蔽)。當(dāng)然,軟件可以通過將相關(guān)bit置1,來屏蔽相關(guān)的錯(cuò)誤報(bào)告信息。
? 高級不可校正錯(cuò)誤處理(Advanced Uncorrectable Error Handling)
o 高級不可校正錯(cuò)誤狀態(tài)
高級不可校正錯(cuò)誤狀態(tài)寄存器如下圖所示,當(dāng)相關(guān)錯(cuò)誤發(fā)生時(shí),不管這些錯(cuò)誤會不會被報(bào)告到Root,相關(guān)的bit都會被置1。
回顧一下,前一篇文章中的當(dāng)前錯(cuò)誤指針(First Error Pointer)。假設(shè)該指針的值為18d,則表明不可校正錯(cuò)誤狀態(tài)寄存器中的第18位對應(yīng)的錯(cuò)誤——異常的TLP(Malformed TLP)將會被最先處理。一旦該錯(cuò)誤被處理后,軟件將會向不可校正錯(cuò)誤狀態(tài)寄存器的第18位寫1,來清除該bit。然后,當(dāng)前錯(cuò)誤指針將會被更新到下一個(gè)值。
軟件可以通過高級不可校正錯(cuò)誤嚴(yán)重度寄存器(Advanced Uncorrectable Error Severity Register)來修改不可校正錯(cuò)誤是否被作為致命的(Fatal)錯(cuò)誤處理,進(jìn)而使得這些錯(cuò)誤得到區(qū)分處理。如下圖所示,其中,0表示非致命的(Non-Fatal),1表示致命的(Fatal)。
o 高級不可校正錯(cuò)誤屏蔽
高級不可校正錯(cuò)誤評級寄存器如下圖所示,當(dāng)相關(guān)bit被置1時(shí),對應(yīng)的錯(cuò)誤類型將不會被報(bào)告。
配置空間中的高級錯(cuò)誤報(bào)告結(jié)構(gòu)中包含有一個(gè)4DW的子空間,用于緩存接收到的,發(fā)生不可校正錯(cuò)誤的(未被屏蔽的)的TLP的包頭。PCIe Spec規(guī)定,當(dāng)設(shè)備支持AER功能時(shí),必須有能力至少緩存一個(gè)TLP包頭(4DW)。當(dāng)然,有些設(shè)備可能支持緩存更多的TLP包頭。該子空間被稱為包頭緩存寄存器(Header Log Register),其支持的錯(cuò)誤類型如下圖所示。
在PCIe總線拓?fù)浣Y(jié)構(gòu)中,Root是所有其他PCIe設(shè)備錯(cuò)誤報(bào)告的目標(biāo)(Target)。當(dāng)Root接收到來自其他PCIe設(shè)備的錯(cuò)誤消息(Error Message)后,Root會根據(jù)系統(tǒng)的參數(shù)設(shè)置選擇是否向系統(tǒng)報(bào)告錯(cuò)誤,并以何種方式(中斷等)報(bào)告。
注:關(guān)于PCIe的中斷機(jī)制會在后續(xù)的文章中詳細(xì)介紹。
當(dāng)Root接收到錯(cuò)誤消息后,便會將Root錯(cuò)誤狀態(tài)寄存器中的對應(yīng)位置位。需要注意的時(shí),由于Root自身也是PCIe設(shè)備,當(dāng)其自身發(fā)生錯(cuò)誤時(shí),也會導(dǎo)致Root錯(cuò)誤狀態(tài)寄存器中的對應(yīng)位置位,就像是其收到了錯(cuò)誤消息了一樣。該寄存器如下圖所示:
前面的文章介紹過,錯(cuò)誤消息也是消息(Message)的一種。錯(cuò)誤消息中包含了錯(cuò)誤源設(shè)備的ID信息(BDF,Bus,Device and Function),根據(jù)ID信息,便可以確定錯(cuò)誤源的位置等信息,同時(shí)將該信息緩存在高級源ID寄存器中,如下圖所示。
可以通過Root錯(cuò)誤命令寄存器(Root Error Command Register)的相關(guān)bit來使能或者禁止相關(guān)類型的錯(cuò)誤是否被報(bào)告至系統(tǒng)。如下圖所示:
-
寄存器
+關(guān)注
關(guān)注
31文章
5357瀏覽量
120585 -
PCIe
+關(guān)注
關(guān)注
15文章
1241瀏覽量
82743 -
root
+關(guān)注
關(guān)注
1文章
86瀏覽量
21400
原文標(biāo)題:【博文連載】PCIe掃盲——高級錯(cuò)誤報(bào)告AER(二)
文章出處:【微信號:ChinaAET,微信公眾號:電子技術(shù)應(yīng)用ChinaAET】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論