【摘要】某產品研發階段在做四角實驗的過程中,發現單板在低溫下出現反復重啟動的問題,經過反復的實驗和定位,發現是該電源DC-DC芯片使用的液態電解電容,在低溫下,內部液體固化。導致電容ESR降低,進而使DC-DC輸出的紋波變大,出現單板反復重啟動的問題。
一、問題的提出
該產品是一款有線通信設備,CPU為1.0V核電壓。在該單板做四角實驗過程中,溫循實驗發現單板有重啟問題,現象是:低溫實驗,會存在重啟現象了,多次試驗重啟故障必現。從這個現象看,單板應該是存在設計缺陷,對低溫特別敏感。
二、分析過程
根據單板復位的現象,按照時鐘、電源順序排查故障發生時CPU關鍵信號情況:
1、時鐘信號
該單板主時鐘為25MHz,通過外部晶體提供。將時鐘信號飛線引出,同時放在溫箱中。在低溫下,發現該單板復位的時候,時鐘信號并未出現異常。這里初步排除了不是晶體的問題。
2、電源
其次,考慮是單板上的電源有瞬間跌落的問題,從而導致單板復位。通過用示波器在溫箱內監測。主要監測了單板上的3.3V、1.8V、1.5V(DDR3電源)和 1.0V (CPU核電源)。在單板復位信號出現的時候,并沒有發現上述電源有過跌落。進一步監測1.8V、1.5V和1.0V電源紋波的時候,發現在低溫下,1.0V電源紋波有明顯的變大。而且,隨著溫度繼續降低,該紋波會繼續增大。當1.0V電源紋波增大到一定程度時候,單板出現復位。通過使用復位信號做觸發,監測1.0V的紋波,發現1.0V紋波變大的時候,恰好是復位信號出現的時候,在時序上是可以對準的。
圖1 單板復位信號和1.0V紋波信號
圖2 單板復位信號和1.0V紋波信號放大
進一步測量1.0V紋波隨溫度變化情況:在環境溫度降到<0度時候,1.0V紋波即開始變大;隨著溫度繼續降低,紋波越來越大,直到紋波達到到200MV左右,單板復位。為驗證是1.0電源紋波的問題,從1.0V電源的輸出電感處,斷開了單板上的1.0V DC-DC電源,用外部輸入的1.0V電源灌入單板,替代原有的1.0V電源。實驗發現,用外部電源后,單板在低溫下,沒有出現復位問題。對于用外部電源替代原有的1.0V電源,主要區別就是外部電源在溫箱外面,不受溫度變化影響,電源紋波一直穩定。所以,基本可以確定,主要就是1.0V電源紋波導致的單板復位。針對1.0V電源紋波問題,主要考慮:1、電源環路參數問題,導致在低溫下環路不穩定,進而導致紋波增大。2、考慮是電源上用的外圍器件,在低溫下,器件參數變化,導致輸出紋波增大。因為環路參數需要DCDC廠家支持配合驗證,這里優先自行排查可能性2。針對這個問題,從芯片手冊和收集的資料上看,確實有相關的解釋:根據1.0V電源選擇的DC-DC芯片的手冊上看,輸出的電源紋波和輸出電容的ESR以及開關頻率、電感量L有關,具體如下:
圖3 DC-DC輸出紋波和輸出電容ESR的關系
這里Fs是固定的430K,L 電感選擇的是10uH ,輸入輸出的電壓不變,在低溫環境下測量DCDC開關頻率和電感量L變化,排除這兩參數影響。1.0V電源的電路如下:
圖4 1.0V電源電路
這里選擇的輸出電容C166 是液態鋁電解電容,在電容的手冊中,沒有提到電容的ESR隨溫度變化的關系,從查到的資料看,液態鋁電解電容的ESR會隨溫度變化而變化。 通常,為了便于分析電容的ESR,多用下圖的簡化方式來表示:
圖5? 電容簡化圖
導致ESR變化兩個常見因素是:
1)不良的電氣連接;
2)電解溶液的干枯。
圖6 液態鋁電解電容ESR和溫度關系
從上面的圖中可以看到,電容的ESR隨著溫度的降低而增加。所以,對于該單板在低溫下出現的1.0V電源紋波變大,導致的單板復位問題就可以解釋了:在低溫下,鋁電解電容的電解液凝固,導致電容的ESR增加。根據1.0V電源DC-DC芯片手冊上的輸出電壓紋波公式可以知道,ESR增加,必然導致輸出電源的紋波增加,理論計算基本與現象符合。
三、解決方法
為此,要解決這個問題,關鍵是在低溫下保持輸出電容的ESR值和常溫保持不變。由于該電容的ESR是由于電解液在低溫下凝固而導致的,所以,選擇了固態鋁電解電容來替換。替換后,單板在低溫下正常,不再復位。
四、總結
雖然最后的解決方法很簡單,但整個定位的過程和解決方法,在以后實驗中還是具有一定的借鑒作用。本文闡述的實踐方法適用于單板上主要芯片功耗大,負載變化較大的單板;對于單板工作環境溫度變化比較大的單板,在大電容選擇的時候,可以參考。
審核編輯:湯梓紅
-
電源
+關注
關注
184文章
17803瀏覽量
251023 -
cpu
+關注
關注
68文章
10889瀏覽量
212389 -
DC-DC
+關注
關注
30文章
1957瀏覽量
81838 -
ESR
+關注
關注
4文章
202瀏覽量
31163 -
復位信號
+關注
關注
0文章
54瀏覽量
6349
發布評論請先 登錄
相關推薦
評論