超越“降額” 值得現代工程師參考的可靠性概念
“可靠性”這個詞匯對于不同的人士來說可能有著不同意義,但廣泛來講,底線往往在于成本?煽啃阅軌驖M足人的期望,它可能基于廣告宣傳、技術規(guī)格或合同,也可能與工程師以外的很多人士息息相關。例如在社會經濟學的層面上,我們的生態(tài)系統(tǒng)以道德及倫理為基礎。雖然工程師必須遵守雇主定下的行為標準,但是從個人品德的立場而言,道德規(guī)范可能比經濟效益更加重要。歷史常常告訴我們,任何文明都不能單憑經濟基礎而持久。完整的可靠性概念才是關鍵所在。
隨著人們逐漸關注到產品制造和棄置對環(huán)境帶來的影響,消費者的目光也由最低采購成本轉移到最低擁有成本。無金錢或環(huán)境處罰而頻繁更換低質量產品的年代已經一去不復返。相反,講求可靠性的設計在今天的價值生態(tài)系統(tǒng)中變得尤為重要。
故障模式與機制
要達到令人滿意的可靠性,便需要對故障模式與機制有充分的理解。故障模式說明了一個零件如何失效,也就是造成故障的“應力”。故障機制反映了零件的強度如何在不同的應力下被減弱。透過故障模式分析,我們可以歸納出故障的成因,從而改善產品的可靠性;明白了故障的機制后,我們又懂得選擇合適的鑒定試驗去驗證某項應用的可靠性。
故障模式的分類如下:
* 電氣性
* 災難性(破壞性)
* 功能性 – 元件不能夠提供正確的輸出數據或信號
* 參量性 – 電流或電壓超出允許誤差
* 編程 – 非揮發(fā)性記憶體元件不能夠做出正常響應
* 時序 – 例如由于傳播延遲、讀/寫時間、升降時間及建立時間不符合規(guī)格而造成故障
* 機械性 – 例如引線受損、封裝破裂、污染
* 外觀 – 例如標記難以辨認
* 行政管理 – 例如產品、數量、封裝、方向、日期和代碼出現錯誤
故障機制的分類如下:
* 物理故障
* 與時間有關的介質擊穿
* 負偏壓溫度不穩(wěn)定
* 電子漂移
* 熱載流子注入
* 輻射故障 (反應器、空間)
* 中子
* Beta粒子
* 伽馬
分析和預測
可用信息能夠估算出故障概率,卻無法提供實際故障數據,這是實施可靠性工程的一大挑戰(zhàn)。一般來說,用上幾千小時去測試一個裝置的做法是不切實際的,所以我們通常無法得到一個元件或系統(tǒng)在實際壽命中的測試數據。新產品的可靠性數據往往等于零,然而這并不代表有關產品永遠不會出現故障。雖然以更高溫度加快壽命測試或許能提供恰如其分的實驗數據,不過該實驗前提包括了活化能量恒久不變的假設,而在實際情況下,它是電壓和溫度的一個函數 (圖1)。這限制了加快的壽命測試在預測可靠性方面的準確度。因此,現場故障的監(jiān)察及反饋對提高產品可靠性的預測能力十分重要。
圖1
圖2
圖2顯示了在某時段內的累積故障。這個概念在常用的產品故障曲線 (又稱浴盆曲線) 中得到進一步的展示 (圖3)。有關曲線包含3個清晰的區(qū)段,每個區(qū)段都包含了若干有可能造成故障的因素,也牽涉某些人士。他們可以因為某些行動而影響了客戶對可靠性的理解。
第1個區(qū)段描述了裝置的失敗率。只要在生產裝置中進行若干測試,就可以把故障率降低到一個在實際運行中可以接受的水平。第2個區(qū)段描述了實際工作壽命中有可能出現的隨機故障。它們與時間無關,有關裝置也不會預先替換,一般都會在發(fā)生故障時才會被替換。第3個區(qū)段顯示了裝置的壽命接近終結而開始出現損耗。假如不加以替換,有一半產品都會在壽命中期開始失效。
圖3
可靠性組合
故障率 (可靠性的一種指標) 已不單單與電氣或熱應力有關,同時也與硬件、軟件/邏輯及傳輸媒體相互影響。降額是指在制造廠商針對環(huán)境或使用情況而定出的最大限制下對元件施加應力的做法,而該做法已不再是加強可靠性的良方妙法。它只是在最廣泛的程度上有條不紊控制產品質量的一種要素。
這方面的最大挑戰(zhàn),是只能夠在同一段時間內一個元件降額;而且由于制造廠商的數據冊逐漸變成了只提供“最低定義”的責任文件,設計員必須在元件中內置額外的緩沖 – 這不但增加了成本,還有可能降低產品的性能表現。
高可靠性產品 (軍事及宇航) 一般都會使用獨立鑒定的零件。不過,這樣不但增加了成本,也拖長了產品推出市場的時間。假如基于可靠性和質量來設計產品,無疑是更經濟實惠的方法。針對可靠性的設計必須對故障模式有充分了解,同時選擇成本最少的硬件冗余、軟件控制及傳輸媒體組合,從而達到甚至超越可靠性目標。產品鑒定包括了解故障機制,并且設計出一套完善的鑒定計劃,務求在限定的成本和時間內,對有關可靠性的預測作出精確的驗證。
針對可靠性的設計
可靠性設計是指通過平衡硬件、固件和軟件分配,務求以最低成本實現理想的可靠性表現。工程師應該緊記,硬件的可靠性是在元件壽命終結時的一個時間函數,軟件的可靠性則是一個成本函數。軟件一般都沒有耗損機制。
假如要以最少成本、在最短時間內達到預期的可靠性目標,就必須充分利用設計分析、故障模擬和工程判斷的重要資料。強大的設計技術包括為易受損元件提供冗余,同時意識到每個元件的可靠性都與整體可靠性密不可分。合適的話,可以利用硬件或軟件把監(jiān)察與控制功能加入元件設計中,為元件提供周全的應力保護。
靈巧的工程設計還會考慮到終端應用環(huán)境的設計決定。比方說,一枚導彈與一臺洗衣機的設計需求顯然有著天壤之別。導彈要在短時間內發(fā)揮強大的性能;相反,洗衣機卻需要針對數以百計的運行周期提供最完美的耐久性。兩者的需求在根本上截然不同。
可靠性的增長
圖4
如圖4所示,每個產品壽命周期都包含不同階段的轉變,由原型到開發(fā),再由開發(fā)到生產,過程中的可靠性會不斷增長。換句話說,每項設計在其壽命周期中,可靠性都會增加,而成本則會下降。這反映了可靠性的增長不單是設計工程師的責任而已。
事實上,隨著可靠性在價值生態(tài)系統(tǒng)中的角色日趨重要,不論是從事技術、管理、物流或面向客戶的人員,都有責任讓可靠性持續(xù)增長 (圖5)。
圖5