雖然做了很多工作,但是可靠性是個(gè)系統(tǒng)性的工程、跨學(xué)科的領(lǐng)域。大家操作起來總覺得缺乏思路,也覺得知識(shí)點(diǎn)比較零散。我們正在準(zhǔn)備中國電子學(xué)會(huì)_硬件工程師_可靠性(高級(jí))的課程。所以正在對(duì)整體做更系統(tǒng)的梳理和總結(jié)。
也希望大家給我們提供意見和建議。所以我們也希望做一個(gè)完整的、系統(tǒng)的梳理。然后從方法論的角度,對(duì)大家梳理思路,能夠清晰地入手可靠性提升的工作。
一、用理論的方法對(duì)系統(tǒng)可靠性進(jìn)行預(yù)計(jì),并且找到薄弱點(diǎn)。
這個(gè)是很多可靠性公司或者咨詢公司,喜歡入手的方法。但是很多硬件工程師會(huì)覺得,這個(gè)方法不夠落地,整了很多數(shù)據(jù),實(shí)際沒有什么作用。
正是因?yàn)楣ぷ髁看?,與實(shí)操可靠性提升缺乏線性指導(dǎo)關(guān)系,導(dǎo)致大家覺得沒用。但是我們真正要做好可靠性還是需要從這個(gè)維度入手。我們從理論分析時(shí),需要做如下工作。
? 建立可靠性模型
串聯(lián)模型:組成產(chǎn)品的所有單元中任一單元發(fā)生故障都會(huì)導(dǎo)致整個(gè)產(chǎn)品故障
并聯(lián)模型:組成產(chǎn)品所有單元同時(shí)工作時(shí),只要有一個(gè)單元不發(fā)生故障,產(chǎn) 品就不會(huì)故障,亦稱貯備模型
表決模型:組成系統(tǒng)的n個(gè)單元中,正常的單元數(shù)不小于r(1≤r≤n)系統(tǒng)就不會(huì)故障,這樣的系統(tǒng)稱為r/n(G)表決模型。? 可靠性分配
在產(chǎn)品設(shè)計(jì)階段,將產(chǎn)品的可靠性定量要求按規(guī)定的準(zhǔn)則分配到規(guī)定的產(chǎn)品層次的過程。
可靠性分配的目的:
將整機(jī)可靠性要求分配到各組成單元
明確設(shè)計(jì)時(shí)對(duì)各組成單元控制的重點(diǎn)
? 可靠性預(yù)計(jì)
通過將整個(gè)硬件系統(tǒng)進(jìn)行拆分,從每個(gè)可以提供失效率的單元,按照模型進(jìn)行計(jì)算,得到整體的失效率。
所以我們需要經(jīng)歷:建立模型→分解部件→預(yù)計(jì)可靠性是否滿足需求→找到可靠性的短板→優(yōu)化(模型優(yōu)化,系統(tǒng)級(jí)優(yōu)化,模塊級(jí)優(yōu)化,器件級(jí)優(yōu)化)。
在實(shí)操過程中,大家擔(dān)心的是:
1、很多器件的失效率無法獲得。缺少一個(gè)數(shù)據(jù)可能導(dǎo)致結(jié)果不準(zhǔn)確。
2、很多數(shù)據(jù)并不準(zhǔn)確。
3、計(jì)算量巨大,但是與實(shí)際數(shù)據(jù)相差甚遠(yuǎn)。
但是,我們通過計(jì)算,可以找到短板,同時(shí)可以從理論評(píng)估是否滿足失效率需求。需要我們企業(yè)累積的去投入,形成數(shù)據(jù)積累和工具積累,在每個(gè)項(xiàng)目的時(shí)候的重復(fù)勞動(dòng)避免,則大大提供效率和準(zhǔn)確度。
二、評(píng)估設(shè)備的組件會(huì)怎么失效,失效之后會(huì)有什么后果。
這個(gè)方法其實(shí)就是FMEA
?FMEA:Failure Modes and Effects Analysis,失效模式與影響分析。講白點(diǎn),就是通過“想”和窮舉法,一一考慮各個(gè)器件(組件)可能會(huì)怎么壞掉?壞掉之后有什么影響,分析分析,看看軟件、硬件層面,有沒有什么手段和措施能夠檢測(cè)、解決、隔離、恢復(fù)這個(gè)問題。
指在產(chǎn)品的設(shè)計(jì)過程中,通過對(duì)系統(tǒng)各組成單元潛在故障模式對(duì)產(chǎn)品功能的影響分析,或?qū)ο到y(tǒng)功能流程各個(gè)步驟,數(shù)據(jù)流和存儲(chǔ)各環(huán)節(jié)失效后對(duì)產(chǎn)品影響分析,把每個(gè)潛在故障模式按影響嚴(yán)酷程度分類,提出預(yù)防改進(jìn)措施,如故障檢測(cè)、故障隔離、故障恢復(fù)等軟硬件故障管理需求及測(cè)試驗(yàn)證需求,以提高系統(tǒng)的可靠性可維護(hù)性的分析方法。
FMEA 是一種自下而上的方法,用于分析一個(gè)系統(tǒng)設(shè)計(jì)或制造過程,以評(píng)估潛在的失效和影響。
FMEA的基本思想:遍歷性、系統(tǒng)性。
我們可以在很多FMEA的教材上面看到這兩個(gè)概念:遍歷性、系統(tǒng)性。那么這兩點(diǎn)在硬件設(shè)計(jì)的過程中是如何體現(xiàn)的呢?
FMEA的分析方法:
硬件法,從硬件的角度,對(duì)每個(gè)器件管腳輸出分別去考慮故障模式、故障影響、檢測(cè)補(bǔ)償措施。(因?yàn)槲覀儽闅v了每一個(gè)器件、每一個(gè)器件的每一個(gè)管腳,所以這里體現(xiàn)了遍歷性)
功能法,每個(gè)產(chǎn)品可以完成若干功能,而功能可以按輸出分類。這種方法將輸出一一列出,并對(duì)它們的故障模式進(jìn)行分析。對(duì)應(yīng)系統(tǒng)級(jí)、單板級(jí)分析。(此處按照功能和場(chǎng)景,對(duì)故障模式分別進(jìn)行遍歷和分析)。
我們?cè)趯?shí)現(xiàn)FMEA的時(shí)候,需要提升產(chǎn)品的可測(cè)試性,同時(shí)需要一些軟件、硬件方法,對(duì)部分故障單元進(jìn)行記錄、復(fù)位、下單,等操作。
三、測(cè)試+實(shí)驗(yàn)方法
這就是用事實(shí)的方法來判斷產(chǎn)品是否滿足可靠性要求,并且來尋找產(chǎn)品可靠性的短板。
既然很多同學(xué)不相信方法一、和方法二。計(jì)算為虛,實(shí)驗(yàn)為實(shí)。真刀真槍上試驗(yàn)臺(tái),看看產(chǎn)品是不是扛得住折磨,特別是正式量產(chǎn)之前,要足夠樣本對(duì)可靠性進(jìn)行摸底。
所以,我們經(jīng)常需要做的一件事:拷機(jī)。
這里不是烤雞,而是針對(duì)產(chǎn)品特性進(jìn)行長時(shí)間工作測(cè)試,看看經(jīng)不經(jīng)得住考驗(yàn)。例如上圖中,折疊屏手機(jī),需要機(jī)械裝置對(duì)其進(jìn)行反復(fù)操作。
當(dāng)然這個(gè)方法太慢了,我們需要對(duì)設(shè)備的壽命檢驗(yàn)進(jìn)行加速。我們一般采用的方法就是加大“應(yīng)力”——熱應(yīng)力、機(jī)械應(yīng)力、化學(xué)應(yīng)力、電應(yīng)力。
此處涉及內(nèi)容比較多,各個(gè)行業(yè)有各個(gè)行業(yè)的實(shí)驗(yàn)標(biāo)準(zhǔn),此處暫時(shí)不贅述。
但是實(shí)驗(yàn)是最真實(shí)可靠的檢驗(yàn)標(biāo)準(zhǔn)。
四、故意搞破壞
這個(gè)方法就是為了檢驗(yàn)我們產(chǎn)品,我們做故障注入的方法——FIT(
fault injection techniques 故障注入技術(shù))。這個(gè)方法也是驗(yàn)收方法二(FMEA)的標(biāo)準(zhǔn)。
我們?cè)谠O(shè)計(jì)階段,就把FMEA的需求做好,然后在設(shè)計(jì)過程中,就考慮到FMEA的需求。同時(shí)設(shè)計(jì)好,最后怎么驗(yàn)收,也就是FIT測(cè)試的方法。
所以故意搞破壞,也要是有的放矢的搞破壞,不是想一出是一出。記得有測(cè)試人員說她的發(fā)卡掉到電路板上了,電路板掉電不能恢復(fù)。但是,無法復(fù)現(xiàn),也不知道具體什么故障模式。FIT測(cè)試也是設(shè)計(jì)出來的,不是隨意試出來的。
FIT方案設(shè)計(jì)基于兩個(gè)原則:
一是保證測(cè)試的覆蓋率
二是保證測(cè)試工作量的可執(zhí)行性
用例設(shè)計(jì)中考慮故障出現(xiàn)的概率(根據(jù)FMEA分析結(jié)果)。對(duì)可能產(chǎn)生同一種影響的不同故障考慮故障模式的收斂,即只模擬一種故障模式(前提故障檢測(cè)是通過檢測(cè)這些故障模產(chǎn)生的故障影響來確定故障,而不是直接檢測(cè)故障模式)
五、防護(hù)設(shè)計(jì)
我們針對(duì)故意搞破壞的,還有應(yīng)力,需要有針對(duì)性的做一些設(shè)計(jì):熱設(shè)計(jì)、結(jié)構(gòu)設(shè)計(jì)、化學(xué)防護(hù)設(shè)計(jì)、EMC防護(hù)設(shè)計(jì)(防雷擊、防浪涌、ESD)等等。
熱設(shè)計(jì)
(1)熱設(shè)計(jì)的主要設(shè)計(jì)方法
(a)傳導(dǎo)散熱設(shè)計(jì)。如:選用導(dǎo)熱系數(shù)大的材料,加大與導(dǎo)熱零件的接觸面積,盡量縮短熱傳導(dǎo)的路徑,在傳導(dǎo)路徑中不應(yīng)有絕熱或隔熱件等。
(b)對(duì)流散熱設(shè)計(jì)。如:加大溫差,即降低周圍對(duì)流介質(zhì)的溫度;加大流體與固體間的接觸面積;加大周圍介質(zhì)的流動(dòng)速度,使它帶走更多的熱量等。
(c)輻射散熱設(shè)計(jì)。如:在發(fā)熱體表面涂上散熱的涂層以增加黑度系數(shù);加大輻射體的表面面積等。
(d)耐熱設(shè)計(jì)。如:接近高溫區(qū)的所有操縱組件、電線、線束和其它附件均應(yīng)采取防護(hù)措施并用耐高溫材料制成;導(dǎo)線間應(yīng)有足夠的間隙,在特定高溫源附近的導(dǎo)線要使用耐高溫絕緣材料。
熱設(shè)計(jì)基礎(chǔ)(上)
熱設(shè)計(jì)基礎(chǔ)(中)
熱設(shè)計(jì)基礎(chǔ)(下)
環(huán)境防護(hù)設(shè)計(jì)(三防)
(1)防潮濕設(shè)計(jì)
采取具有防水、防霉、防銹蝕的材料。
提供排水疏流系統(tǒng)或除濕裝置,消除濕氣聚集物。
采取干燥裝置吸收濕氣。
應(yīng)用保護(hù)涂層以防銹蝕。
憎水處理,以降低產(chǎn)品的吸水性或改變其親水性能
浸漬,用高強(qiáng)度和絕緣性能好的涂料來填充某些絕緣材料。
(2)防鹽霧腐蝕設(shè)計(jì)
防止鹽霧導(dǎo)致的電化學(xué)腐蝕、電偶腐蝕、應(yīng)力腐蝕、晶間腐蝕等。
(3)防霉菌設(shè)計(jì)
采用防霉劑處理零部件或設(shè)備。
設(shè)備、部件密封,并且放進(jìn)干燥劑,保持內(nèi)部空氣干燥。
在密封前,材料用足夠強(qiáng)度的紫外線輻照,防止和抑殺霉菌。
另外還有一些,例如防硫化、防氧化、設(shè)計(jì)等。
抗沖擊、振動(dòng)和噪聲設(shè)計(jì)
(1)抗沖擊、振動(dòng)和噪聲設(shè)計(jì)的主要方法
消源設(shè)計(jì)。如:液體火箭發(fā)動(dòng)機(jī)的振動(dòng)是導(dǎo)彈的一個(gè)主要的振源,通過消除發(fā)動(dòng)機(jī)不穩(wěn)定燃燒、改變推力室頭部噴嘴的排列和流量,減小其振源,就能降低導(dǎo)彈振動(dòng)的等級(jí)。
隔離設(shè)計(jì)。如:采用主動(dòng)隔離或者被動(dòng)隔離方法將設(shè)備與振源隔離開來。減振設(shè)計(jì)。如:采用阻尼減振、動(dòng)力減振、摩擦減振、沖擊減振等方法消耗或者吸收振動(dòng)能量。
抗振設(shè)計(jì)。如:改變安裝部位;提高零部件的安裝剛性;安裝緊固;采用約束阻尼處理技術(shù);采用部件密封;防止共振等。
六、故障分析(失效模式與失效分析)
包括系統(tǒng)故障分析,以及器件失效分析。按照不用的層級(jí),我們需要做不同深度的維度的失效分析。
器件選型時(shí),我們需要考慮其失效模式,同時(shí)需要考慮其失效機(jī)理。如果發(fā)生失效了,我需要做好器件的失效分析。
需要了解失效分析,可以點(diǎn)擊查看,之前的文章合集:失效分析合集
七、硬件穩(wěn)定性相關(guān)的電路設(shè)計(jì)
很多工程師覺得,如果這個(gè)沒做好,或者沒有做到,根本就不是合格的產(chǎn)品。前面說的六條都是浮云。
冗余設(shè)計(jì)
降額設(shè)計(jì)
單板上電、復(fù)位設(shè)計(jì)
信號(hào)完整性
電源完整性
邏輯電平設(shè)計(jì)
等等
八、管理
管理這兩個(gè)字,有時(shí)看似很虛,但是通過管理,我們可以把人本身的不穩(wěn)定因素剔除掉,避免因?yàn)槿朔稿e(cuò)誤導(dǎo)致的不可靠。
這里包括研發(fā)管理、生產(chǎn)管理、物料管理、流程管理等等。我們后續(xù)通過文章和視頻進(jìn)行詳細(xì)地介紹。
審核編輯 :李倩
-
邏輯電平
+關(guān)注
關(guān)注
0文章
152瀏覽量
14423 -
模型
+關(guān)注
關(guān)注
1文章
3243瀏覽量
48842 -
組件
+關(guān)注
關(guān)注
1文章
512瀏覽量
17828
原文標(biāo)題:提高可靠性的關(guān)鍵措施
文章出處:【微信號(hào):Hardware_10W,微信公眾號(hào):硬件十萬個(gè)為什么】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論