一、概率与统计
1、概率;这里用道题来说明这个数学问题(用WORD把这些烦琐的公式打出来太麻烦了,因为公司不重视品质管理,所以部门连个文员MM都没有,最后我只好使用CORELDRAW做的公式粘贴过来,如果你的电脑系统比较慢,需要耐心等待一会公式才会显示来,不过别着急,好东西往往是最后才出来的嘛!)。
题一、从含有D个不良品的N个产品中随机取出n个产品(做不放回抽样),求取出d个不良品的概率是多少?
解:典型的超几何分布例题,计算公式如下(不要烦人的问我为什么是这样的公式计算,我虽然理解了一些,解释起来非常麻烦,别怪我不够意思,是你自己上学的时候只顾早恋,没有学习造成的,骂自己吧!):
超几何分布:(最基本的了):
最精确的计算,适用比较小的数据
其中: N —— 产品批量 D —— N中的不合格数
d —— n中的合格数 n —— 抽样数
另外的概率计算的常用算法还有:
二项分布:(最常用的了,是超几何分布的极限形式。用于具备计件值特征的质量分布研究):
只是估算,当N≥10n后才比较准确
其中: n —— 样本大小 d —— n中的不合格数
ρ—— 产品不合格率
泊松分布:(电子产品的使用还没有使用过,只是在学习的时候玩过一些题目,我也使用没有经验)
具有计点计算特征的质量特性值
其中: λ—— n ρ n —— 样本的大小
ρ—— 单位不合格率(缺陷率) e = 2.718281
2、分布;各种随机情况,常见的分布有:二项分布、正态分布、泊松分布等,分位数的意义和用法也需要掌握;较典型的题目为:
题三、要求电阻器的值为80+/-4欧姆;从某次生产中随机抽样发现:电阻器的阻值服从正态分布,其均值80.8欧姆、标准差1.3欧姆,求此次生产中不合格品率。
公式好麻烦的,而且还要查表计算,555555555555,我懒得写了,反正我也没有做过电阻。
3、置信区间:我们根据取得样品的参数计算出产品相应的参数,这个“计算值”到底跟产品的“真实值”有什么关系?一般这样去描述这两个量:把“计算值”扩充成“计算区间”、然后描述“真实值有多大的可能会落在这个计算区间里”,从统计学上看,就是“估计参数”的“置信区间”;较典型的题目为:
题四、设某物理量服从正态分布,从中取出四个量,测量/计算后求得四个量的平均值为8.34,四个量的标准差为0.03;求平均值在95%的置信区间。
解:因为只知道此物理量服从正态分布,不知道这个正态分布对应的标准差,所以只能用样品的标准差来代替原物理量的标准差。这时,样品的平均值的分布就服从t分布。4个样品、95%的置信区间,对应的t0.975(3)=3.182;所以平均值的置信区间为:
8.34±3.182×(0.03/2)=[8.292,8.388]
这说明,此物理量的总体平均值有95%的可能落在8.292和8.388之间。
二、可靠性常用的分布
1、指数分布;第一章里提到浴盒曲线对应的指数分布为F(t)=1-e-t;如何得到这一分布?
设产品在t时间内总的失效率F(t),则:
在t时刻产品的存活率R(t)=1-F(t);
在t时刻的失效为t时间内的失效率的导数、即f(t)=F’(t);
在t时刻的失效率为t时刻的失效比t时刻的存活率、即f(t)/R(t)。
根据浴盆曲线,当产品在稳定失效阶段时任意时刻的失效率为λ。
综上,即得到等式:λ=f(t)/R(t)=F’(t)/(1-F(t));
解此微分方程得到一个特解:F(t)=1-e-t;
所以R(t)=e-t,这就是指数分布;
2、威布尔分布;与指数分布相比,只是变量λ不一样。威布尔分布的F(t)=1-e^(-t/a)^b;当b=1时,F(t)=1-e^(-t/a),这也就是指数分布;我们威布尔分布来看看其它参数:
R(t)=1-F(t)=e^(-t/a)^b;
f(t)=F`(t)=(b/t)*(t/a)^b*e^(-t/a)^b;
失效率=f(t)/R(t)=(b/t)*(t/a)^b;
3、对数正态分布;顾名思义,说明产品在t时间内的失效率与t服从对数正态分布,也就是说F(t)与ln(t)成正态分布。标准表达式为:F(t)=Φ((lnt-ln(T50))/δ);
根据各种分布,都可以方便地求出产品MTBF。
要求出产品的MTBF就必须找到样品的失效时间,这样我们必须取出一定的样品做特定的测试、记录样品的失效时间,然后计算产品的MTBF。在开始计算MTBF之前,我们先插述各种测试的筛选强度,也就是此种测试能发现样品存在缺陷的可能性。
三、筛选强度
在进行环境应力筛选设计时,要对所设计的方案进行强度计算。这样才能更有效的析出产品缺陷。在典型筛选应力选择时,一般恒定高温筛选用于元器件级,温度循环用于板级以上产品;温度循环的筛选强度明显高于恒定高温筛选。下面介绍一些筛选强度(SS)的数学模型。
1、恒定高温筛选强度
SS=1-exp [-0.0017(R+0.6)0.6t]
式中:R—高温与室温(一般取25℃)的差值;t—恒定高温持续时间(h);例:用85℃对某一元器件进行48H的筛选,则其筛选强度为:44.5% =1- EXP(-0.0017*((85+0.6)^0.6)*48);
2、温度循环的筛选强度
SS=1-exp{-0.0017(R+0.6)0.6[Ln(e+v)]3N}
式中:R—温度循环的变化范围(℃);V—温变率(℃/min);N—温度循环次数;例:用60℃到-40℃以10℃/min的速率做15次循环(每个循环20min,15个共计5H)则对应的筛选强度为:99.87%=1-EXP(-0.0017*((100+0.6)^0.6)*((ln(2.718+10))^3)*15);
3、随机振动的筛选强度
SS=1-exp{-0.0046(Grms)1.71·t}
式中:t—为振动时间(min);Grms---单位G; (这个地方我也没有找到资料)。
四、MTBF的计算
1、基本MTBF的测试
在实际工作过程中,很多时候并不需要精确在知道某个产品的MTBF,只需要知道是否可以接受此产品。这时,只需要对产品进行摸拟运行测试,当产品通过了测试时,就认为产品达到了要求的MTBF,可以接受此产品。
如何确定产品应该进行什么样的测试,也就是我们应该用多少样品进行多长时间的测试?根据MTBF(平均失效间隔时间)的定义,从“平均”这一个看来,失效的次数越多计算值就越能代表“平均值”,当然失效的次数越多对应的总测试时间也就越长;一般情况下要求:只要测试时间允许,失效的次数就应该取到尽可能地多。
下面用一个例子来说明测试条件的确定方法。
题五:某种产品,要求在90%的信心度下MTBF为2000H,如何判定此产品的可靠性是否达到了规定的要求?
可以转化为判定此产品是否能通过规定时间的模拟运行测试,其关键是要找出测试时间;测试时间=A×MTBF,A这个因子与“在这段时间内允许失效的次数”和“90%的信心度”有关系。根据已经成熟的体系,直接代用公式:
A=0.5*X2(1-a,2(r+1))
X2(1-a,2(r+1))是自由度为2(r+1)的X平方分布的1-a的分位数;
a 是要求的信心度,为90%; r 是允许的失效数,由你自己决定;
此分布值可以通过EXCEL来计算,在EXCEL中对应的函数为CHIINV;
如允许失效1次时,A=0.5*CHIINV(1-0.9,2*2)=0.5*CHIINV(0.1,4)=0.5*7.78=3.89;所以应该测试的时间为:3.89×2000=7780H。也就是当设备运行7780H是只出现一次失效就认为此产品达到了要求的可靠性。
7780H是324天(7780/24=324),快一年了,做一次测试花一年的时间?太长!我们可用这样去调整:①增加测试的总样品数;7780从统计上看,准确地说是7780台时、它是“机台×时间”这样一个量,也就是所有样机的测试时间总和;如果测试中有50台样机,则只需要测试155.6H;如果有100台样机,则只需要测试到77.8H(强烈建议在MTBF的测试中采用尽可能多的样品数);②减少允许失效的次数;允许失效的次数为0时,同上计算后得到测试时间为4605台时(一般不建议采用此种方式来缩短测试时间,这样会增大测试的误差率)。
对于价格较低、数量较多的产品(如各种元器件、各种家用电器等),用上面介绍的方法,可以很方便地进行测试;但当产品的价格较高、MTBF较高的产品如何测试?
题六:某种产品,要求在90%的信心度下MTBF为20000H,因单价较贵,只能提供10台左右的产品做测试,请问如何判定此产品的可靠性是否达到规定的要求?
还是转化为测试。即使有10台产品全部用于测试,20000H的MTBF也需要测2000H左右,这个时间太长,应该怎么办?
此时一般用到加速测试。对一般电子产品而言,多用高热加速,有时也用高湿高湿加速。根据加速模型(Arrhenius Model),得知加速因子的表达式为:
AF=exp{(Ea/k)*[(1/Tu)-(1/Ts)]+ (RHu^n-RHs^n)}
Ea为激活能(eV),k为玻尔兹曼常数且k=8.6*10E-5eV/K。T为绝对温度、RH指相对湿度(单位%)、下标u指常态、下标s指加速状态(如RHu^n指常态下相对湿度的n次方),一般情况下n取2。
Ea根据原材料的不同,有不同的取值,一般情况下:
氧化膜破坏 0.3Ev
离子性(SiO2中Na离子漂移) 1.0—1.4Ev
离子性(Si-SiO2界面的慢陷阱) 1.0eV
由于电迁移而断线 0.6eV
铝腐蚀 0.6—0.9eV
金属间化合物生长 0.5—0.7eV
根据产品的特性,取Ea为0.6eV,则在75℃、85%RH下做测试1h,相当于在室温(25℃、75%RH)的加速倍数为:
AF=EXP(0.6*((1/298)-(1/348))*10^5/8.6+(0.85^2-0.75^2))=34
若充许一次失效,在90%的置信度下,需要测试的时间为:Ttest=A*MTBF ,A的计算同上用EXCEL计算,即:A=0.5*CHIINV(1-0.9,2*2)=0.5*CHIINV(0.1,4)=0.5*7.78=3.89;
所以要求的室温下的测试时间为:Tu=3.89*20000=77800H;
换算后,在高温下的测试时间为:Ta=778000/AF=2288Hrs;
最后,测试方案就是:将10台设备在75℃、85%的下进行228.8Hrs的测试,如果失效次数小于或等于一次,就认为此产品的MTBF达到了要求。
还有一种情况就是,不知道Ea,公司内部以前没有数据、行业也没有推荐使用的具体值。此时就只能近似估计。具体方法如下:在三个高温(t1,t2,t3, t1 实际工作中,没有那么样品,只能用最少的样品数:9台(每个温度下各三台)。具体做法是:
a.取三台设备在高温T下运行,观察产品的失效情况。若产品较快失效,则取t1=T,t2=t1-15℃,(1/t3)-(1/t1)=2((1/t2)-(1/t1));若产品长时间没有失效,则取t3=T,t2=t3+15℃,(1/t3)-(1/t1)=2((1/t2)-(1/t1))。
b.根据三个温度点对应的产品寿命时间,计算出此产品的Ea。
上面的方法对元器件都比较适用,对一些系统,可能就不太合适了。
2、基本MTBF的计算
因为MTBF是一个统计值,通过取样、测试、计算后得到的值与真实值有一定的差异;而且具体到每个产品时,其失效间隔时间与MTBF又有一定的差异,又有置信度的概念,这样您的计算值与客户的要求高出一些(如多出1个数量级),就可以接受。如客户要求产品的MTTF为20年,我们计算出来为100年,是可以接受的,如果计算出来刚好是20年,反而让人觉得是不是用不到20年。如何计算产品的MTBF,这里给出两个我用到的方法。
一个日本客户要求我们的“光隔离器”(一种用在光路上的不可修复的元器件,只能让光顺行而不能逆行,相当于电路上的二极管)的产品寿命为20年,我们进行了如下动作。
第一步:找到计算公式;我们使用Bellcore推荐的计算公式:MTBF=Ttot/( N*r);
说明:N为失效数(当没有产品失效时N取1);r为对应的系数(取值与失效数与置信度有关);
Ttot为总运行时间;
第二步:找到可靠性测试的数据;我们直接采用我们做过的“高温高湿贮存”的结果:11个样品在85%RH、85℃下贮存2000Hrs时没有失效发生;
第三步:找到对应的激活能(Ea);我们采用Bellcore推荐的Ea,为0.8eV;
第四步:计算在温室下的运行时间;
①因为没有样品失效,所以N=1;
②r取0.92(对应60%的置信度)或2.30(对应90%的置信度);
③光隔离器在室温下运行,相当于40℃/85%的贮存;
④Ea为0.8eV,计算得到从85℃/85%到40℃/85%的加速倍数为42;
⑤60%的置信度下,MTBF=Ttot/(N*r)=(11*2000*42)/(1*0.92),结果即为114年;
90%的置信度下,MTBF=Ttot/(N*r)=(11*2000*41.6)/(1*2.30),结果即为45年;
从上面的计算可以看出,此计算用到了两个条件:进行了高温高湿测试、产品对应的激活能取0.8,这两个条件在Bellcore里、针对光隔离器的文件1221中有推荐使用。很多时候,因为测试时间太长(如1000H、5000H等)没有进行、激活能难以确定用多少才合适,所以不可直接计算,需要进行一些相关的测试。
取9个样品,分三组,分别在85℃、105℃、127℃下运行,运行过种中“在线监测”产品性能(虽然产品本身有很多参数要测试,在我们的测试中取最主要的参数IL监测,光通信业认为当产品的IL变化量超过0.5dB时就认为产品Fail)。实际测试中,产品在127℃下运行很快Fail,当产品在105℃下运行Fail,停止了测试,各种数据如下表:
从上表可以看出:
①在600H时,第二组样品中2个出现Fail,测试停止;
②在127℃时,产品的寿命为400H,即(300+500+400)/ 3;
③在105℃时,产品的寿命为895.5H,即(800/0.4467)×0.5;
说明:产品在105℃下800H时,并没有全部失效,不能像127℃那样直接算出,只能用“线性外延”来计算,虽然不是很准确,但可以接受。因为800H时变化0.4467dB,所以变化量达0.5dB时总运行895.5H;
④同理在85℃时,产品的寿命为3870.2H;
⑤将Arrhenius 公式两边取自然对数得到:Ln(Life)=(Ea/k)*(1/T);T温度下对应的Life满足上述公式,把②③④三点中的温度和寿命,按(X,Y)的形式,X =1/T、 Y =ln(life),得到相应的三点(0.002793,8.26126)、(0.002646,6.797407)、(0.002498、5.991465);
⑥将第⑤步中的三点在EXCEL中作图,将对应的曲线用直线拟合、交显示公式得到直线的斜率为7893.0;也就是(Ea/k)=7893.0,故Ea=0.68eV;
⑦故产品在常温25℃(对应的1/T=0.003356)时寿命为:(105℃时的寿命)×(105℃对25℃的加速倍数);当(Ea/k)=7893.0时,105℃对25℃的加速倍数为272。
⑧故25℃时产品寿命为272*895.5/356/24=27.8 (年)。
⑨故产品失效率为10E9/(272*895.5)=4103 FIT.
上面的计算过程有很多地方可以讨论:
①第一种方法有很多优点:Ea的取值是Bellcore推荐的值(目前整个业界都不会疑问)、数据由11个样品做同一种测试得到(比3个样品更有说服力)、11个样品没有Fail(这说明实际值比计算出来的值还要大,更让人信服)、考虑了置信度;
在第二种方法里:
②样品数据较少,每组只有3个样品,随机性较大;
③中温、低温时产品没有达到寿命时间,以平均值“外延”代替,误差较大;
④取到三个点时,用直线拟合,带来很多误差;
⑤计算25℃度时的寿命,用“85℃时的寿命”与“加速倍数”相乘,而这两个参数都有误差;
但是,在什么都没有(以前的测试数据没有、激活能用多少也没有)的情况下,用上面的计算也算是一种方法,可以用来回复客户,一般客户都不会“较真”。
最后介绍另一种计算方法。此方法是在常温下运行产品,记录每次故障发生的时间,然后套用寿命模型、选择最好的一种来计算。(我没有用过,只好将书上的例子Copy下来)。
在常温下,对100个产品做测试,当出现10次故障时停止测试。10次故障的时间为:268、401、428、695、725、738、824、905、934、1006小时。求此产品的MTBF。
第一步:求F(t),即产品的累积失效率(CDF)。这里用这样的方法:
①第一次失效的F(1)=(1-0.3)/(100+0.4)=0.006972;
②第二次失效的F(2)=(2-0.3)/(100+0.4)=0.016932;
③第三次失效的F(3)=(3-0.3)/(100+0.4)=0.026892;
其它类推(分子为:失效次数-0.3;分母为:样品数+0.4)。
第二步:求Ln(1/(1-F(t)),即第一步求得的F(t)代入Ln(1/(1-F(t))计算出数据。如:
①第一次失效的Ln(1/(1-F(1))= Ln(1/(1-0.006972)=0.006997;
②第二次失效的Ln(1/(1-F(1))= Ln(1/(1-0.016932)=0.017077;
③第三次失效的Ln(1/(1-F(1))= Ln(1/(1-0.026892)=0.027261;
其它类推;
第三步:套用公式。不同产品有不同的寿命分布模型,如正态分布、威布尔分布等等。
1、套用正态分布;
①根据正态分布公式1-F(t)=EXP(-λt),变换后得到:Ln(1/(1-F(t))=λt;
②将第二步中求出的Ln(1/(1-F(t))作为y,将每个故障发生的时间t作为x,组成坐标点(x,y),如(0.006997,268)、(0.017077,401)、(0.027261,428)等,将10个点以EXCEL作图;
2、套用威布尔分布;
①由威布尔公式1-F(t)=EXP(-(t/m)^n),变换后得到:Log(ln(1/(1-F(t)))=n*log(t)-n*log(m);
②将第二步中求出的Ln(1/(1-F(t))作为Y,将每个故障发生的时间t作为X,取y=logY, x=logX,组成坐标点(x,y),将10个点以EXCEL作图;
3、套用其它分布;方法同上,先找出对应的公式,再变换,再作图;
第四步:观察与计算;查看第三步中作的图。
①找出哪一个图的10个点看起来最有线性关系,并选定“最直”的那一图;
②将“最直”的那个图用直线拟合,找出直线的斜率k、截距b;
③若是正态图最直,则MTBF=1/k;若是威布尔图最直,则由k,b计算出m,n,MTBF=m*Γ(1+1/n);
说明:1、此种方法可以较准确地计算出产品在常温下的MTBF。
2、若常温下产品MTBF很长,也可以用这种方法先计算85℃、105℃等高温下的MTBF,再通过计算激活能后计算出常温下产品的MTBF