导图社区 可靠性工程师
可靠性工程师的思维导图,可靠性是组织的永恒目标,可靠性设计是把产品的强度设计的足够大,整个使用过程中始终大于所有可能的应力及组合。
编辑于2023-10-20 08:48:20可靠性工程师
0. 绪论
1.产品质量的时间特性
特性定义:可以区分的特征
物理:尺寸、店、化学
感官:五官感觉
人因功效:用起来很爽不?
功能:最高速度,最大高度
功能和性能 产品的技术要求 专有质量特性 确定的特性 物理空间独立存在 可测量 产品不同,参数不同
行为:礼貌、诚实
时间:准时性、连续性
不能在物理空间独立存在 度量产品专有特性与时间的关系
度量方式
可靠性
维修性(补充可靠性,同时考虑维修过程中和后的安全性)
保障性(功能之一是提供维修保障)
测试性(是维修的基础,要先测试,再隔离故障,再维修)
安全性(最重要)
环境适应性(最先考虑)
六性
2.六性与相互关系
可靠性:规定条件、时间内完成规定功能
通用质量特性
不可修复产品
失效前平均时间MTTF
可修复产品
平均故障间隔时间MTBF
失效事件是随机事件,不确定的 可靠性定量是一个统计量
测试性:及时准确的确定状态,并且隔离内部故障的能力
(能不能工作,性能有没有变化)
通用参数故障检测率
通用参数故障隔离率
保障性:产品的设计特性和计划保障资源满足平时备用或使用要求的能力
使用保障
维修保障
体现在质量时间的“快速”
维修性:规定条件、时间,按照规定程序方法维修,保持或恢复到规定状态的能力
预防性维修
二者都用平均修复时间衡量(MTTR)
修复性维修
维修时间越短,维修性越好
安全性:不致人伤亡,装备损坏,危害健康、环境、财产损失的能力
整个生命周期不发生危险的安全事故
环境适应性:寿命周期内可能遇到的各种环境作用实现预定功能,不被破坏的能力
规定寿命周期内的专有质量特性不因环境效应影响引发故障
质量客体:可以感知或想象的事物
质量定义:客体的一组固有特性满足要求的程度
产品
服务
过程
人员
组织体系
资源
质量优秀的产品
优良的功能和性能
优良的时间特性
尽可能长的保持合格水平时间
尽可能短的维修时间
尽可能发现和隔离故障
尽可能快速提供使用保障和维修保障
寿命周期不发生安全事故
寿命周期不因为环境变化发生故障
只有这6条路
1. 可靠性概论
1.可靠性的重要性
可靠性是组织的永恒目标
民用产品不可靠不是享受,是受罪
顾客不满意会影响潜在客户
改进总体业绩是组织的永恒目标
组织追求高质量目标是永恒的主题
重要性原因
武器可靠性是发挥作战效能的关键,民用可靠性是用户满意的关键
产品可靠性与国际先进水平差异影响国际竞争
产品可靠性影响企业盈利
维修率对维修服务费成本的增加
维修上门服务费
下一个时间段更值钱,不是当前值钱
避免召回,损失巨大
影响企业品牌形象
品牌是好评的代称
性能好坏只是一个因素
抱怨和维修影响继续购买
抱怨的根源是故障
好评价影响5位潜在,差评影响20位
产品先合格然后进一步提高可靠性
忽视可靠性会流失客户,没有品牌价值
实现制造大国走向强国
来料加工,利润有限
独立设计和开发才是发展途径
要考虑可靠性问题
知其然要知其所以然
2.可靠性发展概况
发展重大变化
重视性能,轻视可靠性==》树立可靠性与性能、费用、进度同等重要的观念
分散部门管理、负责==》统一领导,大领导直接带头
电子管==》集成电路,可靠性每年增加20%
电子设备可靠性研究==》重视机械、光电、非电子设备
硬件可靠性==》软件可靠性,从而确保大型复杂系统的可靠性
宏观估算==》微观分析计算
手工定性分析==》计算机辅助定量分析
可靠性统计试验==》可靠性工程试验,用环境应力筛选暴露故障,提高可靠性
单个参数指标==》多个参数指标体系
固有值==》使用值
3.可靠性基本概念
可靠性:规定条件、时间内完成规定功能
产品质量需要管理
从“符合性质量”发展到“适用性质量”再发展到“满意性质量”
能用==》够用==》用的好
产品质量包含可靠性、维修性等六性
按寿命周期划分质量
研发过程的“设计质量”
设计阶段
定型阶段
可靠性设计、分析、试验、评价
生产过程的“制造质量”
按照制造和验收的规范,管理一致性和稳定性,关注合格率
顾客使用“表现质量”
关注合格水平的保持时间
每20年会重大变革一次质量管理的方法
可靠性研究的主题是为什么会发生故障
设计阶段就要考虑零部件退化性、环境变化性、误操作、安全性
着眼于提高出厂后的合格水平保持能力
设计质量是免费的,减少外部损失和售后成本
生产质量只是执行的好
可靠性工程
研究产品缺陷或故障发生发展规律,进而解决、预防、纠正的学科
工程实践类学科
与故障做斗争,跟与疾病做斗争一样
数学被用来描述规律和评定可靠性
可靠性是设计、制造、管理出来的
是在长期斗争中建立起来的
可靠性工程的五个过程
预防:是最重要的一步核心
第一次就做对,有成熟的技术和方法,应用并行工程落实到图纸上
建立可靠性模型
可靠性分配
可靠性预计
故障模式
影响及危害分析
故障树分析
潜在分析
电路容差分析
制定可靠性设计准则
零件与原料选择和控制
确定可靠性关键产品
确定测试、包装等辅助活动对可靠性影响
有限元分析
耐久性分析
发现
发现要尽早
故障模式
影响及危害性分析
故障树分析
可靠性评审
环境应力筛选
可靠性研制试验
可靠性增长试验
纠正
要及时,发现不是目的,纠正才是
建立故障报告
分析和纠正措施系统
对产品可靠性增长进行有效管理
技术问题五归零
定位准确
机理清楚
问题复现
措施有效
举一反三
管理过程五归零
过程清楚
责任明确
措施落实
严肃处理
完善规章
验证
要有效,避免小改出大错,牵一发动全身
可靠性鉴定试验
可靠性验收试验
加速寿命试验
成败型分布试验
指数分布试验
其他国家标准
可靠性管理
制定管理计划
制定工作计划
承包方监督与控制
可靠性评审
建立故障报告、分析、纠正系统
建立故障审查组织
可靠性增长管理
4.故障及失效的基本概念
故障与失效
故障:可以修复:生病
失效:不可以修复:死亡
故障模式:故障表现形式
短路
漏油
断裂等
故障原因
设计
制造
使用
维修
过程中造成故障的因素
故障分类
单点故障:发生了就干不了活
间歇故障:发生了休息一下继续
渐变故障:老化了,坏了
独立故障(原发故障):某零件自己坏掉了
从属故障(诱发故障):因为其他零件坏了影响到这个了
系统性故障:本身的缺陷,必须前端解决
偶然故障:没做好,偶发的
早期故障:一开始就有问题,概率性的,初期爆发出来,后面就没了
耗损故障:一开始没事,越来越拉胯
关联故障:在操作规程之内出故障了
非关联故障:在操作规程之外,乱搞出故障了
责任故障:包含关联故障,也指用了我的产品出故障了(官方备品)
非责任故障:包含非关联故障,也指不用我的产品出故障(非官方备品)
灾难故障:人员伤亡,重大损失
严重故障(致命故障):规定了任务,没法完成了,造成损失
5.产品可靠性度量参数
可靠性相关概况
产品可靠性是产品质量的一个重要组成部分
可靠性技术是一门独立学科
电子产品==》机械和非电子
硬件可靠性==》软件可靠性
度量概念:可靠度,概率性度量
产品划分
可修复产品
不可修复产品(一次性产品)
可靠性的三个规定
规定条件:条件越恶劣,可靠度越低
规定时间:工作时间越长,可靠度越低
规定功能:是判断故障的依据,要明确规定功能和故障判定标准
可靠性的两个维度(剖面)
寿命维度:按制造到寿命结束时间线,整个时间线包含多个任务维度
任务维度:完成规定任务经历的事件、环境、时序、故障或完成的判定准则
产品能力
完成功能的能力,用概率衡量
可靠性分类
固有可靠性:理想情况下的可靠性
使用可靠性:实际使用情况的可靠性
基本可靠性:全寿命周期内的可靠性,要维修,保养,提供资源,考虑所有的任务
任务可靠性:但任务周期内完成功能的能力
可靠性与产品性能的关系
产品性能
确定概念
不断重现
可以直接测量
传统学科
可靠性
不确定性概念
发生时间、发生部位,发生形式、影响程度都不确定
大量随机事件的规律性
通过分析大量事件找到缺陷和薄弱环节
6.可靠性要求确定
可靠度(Rt):能保证百分之多少到达寿命周期
累计故障分布函数(Ft):随着时间的推移,从开始到寿命周期结束,开始0%的故障率一直到100%故障率,构成一条曲线
故障密度分布函数:对(Ft)求导,用途没懂
可靠度的度量参数
可靠度:灯泡保修10年,到期100个坏了3个,97%的可靠度
故障率:设定间隔时间,统计坏了几个
平均失效前时间
平均故障间隔时间
平均严重故障间隔时间
可靠寿命:可靠度随着时间推移下降,构成曲线
储存寿命:保质期
使用寿命:必须大修或者报废的期限
首次大修(翻修)期限:设备要保养的周期
7.产品故障率浴盆曲线
故障期特点
早期故障期:使用初期,设计、生产中的缺陷暴露出来造成故障
偶然故障期:平稳使用状态
损耗故障期:老化磨损导致故障率上升
电子产品基本是一条直线,故障率极低
可靠性工程的任务
改变曲线为直线
消除早期故障
延长偶然故障期
降低偶然故障率
预防性维修降低延缓故障率增加
推迟损耗故障期
产品可靠性要求
产品要求
产品可靠性要求是产品要求的一个组成部分
产品可靠性要求指导了可靠性设计、分析、试验、考核的依据
分为定性和定量两种要求
可靠性的定性要求
简化
冗余
降额
采用技术
环境适应性
人机可靠性
可靠性的定量要求
可靠性参数
使用参数:对装备使用需求的参数,实际续航2.5小时
合同参数:对装备要求的参数,要求续航2小时
可靠性指标
目标值:期望达到的:谈买1万个无人机,希望只有10个坏的
门限值:必须达到的:谈合同最多接受30个坏的
规定值:合同中期望的:合同约定有15个坏的,超过了赔偿
最低可接受值:合同中必须达到的:合同规定最多20个坏的,多了合同解除
确定指标要注意的问题
确定寿命和任务剖面
明确故障判断依据和评价
明确可靠性指标验证方法
2. 可靠性数学基础
1.概率论
确定现象和不确定现象
不确定现象大多具有统计规律
随机现象:有统计规律的不确定现象
随机事件:随机现象的结果
随机试验:研究随机事件的试验
频率:进行随机试验的获得结果
概率:频率的稳定值,可以预测频率,多试验的频率就形成概率
随机变量:试验结果的每次的输入量
离散型:有限个量
连续型:给定或无限区间任意个量
2.离散分布
二项分布
不是成功就是失败,就俩结果,有限个输入量
泊松分布
无限个输入量或者20个以上输入量,概率<=5%
3.连续分布
正态
应用最广泛
分析磨损时效
分析生产是否符合要求
对称性
主要参数:均值,方差
对数
分散数据进行对数变换来集中
跨数量级的数据用对数正态分布拟合
半导体期间的可靠性分析
机械疲劳寿命分析
维修时间数据分析
指数
浴盆曲线偶然故障期的故障分布函数
只有一个变量,简单易用
数学上处理容易
适用范围广
可加性
指数分布无记忆,与工作时间无关
威布尔
最弱环节模型导出,典型就是链条寿命
故障率常数、递减、递增模型均可用
可以描述复杂失效过程
描述产品疲劳、磨损等耗损故障
4.点估计
用数理统计进行推断
用样本分析总体
点估计:用一个统计量的单一值估计一个未知参数的数值
点估计解析法
矩法:用于完全样本
最小二乘法
极大似然数
总体函数和样本数据进行对比,建立似然函数
一致性、有效性、渐进无偏性
方法复杂,需要计算机迭代
最好线性无偏估计
最好线性不变估计
有国标
简单线性无偏估计
不变估计
5.区间估计
区间估计:给未知参数估计一个参考范围,并了解区间内包含参数真值的概率
置信区间:计算估计的精确程度
置信限、置信下限、置信上限
未知参数可能存在的值范围
置信度:估计结果的可行性
置信度90%含义是有90%的可能性,参数处于置信区间
置信度与可靠度的区别
置信度是估计的概率值
可靠度是描述可靠性的实际值
双侧区间估计
双边估计,有上限,有下限
单侧区间估计
单边估计,只有上限或者下限
3. 可靠性设计与分析
概述
可靠性是设计出来的
出厂后出现缺陷说明设计有缺陷
预防为主的思想
失效主要是产品强度和载荷应力博弈的结果
强度:抵抗应力破坏的因素组合
应力:引起产品失效的因素组合
可靠性设计:把产品的强度设计的足够大,整个使用过程中始终大于所有可能的应力及组合
产品失效原因
使用环境应力分析估计不足
强度不够,失效发生
13个失效性分析的项目
理论方法成熟,有现成国家标准,需要实践改造
可靠性建模方法
对系统及组成单元的可靠性、故障逻辑关系的描述
包括可靠性框图和对应数学模型
分为基本可靠性模型和任务可靠性模型
建立模型的目的
明确各单元之间的可靠性逻辑关系及数学模型
利用定量分配和预计,发现设计的薄弱环节,改进
不同设计方案进行比较,为决策提供依据
建立模型的程序
明确产品定义
产品及单元构成、功能、接口故障判据等
功能框图描述产品功能和子功能之间的关系以及系统的数据流程
用功能流程图展示有时序的产品
绘制可靠性框图
以图的形式逻辑描述产品正常工作的情况
描述单元功能组之间的相互关系
充分了解产品的任务定义和寿命剖图
依据产品原理图和功能图确定可靠性框图
一个方框对应一个功能单元
建立可靠性数学模型
常用可靠性模型
模型划分
非储备模型
串联
尽可能减少串联单元数量,简化设计
提高单元可靠度,降低故障率
缩短工作时间
工作储备模型
并联
可靠度大于任何一个单元的可靠度
可以采用冗余技术,但是会增加费用、体积、重量
提高任务可靠性,降低整体可靠性
并联单元越多,提高速度越慢
应用在影响安全和关键任务的节点
表决
工作储备的一种形式
设定工作单元,低于此单元数,启用工作储备
桥联
非工作储备模型
旁连
有故障监测系统,发生故障再切换
大大提高系统可靠度
故障监测和转换系统增大了系统复杂度
基本可靠性和任务可靠性模型
基本
用于计算故障率或平均故障间隔时间
所有单元串联起来组成的模型
受恶劣环境影响要用最差的数据来计算
任务
可能是串联或各种模型组合
依靠任务可靠性模型,计算任务可靠度和平均致命性故障间隔时间
对不同任务剖面分别建立任务可靠性模型
要进行冗余设计需要先划分产品层次,建立产品的初始可靠性框图
利用任务可靠性框图建立数学模型再计算
建模要点
初步设计阶段就要进行,为产品设计提供依据
边展开设计边修改完善可靠性模型
用可靠度最低的数据进行分析
模型中包含不同任务单元的模型
提高单元可靠性的成本高于冗余则选择冗余
并联模型n>2,需要权衡
冗余尽量选择在较低层级的任务单元
并联模型提高单元可靠性,降低整体可靠性,增加成本,增加重量、体积、复杂度,要权衡
可靠性分配方法
分配的目的
明确各单元的定量要求
发现设计薄弱环节
对不同设计方案进行比较,为决策提供依据
作为可靠性实验与评估的依据之一
分配方法
评分分配法
特征及适用范围
主观因素多,方法成熟,应用广泛
缺乏可靠历史数据、可以用
时间以产品工作时间为准
要有经验的技术人员和专家
适用设计各个阶段
等效为串联模型
分配单元可以是零件、部件、分系统、元器件
评分因素和原则
复杂度
技术成熟度
重要度
环境严苛度
需要数据
任务书提供的故障率指标
任务书提供的平均故障间隔时间或可靠度指标
按高于最低可接受度的10%~20%进行设计分配,也可以更高
分配模型
A=A1*C,A是某单元的故障率,A1是产品故障率,C是评分系数
操作步骤
明确指标,分析产品特点,确定评分因素
请专家评分
数值相乘,确定系数
分配单元故障率
验算,假如不成功需要增加专家人数
比例组合分配法
特点
方法简单,需要参考历史数据
需要历史数据的充分性,并且有故障数据
适用于论证、方案形成阶段
等效为串联模式
需要数据
新产品故障指标
相似老产品故障指标
相似老产品的各单元故障率或故障数百分比
分配模型
A=A1*K,A是某单元的故障率,A1是产品故障率,K是分配比例系数
操作步骤
明确目标
计算比例系数
已知故障率:单元故障率/基本故障率
已知故障数:K=Ri/sum(R)
已知故障百分比:直接用K
按模型分配
验算,如果不合格返回第一步
考虑重要度和复杂度分配法
应用多,计算量小
需要各单元复杂程度,重要程度,工作时间
适用于方案和初步设计阶段
直接分配法
满足约束条件的寻优过程,计算量小,可以得到相对最优解
约束条件多
适合初步设计
分配要点
研发早期进行,设计人员可以尽早知道,外购外协人员可以做准备
减少可靠性分配重复次数要留安全余量
并联转串联再分配
成熟产品或已知可靠性指标,直接用,不用分配了
根据专家评分高低做出相应对策
环境严苛度高,要加强耐环境设计
单元技术成熟度高,需要多验证,保证成熟
分配程序
明确参数和指标
选择可靠的分配方法
进行分配,发现薄弱环节
确定分配结果是否满足要求
可靠性预计方法
估计产品在给定工作条件下的可靠性而进行的工作
根据组成产品的单元可靠性推算产品是否满足要求
可靠性预计目的
将预计结果与要求指标作比较,看能否达到要求
方案选择阶段进行对比,优化方案
研制阶段通过预计发现薄弱环节加以改进
为可靠性增长试验、验证、费用核算提供依据
为可靠性分配的合理性提供依据
评分办法
评分预计法
专家打分
元器件计数法:早期
电子产品研发初步阶段,电子元器件数量和类型已经大致确定,具体工作应力和环境尚未明确
需要数据
所用元器件种类
元器件数量
元器件质量等级
产品工作环境
预计模型
累加故障率
操作步骤
确定数据
根据数据查阅预计手册找到通用故障率、通用质量系数
计算单元总故障率
应力分析法:中后期
电子产品详细设计阶段的故障率分析
需要数据
元器件种类
元器件数量
元器件质量等级
元器件工作环境
元器件使用应力
预计模型
操作办法
明确数据
计算元器件故障率,根据国标获得各类元器件故障率的计算模型及修正系数
同类元器件故障率相加
各类元器件故障率相加
相似产品法
特点
利用成熟的相似产品经验数据估计新产品可靠性
预计速度快,方法简便直观
标准手册中没有数据尤其是非电产品,适合该办法
预计精度取决于历史数据和现状产品的相似度
相对系统级,更适用单元级可靠性,主要是研制初期,但是全过程可以用
相似性分析
性能相似性
设计相似性
制造相似性
寿命剖面相似性
所需要数据
可修复产品用历史数据的故障率
不可修复产品用历史数据可靠度
成熟的相似性产品可靠性来自现场结果和实验室试验
预计模型A1=A*K, K叫相似系数
操作步骤
相似性分析
计算相似系数
获取历史数据
计算新故障率或可靠度
工程要点
功能设计与可靠性设计同步进行,可靠性设计逐步深入,与功能设计进度保持一致
电子产品更新换代快,历史数据不能保证足够参考价值,可靠性预计绝对值与实际值相差几十倍也有,但是相对值具备参考意义用于选择不同方案
可以发现设计中薄弱环节用以改进
各种方法,只要相似性的历史数据完整,那么优选相似性,更贴近实际
可靠性预计的一般程序
明确任务指标,可靠度、故障率等
选择可靠性预计方法
进行可靠性预计
确定预计结果是否满足要求,如果满足,完成预计,不满足返回第三步
潜在失效模式影响及危害分析
FMECA (fault modes, effects and criticality analysis)失效模式、影响及危害分析
FMECA
FMEA:故障模式及影响分析
DFMEA:产品设计失效性分析
以严密的形式总结了设计一个零部件、子系统、系统时,设计团队的设计思想,并规范化、文件化
支持设计过程的几个方面
对设计要求和设计方案进行客观评价
有助于制造、装配、服务、回收的最初设计
有助于考虑潜在失效模式对产品可靠性的影响
全面有效的设计试验和开发项目策划提供更多信息
根据潜在失效模式对顾客影响程度进行分级,进而建立一套设计改进优先控制程序
提供一种公开讨论形式:建议和跟踪降低风险的措施
为将来分析研究售后市场情况,评价设计更改及展开更先进设计提供参考
小组活动,由负责设计的工程师协调各个部门
形成跨部门交换意见的催化剂,提高协作水平
要形成动态文件,在概念设计阶段就开始
不靠过程控制克服缺陷,要考虑制造、装配过程的限制
国内标准 GJB/Z 1391-2006 (军工)
功能FMECA
硬件FMECA
分析失效模式、原因、影响 找出薄弱环节,提出改进和补偿措施
嵌入式软件FMECA
ISO9000(民用)
美国汽车厂商标准 ISO16949
功能及硬件DFMEA的实施步骤
系统定义(分析对象定义)
分析对象是前提
尽可能对被分析产品进行系统、全面、准确的定义
为任务功能分析
现有产品任务
制作任务剖面
每个任务的主要功能、工作方式(连续、间歇工作)工作时间进行分析
充分考虑产品接口分析
绘制框图
功能框图
产品各组成部分承担的任务
功能之间的相互关系
产品每个约定层次之间的功能逻辑顺序、数据信息流、接口
任务可靠性框图
描述产品整体可靠性与组成部分可靠性之间的关系
不反应功能关系
表示故障影响的逻辑关系
产品有多项任务或多个工作模式,分别建立任务可靠性框图
故障模式分析
从被分析产品的功能描述、硬件特征、故障判据要求中找出所有可能的功能或硬件故障模式
获取方法
以历史数据按照使用环境异同进行分析,判断新的故障模式
新开发产品根据功能原理、结构特点进行分析、预测,借鉴相似功能的其他产品判断故障模式
进口商品向外商索取故障模式,以相似功能和相似结构的产品曾经发生的故障模式为基础,分析判断可能故障模式
常用元器件,应用公开标准,找到故障模式
故障原因分析
分析故障模式的根本原因,可能一个故障有多个原因
分析故障原因的两个方面
导致产品功能故障或潜在故障的产品设计、制造缺陷(直接原因)
外部因素,人为、产品、试验、使用、环境等因素引起故障(间接原因)
区分故障模式和故障原因
故障模式:外在表现
故障原因:内在缺陷
故障模式有可能是上一层次的故障原因导致的,所以要从相邻层次进行原因分析
故障影响及严酷程度分析
故障影响:故障模式对产品自身或其他产品的使用、功能、状态、经济的影响
故障影响分析该故障模式对该产品所在相同层次和更高层次产品的影响
故障影响分类
局部影响:影响自身层次
高层次影响:影响上一层次
最终影响:对初始约定层次产品的影响
严酷度(严重度)根据故障模式最终影响的严重程度确定的
采用冗余设计的产品只考虑最终影响,根据最终影响确定严重度水平
严酷度分类
灾难性的:1类:引起死亡或产品毁坏,重大环境损害
致命性的:2类:引起人员重大伤害或重大经济损失,导致任务失败,产品严重损坏,严重环境损害
中等的:3类:引起人员中等伤害,中等程度经济损失,任务延误或降级,产品中等损坏,中等环境损伤
轻度的:4类:人员轻伤,轻度经济损失,产品轻度损坏,环境轻度危害,产生非计划性维修和保养
故障检测方法分析
分为事前和事后两种监测
检测方法
目视
原位测试
离位检测
检测手段
机内测试
自动传感
传感器
音响报警
显示报警
遥测
有些没有办法检测的,在FMEA表格中填写“无”并提醒设计人员予以关注,必要时可以提供不可检测故障模式清单
根据需要增加检测点
设计改进与使用补偿措施分析
设计改进:采用冗余设备在故障发生时候进行保障
补偿措施:发生故障,操作人员应该采取的最佳补救措施
功能及硬件FMEA实施
主要是按规范填写表格
约定层次指的是根据分析的需要按产品功能关系或组成特点划分的产品功能及结构层次
初始约定层次是指单次分析的最高层次
初始约定层次不同,要使用不同的表格
约定层次产品
PFMEA:过程失效性分析
目标是减少风险优先数(RPN)
特点
用于产品生产过程中的工艺设计
需要结合质量管理行业的工具方法
研究对象是如何保证工序工艺对产品的要求的实现性
分析和发现不同方案可能存在的对出厂后故障的影响
发现薄弱环节,分析原因、后果进行改进
实施步骤
系统定义(分析对象定义)
功能分析
绘制工艺图
工艺流程表:各工序的工艺流程及功能要求
工艺关系矩阵:零部件特性与工艺操作各工序的关系
工艺故障模式分析
不满足工艺、装配的要求,可能会引起下一步故障,也可能是上一步故障的后果
工艺缺陷不考虑设计缺陷
工艺故障原因分析
调查工艺故障为什么会发生
工艺故障影响分析
对下一道工序的影响:影响工艺特性
对组件影响:影响任务单元特性
对系统的影响:影响产品特性
风险优先数分析
RPN反映了工艺故障发生后的危害性
RPN=S*O*D
S:严酷等级
轻度:1、2、3
中度:4、5、6
致命的:7、8
灾难的:9、10
O:发生概率等级
极低:1
较低:2、3
中等:4、5、6
高:7、8
非常高:9、10
D:被检测难度等级评分
10. 无法被探测
9. 现行技术无法检测,推荐间接方式
8. 现行技术微小机会检测,推荐目视
7. 现行很小机会检测,推荐双重目视
6. 现行方法可以检测,用现行办法
5. 现行方法基本上可以检测,离开工序后用量具检测
4. 现行方法较多可以检测,后续工序进行误差检验,或者装配前测试
3. 现行方法很可能检测,可以当场检测,后续检测,不接受缺陷
2. 现行办法几乎可以全部检出,当场检测,缺陷不通过
1. 现行办法可以全部检出,设计防呆,不会产生缺陷
改进措施
围绕SOD三个参数进行改进
无法改进的要在表格中填写“无”
RPN值的预测和跟踪
制定措施后要跟进更新SOD三个参数,计算RPN是否符合要求
PFMEA实施:用表格进行填写
CA:危害性分析
评估每一个失效模式发生的概率和危害程度
全面评价所有的失效模式
分析方法
评分排序法
对每一个故障模式的评分值进行排序,并采取响应措施,使得评分值降低到可接受水平
评分值C=ESR(严酷度评分等级)*OPR(发生概率等级)
改善方法就是降低这两个参数从而降低故障风险评分
ESR(严酷度评分等级)
轻度:1、2、3
中度:4、5、6
致命的:7、8
灾难的:9、10
OPR(发生概率等级)
极低:1
较低:2、3
中等:4、5、6
高:7、8
非常高:9、10
危害性矩阵法(定性)
不能获取产品故障数据用定性法
参考图表划分等级
A级:经常发生:高概率:>20%
B级:有时候发生:中等概率:10%~20%
C级:偶尔发生:低概率:1%~10%
D级:很少发生:概率极低:0.1%~1%
E级:极少发生:近乎为零:<0.1%
危害性矩阵法(定量)
绘制危害性矩阵图
危害性矩阵图应用
实施:填表追踪
系统化的活动目的
发现和评价产品过程中的潜在失效和失效后果
找到减少避免潜在失效的措施
将这些工作文件化
设计过程完善化
适时性,要在设计过程之前开始进行
事前对产品/过程进行修改,减少事后修改危机
要有充分的沟通与整合
ISO9000的FMEA分析
FMEA编号:唯一文件编号用于文件控制
系统、子系统、零部件名称及编号:工作对象
设计责任:有责任的个人或单位
年度项目:预期的项目类型如2025年要上市的某型号
关键日期:初次预定完成FMEA的时间
FMEA日期:原始稿及修订稿日期
核心小组:负责FMEA的小组成员
编制人:负责表格维护的人员
项目及功能:描述项目的全部功能
功能要求:每个功能对应的量化要求,多个要求要单独列出
潜在失效模式:可能是高一级的原因,也可能是低一级的后果
潜在失效后果
内部顾客或外部顾客不满意的结果
影响安全或与法规不符的结果
按照部件、子系统、系统进行分析,他们之间也有一定的影响关系
严重度
通过设计变更改变严重度
评分规则
10. 失效时候没有预警,但是不符合安全和法规
9.失效时候有预警,但是不符合安全和法规
不合法,绝对不允许
8.基本功能丧失
7.基本功能降低
基本功能丧失或降级,很严重
6.次要功能丧失
5.次要功能降低
次要功能丧失或降低,要关注
4.顾客群体75%抱怨,但是不影响使用
3.顾客群体50%抱怨,不影响使用
2.顾客群体25%抱怨,不影响使用
其他功能不良要改善
1.没有识别
分类:根据特性分类
关键
重要
一般
潜在失效起因、机理
失效起因:设计弱点的表象
失效模式:失效的现象,设计弱点(起因)的结果
一种失效模式可能有多重起因
针对起因聚焦分析,引出不同测量、控制、措施、计划
发现制造的问题要转用PFMEA
失效机理:物理学原因,工程学原因,区服、断裂、疲劳等
失效调查:聚焦在失效模式进行调查起因和机理
频度
频度特点
某一特定失效起因/机理发生的可能性
描述频度级别数重点在含义,不是具体数值
用更改设计来降低频度级别数
频度级别数是一个比较等级
无法反映真实情况,是一种预测
通过对比选择优化方案
频度评分办法
10. 失效率10%,应用新设计、新技术
可能性非常高
9. 失效率5%,应用新设计新技术、或操作条件变化,无法避免失效
8. 失效率2%,应用新设计新技术、或操作条件变化,很可能发生失效
7. 失效率1%,应用新设计新技术、或操作条件变化,不一定发生失效
可能性高
6. 失效率0.2%,类似设计或模拟设计测试中经常失效
5. 失效率0.05%,类似设计或模拟设计测试中偶尔失效
4. 失效率0.01%,类似设计或模拟设计测试中较少失效
可能性中等
3. 失效率0.001%,只有在测试中发生失效,也就是理论上的可能性
2. 失效率0.0001%,测试中都观察不倒失效,也就是理论上失效的可能很小
可能性低
1. 通过预防完全消除
可能性极低
现有设计控制
设计控制:已经用于相同设计或相似设计的方法进行应用、改进
两种设计控制方法
预防:
预防起因、机理的发生,减少失效模式的出现,降低频度(优先措施)
基准研究
自动防故障设计
给出内外部的设计和材料标准
给出准则、记录、教训
模拟研究、确定设计要求的概念分析
防错设计
探测:
项目投产前,应用解析或物理的方法,发现失效
设计评审
原型试验
验证试验
模拟研究,设计验证
设计试验,包括可靠性试验
类似零部件模型参考
探测度
发现潜在失效模式的可能性
10. 现有技术无法发现,几乎不可能探测到
没有探测机会
9. 设计机制只有极少机会发现起因和机理及后续失效模式
多数阶段无法探测
8. 设计机制只有非常少机会发现起因和机理及后续失效模式
7. 设计机制只有很少机会发现起因和机理及后续失效模式
6. 设计机制只有较少机会发现起因和机理及后续失效模式
快速冻结设计,预先投放
5. 设计机制只有中等机会发现起因和机理及后续失效模式
4. 设计机制只有中上机会发现起因和机理及后续失效模式
3. 设计机制只有较大机会发现起因和机理及后续失效模式
预先冻结设计
2.设计机制很大机会发现起因和机理及后续失效模式
实质性分析相关因素
1.设计机制肯定能发现起因和机理及后续失效模式
不用探测,做好预防就可以
风险优先数:RPN=(1~1000),依靠数值进行关注排序
建议措施
严重度9以上要特别注意
对最终者产生危害的要考虑预防、纠正措施,
以排除、减轻或控制方法处置,避免失效发生
其他严重度的失效要尽量降低其严重度、频度、探测度
通过设计修改来弥补或减轻失效导致严重度
降低频度等级的措施
防错设计消除失效模式
修改设计集合尺寸和公差
修改设计降低压力
替代不耐用零部件
增加冗余
修改材料规范
降低探测度级别
防错装置
试验设计(DOE)
结果或可靠性试验结果
确定方案有效性,分析设计结果
设计评审的结果
给定工程标准或设计指南进行更改
可靠性分析结果
修改试验计划
责任和目标完成日期:负责执行措施的个人和组织以及计划完成时间
采取措施和生效日期:执行措施的时间和措施生效时间
估算严重度、频度、探测度,RPN:估算执行措施后的技术参数
动态维护FMEA文件
跟踪行动,及时反馈
FMECA工程的应用要点
重视
边设计、边分析、边改进
谁设计、谁分析
组成专家分析小组,发挥特长
规范
明确协作单位、个人职责、分工
统一规范、技术指导
跟踪效果
及时
在不同开发阶段及时展开FMECA工作
与设计工作同步
分析结果是设计的参考
分析、纠正是否及时决定了有效性
在产品开发评审的关键节点要发挥指导性作用
层次
各个层次之间有相互影响的关系
FMECA是一个自下而上的分析迭代过程
有效
改进措施要是有效的
措施要从设计和工艺上考虑,不是简单更换零件、维修
改进措施要进行可靠性、经济性分析
改进措施向上级汇报要容易理解,让上级决定是否采用
FMECA分析结果要补充到图纸、技术资料、标准文件、质量文件中
完整
尽可能覆盖到全部的潜在失效模式
不能不经分析就认为某些故障模式不重要
不能放弃分析,听之任之
RPN
降低三个参数
提高检测手段
关注高分值项目
法规
法规不允许的,严酷度最高
相对
SOD三个参数都是预测,没有绝对意义
SOD三个参数只有相对意义
用于比较具体不同失效模式的关注等级
失效树分析
概述
FAT(fault tree analysis)是一种倒立树状逻辑因果关系图
故障事件作为顶事件为分析对象
由上而下因果逻辑分析逐层找到故障事件的必要且充分原因
最终形成可能原因及原因组合
应用基础数据可以计算出顶事件发生概率和底事件重要度
FTA应用目的
产品设计同时应用FTA,发现薄弱环节
生产使用阶段应用FTA,帮助诊断故障,改进维修方案
FTA的特点
灵活性
不局限于对系统做可靠性分析
分析系统各种故障状态
分析故障对系统的影响
分析导致故障的原因
图形演绎
一种逻辑推理方法
围绕特定故障状态做深层次分析
清晰的故障树表达了系统的内在联系
零部件故障与系统故障的逻辑关系
找出系统薄弱环节
深入认识系统
把握系统内在联系
弄清各种潜在因素对故障发生影响的途径和程度
分析过程中发现问题
定量计算故障发生概率
定量计算故障发生率
为改善评估系统可靠性提供定量数据
故障诊断指南
FMECA自下而上的逻辑归纳法
从基本零件故障分析到最终产品故障分析
从故障原因分析到故障后果分析
FMECA本质上是单因素分析法,使用简单、针对单个故障分析
在反映对系统影响情况时候有局限性
FTA是自上而下的方法
从最终故障分析找到基本零件故障
从故障后果分析到故障原因
FMECA是FTA的基础工作
FTA 的优点是可以进行系统分析
先完成FMECA,再做FTA,数据准确,没有纰漏
任何阶段都能用
可以做研制设计分析,也可以做事故分析
故障树术语与符号
事件
顶事件:FTA研究的最终结果事件
底事件:没有输入的事件,只导致其他事件产生
基本事件:无需探明,显然的底事件
未探明事件:原则上要进一步探明,但是暂时不必或不能探明的底事件
结果事件:由其他结果导致的事件
顶部为顶事件
中部为中间事件
逻辑门
与:只有A才能导致B产生
或:ABC只要发生一个,D就产生
非:A不发生,B才能发生,A发生,B不发生
表决:A事件的n中有r个发生,则B发生
异或:ABC中只发生一个,D才发生
顺序与:ABC必须按照特定顺序发生,D才发生
禁:A事件一直在发生,B不发生,A不发生了,B才发生
转移符号
相同符号转出:A系统的01号事件转出到B系统的01号事件中去
相同符号转入
相似符号转出:A系统01号事件转出到结构相似,事件标号不同的01号子树中去
相似符号转入
FTA的操作步骤
准备工作
熟悉产品
确立目标
确定判据
确立顶事件
严格定义、一一确定
设计过程
显著影响产品技术性能
经济性
可靠性
安全性
FTA之前已经经过了FMECA
从严酷等级为1级和2级中选择
发生重大故障或事故后
建立故障树
用符号和逻辑门,将事件的逻辑顺序表达出来
演绎法和计算机辅助建树法,还有决策表法
演绎法
确定顶事件和原因事件
把顶事件与原因事件连接起来,逐级建立
一直到全部底事件建立
原因事件
硬件故障
软件故障
环境因素
人为因素
建立故障树的原则
明确建树边界条件,确定简化系统图
定义接口
给定合理假设
真实系统图得到一个主要逻辑关系的简化系统图
故障事件严格定义
各级故障严格定义
故障是什么
什么情况下发生
故障表现状态
从上向下逐级建树
从顶部事件开始
不断利用直接原因事件进行过渡
逐步无遗漏的将顶部事件演绎为基本原因事件
不允许门门互联
用直接事件逐步取代间接事件
为了向下建树
用等价、具体的直接事件逐步取代抽象的间接事件
可能有不含逻辑门的事件串
处理共因事件和互斥事件
共因事件:共同原因的故障事件
共同故障原因会引起不同部件故障甚至不同系统故障
互斥事件:不可能同时发生的事件
异或门变换处理
规范故障树,简化及模块分解
事件简化到只有底事件和结果事件,与或非只有这三种逻辑门,简化分解目的是减轻工作量
规范化
未探明事件作为基本事件或者删除
顺序与门变换成与门
表决门变换成或和与的组合
异或门变换成或、与、非的组合
禁门变换成与门
简化
去掉逻辑多余事件和逻辑多余门
相同转移符号表示相同子树
相似转移符号表示相似子树
模块分解
用模块和最大模块定义找出尽可能大的最大模块
单个模块构成一个模块子树,单独进行定性和定量分析
模块子树用一个等效的虚设底事件来代替,简化故障树
定性定量分析完成后,转化成顶事件和底事件的直接联系
故障树定性分析
割集和最小割集
割集定义:故障树中一些底事件的集合,这些事件发生时候,顶事件一定发生
最小割集:不能再去掉一个底事件的割集
分析方法
上行法:自下而上逐步进行事件集合运算
下行法:逐级向下巡查,找出割集
最小割集的定性比较
阶数越小的割集越重要
低阶最小割集中出现的底事件比高阶最小割集中底事件重要
阶数相同的最小割集,重复出现次数越多的底事件越重要
故障树定量分析
用底事件发生概率计算顶事件发生概率
底事件往往是相交的
最小割集太多了造成组合爆炸
计算底事件的重要度
底事件对发生顶事件的贡献:底事件重要度
重要度分析应用:改善设计,确定要监测的部位,制定故障诊断的核对清单
底事件概率重要度:底事件发生概率的微小变化导致顶事件发生概率的变化率
底事件相对概率的重要度:底事件发生概率的微小变化导致顶事件发生概率的相对变化率
薄弱环节分析及建议
确立底事件和最小割集
最薄弱环节确认
建议制定
可靠性设计准则
概述
与故障做斗争
可靠性定性与定量设计分析
定量分析需要大量数据,获取成本高
产品更新迭代影响获取数据时效性
依靠定性分析确定设计准则,提高产品可靠性
准则制定依据
历史数据,参考项目
国内外产业标准
用户和客户的要求
通用设计准则
简化设计
(合并消除)合并相似,消除不必要功能
(简单满足)满足功能,设计简单
(减层减量)减少产品层次和组成单元数量
(同功减量)减少执行功能一样或相似的零部件数量
(用标准件)优先用标准件
(用通用件)最大限度用通用件,减少品牌和品种
(通用互换)易损零件有好的通用性和互换性
(外购互换)不同供应商互通互换
(设变互换)产品设变不改变配合零件的安装使用
冗余设计
(简化加冗余)简化设计不能满足可靠性用冗余设计
(冗余效果好)条件允许,冗余最容易实现
(单点用冗余)单点故障用冗余
(硬件低,功能高)硬件冗余低层次,功能冗余高层次
(冗余切换)重视冗余切换装置的设计,考虑切换装置的故障对系统的影响,用高可靠性的
(共模共因)冗余设计考虑共模共因故障的影响
热设计
传导==》用导热系数大材料、加大接触面、缩短热传导路径、路径没有隔热材料
对流==》加大温差,加大流体接触面,加大介质流动速度
辐射==》发热体凃散热涂层,加大散热面积
耐热==》用耐高温材料,导线间隙足够,特定高温热源做特定防护
热流通道==》尽可能短,截面尽可能大
金属散热==》尽量用金属底盘或机箱
导热硅脂==》加大热传导面积和解除面积,提高表面精度,加大接触压力
器件安装==》安装方式保证最大热对流
热敏部件==》热敏部件装载热源背面,或隔离,或加上热屏蔽涂层
最大耐热==》温度不超过零件的最大耐热温度
热源散热==》确保热源有良好的散热性
玻璃散热==》玻璃是热的不良导体,加装散热系统和金属印刷电路板
导热系数==》多用导热系数高的材料
通风排气==》通风口尽量不在面板和顶部,进口出口位置有讲究
减噪降震==》减低气流噪音与振动,包括风机与设备箱之间的共振
适当屏蔽==》尽量用无刷电机驱动,用适当屏蔽的直流电机
总体设计准则
设计依据==》产品可靠性要求是设计可靠性的依据
确定应力==》根据寿命剖面、任务剖面确立载荷、工作模式、环境等应力条件
综合权衡==》性能、可靠性、维修性、安全性、经济性综合劝和
历史分析==》用相似产品进行分析,确定可以提高的目标和有效措施
安全分析==》与安全相关的,需要有消除措施
应急设施==》严重影响可靠性的装置要有应急设施
关键系统==》关键系统要进行冗余设计
高标设计==》发生故障后果严重,不好检修,不易发现的要采用高可靠性设计
系列设计==》在原产品上逐步扩展构成系列,优先用成熟方案,未验证不得使用
限制创新==》新技术应用不超过20%
优选器件==》依据元件可靠性制定优先选用清单
简化减少==》满足需求,设计简化,减少零件,减少规格
标准通用==》尽量用标准和通用零件
工艺可靠==》考虑用成熟可靠的工艺
人机工学==》噪声、振动、温度、照明、操作力度等要考虑操作人员感受
报警示警==》系统出问题了,要有报警装置
环境防护==》考虑多种应用环境的影响
极限环境==》要考虑使用的极限环境和产品自身造成的极限情况
阻燃隔离==》尽量用不可燃材料,要用就要与热源、火源隔离
防火灭火==》可能着火的器件要采用防火措施,万一着火要有自动灭火措施
高温防护==》通过高温区域要增加防护装置
接口可靠==》保证接口故障不会导致故障扩散
安装可靠==》防止安装不当造成的影响
支援可靠==》考虑生产支援以及各种辅助生产活动对可靠性的影响
电子设计准则
通用、系列、模块化
新技术要验证
电热应力分析,电子件降额使用
使用优选目录
按最恶劣环境进行设计
设计包装要考虑运输、储存条件
接口协调
独立子系统故障不影响其他子系统
软件、硬件标准化
简化设计,只用必要元件,不影响其他元件,不提高其他元件的性能要求
一种元件完成多个功能,要对所有功能进行验证
模块故障只影响自己,保护备份功能
降低线路复杂性,提高可靠性
各种措施达不到要求可靠性就采用冗余设计,权衡成本、重量、体积
元器件有编号,插接件有防错,安装方向有防呆
减少接头和端头
尽可能用固定的不是可变的元器件
电气接头要有保护,防止电弧
部分元件密封充氮,提高可靠性与寿命
极性保护措施,万一接错线,不会损坏
电缆成束,分路隔开
防止接触短路
考虑击穿电压、功耗极限、电流密度等限制因素
规定装配方法和程序,防止装配损坏
重要零件有耐久性设计
电子产品的结构件要有结构安全设计
防止线束被磨损,线束要良好支撑,不能滑落,有运动区域要保证线束不被干涉
机械设计准则
结构简单,组装简单,传力简单
灵敏度设计,考虑外界变化的影响
结构件控制应力
应力--强度优化设计
动载结构要进行动力响应分析、模态分析、动强度校核、可靠性分析
结构裕度设计,提高强度、降低应力、减少强度变化
防止结构失效的连锁反应,设计多重元件、多路传力、防止断裂措施
大型复杂结构刚度、可靠性设计,提高抗弯强度,承受峰值载荷
考虑公差和配合对可靠度影响
结构表面处理提高可靠性
严格控制结构的相对位置,考虑在静力、热力、动力下产生变形的影响
相邻结构有温差,考虑热变形引起的应力过载
恶劣环境的防护设计
提高抗针对、抗冲击能力
产品小型化,减小惯性
紧固件用系留式结构
紧固件机械防松
结构的组织纹路与受力方向的一致性
焊缝、接头的布置要考虑焊接应力和使用应力
结构的抗电磁干扰能力
结构防磨损和安全余量措施
易磨损位置采用耐磨材料和耐磨结构
设计防卡滞措施
防止运动惯性的冲击损坏,设计缓冲
连接件防止脆性断裂
考虑真空和低温环境的膨胀系数问题
尽量继承成熟技术,合理冗余
实施要点
开发单位根据产品特点制定设计准则
充分吸收历史和国内外的成熟经验及失败数据
可靠性与产品设计同步进行
分阶段落实可靠性考核,提供符合性报告
设变要重新提供可靠性分析
外购件存在违反可靠性准则的情况,要分析对系统影响,采取必要手段进行补偿
逐步完善可靠性设计准则,根据研制情况增加有效条款和去除无效条款
设计准则有可操作性,便于实施
电子产品可靠性设计与分析
电子产品选用概述
电子产品是电子元件、电子器件、电路板组成的设备
有完整成熟的技术方法
30%~50%的电子产品故障因为元器件选择使用不当引起的
对电子元件使用全过程进行控制
压缩品种规格、制造厂家、选择质量等级
采购、监制、验收、筛选、保管、防护、评审、信息管理全过程
有技术分析也有管理工作
选用与控制
选用原则
制定并使用优选目录
技术性能和质量等级满足产品要求
选择技术成熟、质量稳定、有质量等级的元器件
选用有发展前途的元器件、减少或不选择限制使用的
淘汰、停产、即将停产的都别用
选用顺序
国产
先选择目录里的
再选择符合电子器件认证委员会认证要求的
选用过,效果不错的,要符合使用环境要求
通过质量管理体系认证的
进口
先选择目录里的
再选择符合QPL国外认证委员会会认证要求的
生产过程中经过严格筛选的高可靠性元件,有指标测试的
名牌的著名元器件厂家或有良好信誉的代理商
选用过程控制原则
控制应用目录外的元件
元器件降额、热设计要满足产品要求
超出元器件采购清单的采购进行严格控制
对于关键、重要的元器件要到生产单位进行监制、验收
原则上元器件要进行100%二次筛选
关键重要的要按规定进行破坏性测试
控制库房保管条件,对库存定期检验,超期复验
装机元件应检查是否有检测和二次筛选标志
从验收到使用要对防静电做出要求、执行、监督
关键器件重复出现失效要专门做失效分析
对质量和可靠性工作进行评审和检查
对元器件质量和可靠性信息的收集、传递、反馈、统计、分析、处理进行监控
选用控制的具体要求
新产品开发时候就要制定优选目录
元器件选择要求
按目录选择
用目录外要按规定审批
目录外不能超过30%
确定需要的最低质量等级,不能低
新品元器件不超过20%
国外进口也要控制总量
关键器件要提高等级
国外进口,国内无法复测,原则上不选,如果要选就要加强整机针对性测试
元器件采购要求
按采购规范执行
型号、规格、数量、价格、交付日期,还要技术标准、质量等级、是否监制和验收、包装、要求提供信息
一般要求是当年生产
国外供应商要进行调研后制定合格目录
监制与验收要求
按型号制定监测和验收细则并执行
关键元件要在封装前去工厂验收
监制中发现工艺有问题的要进一步做测试
监制淘汰率不得高于8%~10%,除非有合同约定
验收的元器件要储存1个月再检验
通过交付试验,有质量证明后再下厂验收
二次筛选要求
按规范进行100%二次筛选工作
按总不合格品和单项不合格品的检测项目进行良率控制
无法进行二次筛选的要报批,并按照有关要求采取弥补和加强措施
装机使用要求
库房分类、分批、分质量等级
定期测试要求的元器件要定期测试,不合格就按要求处理
超期储存的要按细则要求处理
静电防护要求
要有防静电要求细则
全流程防静电
静电敏感器件要加强静电防护
失效分析要求
按工作要求和规定进行
关键的、重要的、多次失效的进行失效分析,了解失效机理,采取纠正措施
批次性质量问题的元器件失效,要组织专家确认分析结论,及时发现解决问题
评审要求
是否是优选目录的?重要的器件选择是否符合要求?
是否进行了验收、复验、二次筛选和破坏性物理测试?
元器件使用是否符合要求
元器件失效分析、信息反馈以及纠正措施
信息管理
按照元器件质量信息管理办法进行
建立全过程质量档案,包括元件的各种数据资料
信息管理系统要有如下功能
元器件优选目录、目录外选用元器件、实际使用元器件目录
验收、复验、二次筛选、失效分析数据
试验、调试、环境应力、环境试验、可靠性试验的问题和数据
元器件发放去向与装机清单
合格元器件供应商目录
国外进口元器件信息库
电子产品降额设计
降额设计的意义
降额设计就是让电子器件工作承受应力低于额定值,降低故障率,提高可靠性
要确定降额等级、参数、因子
降额因子是元器件实际应力与额定应力比值
关键器件要满足标准规定的降额因子,也可以根据实际调整因子参数
元器件降额有限制,要在规定范围之内,过度降额会降低效益
降额等级的划分
降额等级是降额程度
推荐应用的降额等级
降额等级的确定
参考降额等级表
可靠性、维修性、安全性、尺寸、种类、寿命期维修费用
计分表用于降额计算
元器件降额参数
影响元器件失效率的元器件有关参数及环境应力参数
降额参数
主要降额参数
关键降额参数
降额示例
模拟电路
数字电路
分立电路
固定电器
电位器
电容器
电感
继电器
电连接器
电机
灯泡
降额设计效果
电子产品的热设计
热设计的意义
控制电子元件工作环境温度,保护元器件
温度对寿命影响很大
温度上升对失效率都有提升,但是不同器件不同
降低元件功耗,减少发热
通过热设计,降低元件温度
热设计的基本原则
控制散热量、控制温升
选择合理热传导方式
减少热阻,控制元件温度
内热阻:产热点与器件表面指定点的热阻
外热阻:器件任意点与换热器之间的热阻
系统热阻:产品外表面与环境流体的热阻
冷却系统简单、经济,适应环境要求
考虑尺寸、重量、耗热量、经济性与失效率对应的元器件最高允许温度、电路布局
电器与机械设计同步进行
不得有损产品电性能
最佳热设计与最佳电路设计有矛盾,要折中
减少设计误差
热设计的方法和流程
确立内部允许最高温度
确立产品结构、体积、重量
选择冷却方法
元器件安装与布局
印制电路板散热结构设计
机箱散热设计
原理样机测试
测试报告
热设计目标的确定
常用冷却方法的选择及设计要求
常用冷却方法
自然冷却
强迫空气冷却
强迫液体冷却
蒸发冷却
常用冷却方式
热电(半导体)制冷
热管传热
导热模块
冷板技术
静电制冷
其他制冷方式
冷却方法选择
优选自然冷却功率密度0.009
金属导热0.122~0.3
强迫风冷0.425
直接液冷0.61
蒸发冷却1.22
按照设计要求进行冷却设计
功率器件的热设计
有功率的器件难以自然冷却,需要借助散热器
有较大且平整的安装表面用于散热
用导热材料降低热阻
选择散热器种类
扇顶
型材
叉指型
散热器选择和使用原则
功耗、环境温度、最大允许洁温
接触面光滑
散热材料降低热阻
结构设计方便对流
散热器表面处理,增强热辐射交换
考虑体积、重量、成本
元器件安装
安装位置的工作温度限制
安装位置要自然对流
元件牢靠安装
热源接近机架,与机架良好热传导
腿部安装横截面大,缩短长度
温度敏感,放在低温处
临近有发热量大元件,要做防护
安装板要垂直利于散热
分类要求
电阻器
半导体元件
变压器、电感器
传导冷却的元件
不发热元件
温度敏感元件
印制电路板的热设计
常用印刷电路板的要求
<100度
<130度
<200度
印刷电路板散热设计
敷设导热系数大的金属加强散热
印刷电路板导轨热设计
导轨与电路板接触面积足够
导轨与机箱接触面积足够
导轨热阻要小
导轨起到安装和散热两种作用
机箱的热设计
密封机箱
表面散热
基座散热
通风机箱
表面散热
自然通风散热
强迫风冷机箱
箱内强迫风冷:箱内风道散热
板式强迫风冷:机箱表面散热
容差分析
容差的定义和意义
给定一个物理量的可能值范围
预测电路性能稳定性的技术
研究参数偏差是否在规定范围之内
分析偏差对产品性能的影响
容差产生的原因
制造公差
环境条件
退化效应
容差分析方法
最坏情况分析法:测试偏差最大的概率和影响
仿真法:服从概率分布,用数学模型进行预测
阶矩法:用元件性能参数的均值、偏差计算概率统计
容差分析步骤
元件名义值和公差
建立数学模型
计算灵敏度
设计偏差公式并计算
计算频率的名义值
写出允许频移值,计算允许相对频移
将实际偏差与允许值比较
按最坏情况法分析后得出结论
不符合就制定改进措施
工程应用要点
产品研制中后期进行
设计人员负责,可靠性工程师配合
用EDA辅助软件进行,提高效率和精度
容差分析合格,如果设变要再分析
不合格要先缩小灵敏度再缩小偏差范围
不合格改进措施没办法,要更换不同标称值的元件
再不行就改电路设计
最坏分析法要确定电路性能参数变化趋势是否单调,不单调不行
潜在电路分析
潜在电路分析的意义和特点
潜在电路:设计意图之外的电路状态
会产生非期望或抑制期望的功能
具有潜藏性,激励条件成熟会出乎意料的发生
危害很大
因为系统复杂,设计人员难以掌握整体性
试验或者仿真难以发现
假设元件不失效,事先分析,发现电路中可能存在的潜在状态
适用于任何电子产品系统,可以是功能、分系统、系统
对影响安全的潜在电路要重点分析
50个元件内可以人工分析,多了要用专业软件分析
不考虑环境影响
不考虑产品故障
潜在电路类型
潜在路径:电流沿着非预期路径流动
潜在时序:
数据、逻辑信号非期望或矛盾的时间顺序发生
数据、逻辑信号非期望的时刻或者时间段发生
潜在指示
正常运行,出现模糊或错误指示
误导产品或操作人员做出错误反映
潜在标志
出现功能的错误提示
出现不确切标志
误导操作人员
潜在电路分析常用方法
网络树生成
拓扑图识别
机械可靠性设计与分析
概述
机械产品可靠性:规定使用条件和时间内,完成规定功能的能力
机械产品可靠性设计理论的基本任务:失效机理的基础上提出可靠度和寿命模型,提供分析方法,保证产品达到规定的可靠度
定性方法:历史上的成功经验
定量方法:可靠性定量设计法,概率设计法,依据参数计算
机械产品可靠性的特点
电子失效简单,机械失效复杂
电子是偶然因素导致的,机械是耗损导致的
电子可以用应力筛选剔除早期失效,机械不行
电子的失效率接近常数,机械没有数据
电子更换,机械更换加维修
机械试验时间长,不服从指数分布
电子产品数据有标准手册,机械没有
机械、电子目标一致都是获得尽可能可靠的产品
建模、预计、分配、故障模式及影响分析对机械产品同样适用
机械产品失效的主要模式
根本任务是预防潜在故障,纠正故障
分类
功能失效
功能失常
损坏损伤
松脱漏堵
退化变质
机械产品可靠性度量参数
包含机械整机和零部件
参数
可靠度:规定条件下规定时间内不发生故障的概率,关键部件用高可靠度
寿命、可靠寿命
复杂系统用寿命设计
可靠度与寿命结合确定设计使用寿命
可靠度试验中失效的部件寿命为设计使用寿命
平均故障间隔里程、时间
规定时间、规定条件
产品总工作时间/故障次数
可靠性分析步骤
明确可靠性要求:定性、定量要求
调查相似产品使用情况:制定设计准则
可靠性分配:产品可靠性按一定规则合理分配
进行FMECA和FTC分析:发现薄弱环节,确定可靠性关键零件、重要零件
一般零件可靠性分析:借鉴成功经验
关键零件可靠性分析:先借鉴,再进行定量设计,用概率设计法
可靠性分析计算:用计算估计零部件可靠性,分析比较满足要求
设计评审:专家评审,继续改进设计缺陷
可靠性增长:不断优化,超预期提高可靠性
概率设计原理
设计过程中:几何尺寸及参数数据都用的是均值,没有考虑数据分散性
随机因素
不同工艺的几何尺寸精度
不同材料的机械性能
工作环境载荷
机械工作中承受的力、扭矩、温度等因素都在一个范围内,有一定的随机性
常规设计方法:载荷*安全系数
来自于前人的经验估计
没有量化分析,取决于设计者经验和指导思想
安全系数只能保证在一定程度上是安全的
不能预测产品的失效概率
只有安全系数一个指标
可靠性设计方法:统计随机变量参数,计算失效概率和可靠度,找到最佳结构尺寸
将载荷、材料性能、强度、零部件结构尺寸视作服从概率分布的随机变量
利用概率论及强度理论计算给定条件的失效概率和可靠度
给定可靠度条件下确定零部件结构尺寸
这种设计可以提供可靠性和安全系数两个指标
工作载荷分析模型
失效因素可以总结为应力和强度两类
应力是引起产品失效的因素统称
应力除了机械指标外,还包括电指标
强度是产品抵抗失效应力的统称
强度除了机械强度外还包括承受电指标的能力
机械可靠性理论
机械强度大于应力就不会失效
应力和强度都是随机变量指标,符合统计学数据
应力函数X=f(x)
强度函数Y=g(y)
应力函数和强度函数有交叠区域
交叠区域就是失效情况
可靠度为零件不发生失效的概率
可靠度R+失效概率P=1
使用过程中强度函数Y会逐渐减小,逐渐与应力应力函数发生交叠,导致失效
离散程度大,干涉区域大,越容易失效,寿命越短
存在安全系数,也可能失效,所以用可靠度计算予以弥补
函数可以进行积分、微分、偏微分计算
应力--强度干涉模型
应力--强度正态分布的可靠度计算
X和Y符合正态分布,可靠度计算大大简化,也符合正态分布
联结式=应力分布参数+强度分布参数+可靠度函数
有联结系数
应力--强度服从其他分布的可靠度计算
用积分计算可靠度
梯形法
辛普森法
高斯法
可靠度计算工程方法
计算公式不能直接应用于工程设计
要求已知应力和强度的分布,但是数据不一定有
随机变量不止两个,而是一个N维变量
机械产品都是多种随机变量综合在一起的一种复杂工况
如果要计算,则计算量很大,计算繁琐,工程中难以应用
要把模型从1个变量的理想情况推广到N个变量的一般情况
构建功能函数(功能失效极限状态函数)
蒙特卡罗抽样方法
一次二阶矩法(用于构建可靠度系数)
问题是极限状态曲面相同而数学不同的功能函数会得出不同可靠度
将可靠度系数在几何上定义为坐标原点到极限状态曲面切平面的最小距离
相应的点叫做设计点(最可能失效点)
只适用于随机正态分布的情况
被国际结构安全委员会采纳 JCSS的JC法
核心在于确定设计点,再依靠函数计算可靠度
设计点的本质是一个求最小距离的数学优化问题
多种迭代计算方法
线性搜索法
验算点法
改进的一次二阶矩法
二次二阶矩法
响应曲面法
重要抽样法
机械可靠性设计方法的特点
以常规设计方法为基础,在设计过程中系统化考虑随机变量的设计方法
此设计分析分为两部分
失效模式的确定
该失效模式发生的概率
机械可靠性设计步骤
确立失效模式
根据失效模式确定失效判据
确定影响强度和应力的因素及响应计算公式,建立功能函数
计算机可靠度仿真
通过测验或者查阅数据库确定随机变量的统计分布数据
按照3西格玛估算方差、标准差,近似为正态分布处理
用均值点法和验算点法确认可靠度
可靠性设计方法的经济效益
合理优化传统设计方法
获得尺寸更小的零件,减少体积和重量
可以简化制造工艺,节省成本
常规安全系数为了保险取过大安全系数导致保守设计形成品质浪费
常规设计无法获得可靠性数据
常规设计只是控制均值,可靠性设计控制均值、标准差
安全系数与可靠度的关系
均值安全系数
常规设计的安全系数=零件强度均值/应力均值
概率安全系数
同时考虑应力和强度变异系数的影响,对均值安全系数进行了拓展
4. 可靠性实验与评价
可靠性实验基本概念
定义:为了解、分析、提高、评价产品可靠性的工作
作用:
发现潜在故障
验证开发是否符合可靠性要求
为评估改进产品可靠性提供依据
分类
工程试验:是否有缺陷、薄弱环节、潜在故障
环境应力筛选:发现排除不良元器件,排除早期故障
可靠性研制试验:通过施加适当应力寻找潜在缺陷,改善可靠性水平
可靠性增长试验:产品施加模拟环境,暴露潜在缺陷,提高可靠性
统计试验:验证是否达到规定的可靠性和寿命要求
可靠性鉴定试验:验证是否达到了可靠性要求
可靠性验收试验:验证量产的产品有没有达到可靠性要求
寿命试验:测定规定条件的寿命
分类2
实验室试验
现场试验
双边应力极限
技术规范界限:来自于任务协议书
工作极限:产品能使用的环境应力极限
破坏极限:产品出现不可逆的应力极限
环境应力筛选实验
定义:向产品施加一定的环境应力和电应力,激发潜在缺陷形成故障
用途:质量控制的一个手段,问题析出、识别、分析、纠正的闭环系统
缺陷检查
明显缺陷:生产过程中常见手段发现
潜在缺陷:常规方法无法发现,在使用期间应力作用下以早期故障形式出现
基本特征
是一种工艺,也是一种试验
不能损坏好的部分或者引入新的缺陷
每种结构类型的产品都有其特殊的筛选方式
筛选条件
很快分析出潜在缺陷
不会诱发附加故障
环境应力筛选与可靠性增长
应力筛选用于暴露并排除早期故障
消除故障源,降低故障发生率,提高可靠性水平
环境应力筛选与可靠性统计试验
筛选是第一步,统计试验是第二步
用于试验的样本必须先经过筛选
先消除早期故障再进行试验的样本才有统计意义
通过试验让订购方得到满意产品,供应方了解可靠性水平
包括可靠性鉴定试验和可靠性验收试验
使用的典型环境应力
应力筛选用于激发故障,不模拟使用环境
温度
恒定高温
参数
上限温度
下限温度
恒温时间
特性
上限温度、下限温度,恒温时间
高温老化试验:规定高温下连续不断工作,激发早期故障
恒定高温迫使缺陷发展,暴露早期故障
不推荐组件筛选
效果低于温度循环
恒定低温筛选极少使用
分类
金属氧化
金属间扩散
液体干涸
塑料软化变形
保护性化合物和蜡质软化
提高化学反应速度 ,加速粒子污染
绝缘击穿
温度循环
参数
上限温度
下限温度
温度变化率
上限温度保温时间
下限温度保温时间
循环次数
特性
三大影响因素:温度变化范围、变化率、循环次数
影响分类
微观裂纹扩大
接头松弛
紧固松弛
压配松弛
焊接断裂或阻值变化
粒子污染
密封失效
温度冲击
参数
上限温度
下限温度
(温度变化是台阶式的)
上限温度保温时间
下限温度保温时间
循环次数
特性:主要用于集成电路
影响分类
振动
随机振动
基本参数
频率范围
加速度功率谱密度
振动时间
振动轴向数
特性分析
随机振动频率范围宽
受试产品被施加振动频率不同
许多共振点同时受到激励,不同共振频率元件同时受到激励
筛选效果大大增强,筛选所需时间大大缩短
激发故障模式和影响
结构件、接头、引线疲劳
电缆磨损
螺钉松弛
加工不当的集成电路离开插座
衔接薄弱点故障
脆性材料出现裂纹或断裂
多种筛选方法
初始筛选方法
通用性强
可借鉴,供参考
无法确定其他定量方法
常规筛选方法
不要求可靠性要求和成本之间建立定量关系
凭借经验确定方法
仅仅能筛选早期故障
应用广泛
定量筛选方法
筛选效果、产品可靠性目标、成本、现场维修费用之间建立定量关系
筛选后达到浴盆曲线的恒定阶段
应用少、前景广阔
步骤
准备工作
产品技术状态
试验设备
检测仪表、夹具
初始性能检测
按照标准和技术文件进行全面性能检测并记录
排除不合格者
寻找和排除故障
随机振动
施加振动
观察响应特性
响应频谱符合要求,继续振动
产品通电,观察性能
出现故障,继续进行试验,5分钟结束后再修复
用振动试验找到故障部位,修复后转入温度循环试验
温度循环
按照温度循环曲线进行温度测试
产品通电并监测性能
出现故障断电进行故障调查,加以修复
修复后局部检验合格从循环开始点进行循环,有故障的循环无效
如果出现故障但是仍然可以在温度循环过程中通电
可以将故障调查和修复过程推迟到循环结束,循环有效
无故障检验
温度循环:完成温度循环连续无故障
随机振动:通过温度循环测试后进入振动测试
振动5分钟没有故障则通过
振动10分钟出现故障但是可以修复,修复5分钟测试不故障通过测试
振动10分钟仍然故障,测试失败
最终性能检测
最终运行测量值与初始测量值进行比较
用规定的验收值进行评价
只要通过应力测试,有故障也算通过
可以根据需要调整应力测试项目
高加速应力筛选方法
激发试验方法,理论是故障物理学
研究对象是故障和失效
通过激发,改进缺陷,提高可靠性
没有标准化,还在探索中
降低测试成本
用恒定的环境应力和电应力进行,不用步进式
用较高的机械应力和热应力有效激发潜在缺陷
环境应力筛选的工程应用要点
应力筛选效果主要取决于施加的环境、电应力,还有检测仪表能力
主要适用于电子产品
根据产品剪裁检测标准,没有标准可以借鉴
应用于研发和生产阶段
每一级组装层次上100%展开
应力设置着重于发现缺陷,不是精确模拟使用条件
依次施加环境应力,根据层次调整种类和量值
制定环境应力筛选大纲,确定最长和最短筛选时间
研发阶段应力筛选要进一步分析,作为基础
生产阶段环境应力测试和实验室的要对比分析,调整应力筛选大纲,保持最佳筛选
可靠性研制试验
定义
样机施加一定的环境应力或工作应力
暴露样机设计和工艺缺陷的试验过程
受试产品施加应力,把缺陷激发成故障
对故障分析定位,采取纠正措施予以排除
试验、分析、改进的过程
基本要求
尽早开展
关键产品、新技术含量要求高的产品重点实施
产品研发试验的组成部分,要结合产品研发
可采用加速应力方式
纳入故障报告、分析、纠正系统,要进行分析说明
可靠性强化试验
系统性逐步增大环境应力和工作应力
激发暴露薄弱设计环节
改进设计和工艺
提高可靠性
是一种可靠性研制试验,让产品更健壮
激发故障的试验
步骤
试验对象:结构特点、重要度、技术特点、复杂程度、经费综合确定
试验应力:低温、高温、温变循环、振动、湿度、综合环境
应力施加顺序:先弱后强,先低温后高温,先温度后振动,先单应力后综合应力
试验剖面
低温步进
高温步进
快速温变循环
振动步进应力
综合应力试验
受试产品、试验设备要求
不经过环境试验,直接进入可靠性强化试验
经过全面的功能、性能试验,确认产品达到技术规范规定的要求
设备用液氮制冷来实现高温变率的温度循环环境
以气锤连续冲击实现全轴振动环境
试验实施
按照预先的试验剖面进行,检测、记录所有信息
根据强化试验终止判据决定试验终止
故障改进后,对产品继续进行可靠性强化试验,确定试验有效性
确定改进措施是否会引起新的问题
步进应力施加方法
高低温步进应力施加方法
起始温度:设计规范规定的高低温或接近值
每一步保持时间:元件彻底冷透、热透的时间,通常是10~20分钟
步长:通常是10度,也可以增加到20度或者减少到5度
高低温工作极限:产品异常,缩短步长到原来一半或者减小到2度或3度,再次保温,确定产品功能恢复正常的量级温度
高低温破坏极限:最后出现异常的失效温度
试验终止判据:试件的破坏极限,可以坚持到破坏,为降低成本也可以在接近工作极限时候终止试验
快速温变循环应力施加方法
上下限温度
高温工作极限值-5度
低温工作极限值+5度
不超过产品破坏极限的80%为上下限
温变率
影响试验强度
影响试验时间
影响试验费用
一般是15~60度
上下限温度持续时间
温度达到稳定需要的时间
上下限温度浸泡时间
一般是10~20分钟,不超过30分钟
温度循环次数
一般不超过6次
超过6次则增大温变率,重新开始试验
试验终止判据
出现不可修复故障
温变率达到试验箱的最大值
完成6个循环仍不出故障
振动步进应力施加方法
起始振动值
全轴:3~5,一般是5
电动:1~2,一般是2
每一步驻留时间:每个振动水平的驻留时间和性能检测时间,一般是5~10分钟
步长:
全轴3~5,不超过10
电动2~3,不超过5
振动应力工作极限
发现产品异常,恢复到原来步长的一半或减小1~2的振动量级再次振动,如果可以,则减小后的是应力工作极限
振动应力破坏极限
找到工作极限,减小步长继续振动
恢复到工作极限检测,检测失效则停止振动检测
最后失效的振动值为产品振动应力破坏极限
试验终止判据
试件达到破坏极限或达到设备最大振动量,也可以在找到工作极限终止试验
综合应力施加方法
温度循环
振动应力
恒定振动应力
前几个循环按照破坏极限的50%施加
最后一个循环施加微振动应力
步进振动应力
步进振动应力根据已完成试验获得的振动应力破坏极限和设定循环次数确定步长
试验终止判据:发生不可修复的故障或完成设定的试验剖面
应用案例
工程应用要点
尽早开展
产品研发+可靠性研制试验同步
关键产品+新技术含量高的产品实施
采用加速应力
故障纳入报告并进行说明
可靠性增长试验
定义
暴露薄弱环节、有计划、目标的对产品施加模拟实际环境的综合环境应力和工作环境,激发故障,分析故障、改进设计工艺,验证措施有效性
有计划的试验-分析-改进过程
有效提高产品可靠性
产品研发过程中单独安排的可靠性工作项目
工程研发基本完成后,可靠性鉴定前
制定计划、确认模型、试验、评估
主要方法是分析与改进
模拟使用诱发故障
故障定位,分析机理
制定纠正措施
落实措施
验证措施有效性
对象
试验要消耗较大资源
关键技术、重要的产品进行试验
试验剖面:与鉴定试验一致
可靠性增长模型
杜安模型
确定性模型,不是统计模型
可靠性增长过程中,逐步纠正故障
可靠性逐步提高,不允许多个故障集中改进而大幅提高可靠性
图解法分析可靠性增长规律
根据曲线图反映可靠性水平变化得到可靠性点估计值
AMSAA模型
非齐次泊松过程建立的可靠性增长模型
用于寿命型产品也可以用于试验次数相当多且可靠性相当高的一次性使用产品
两个模型互为补充,杜安模型直观简单,AMSSA估计精度高
可靠性增长摸底试验
特点
以可靠性增长为目的,没有增长模型,不确定增长目标值,试验时间较短的可靠性试验
根据我国具体国情开展的
试验时间较短
模拟实际使用综合应力,较短时间,较少费用暴露缺陷,采取纠正措施,增长可靠性
步骤
试验对象
多因素共同权衡产品特点确定试验对象
试验复杂,重要度高,无继承性的或改型的电子产品为主要对象
试验时间
历史经验
设计要求
一般是100~200小时
最低可接受值的20%~30%
试验剖面
模拟实际条件
环境、工作、使用维护条件
初期实施,实测数据不足
按国家标准确定试验剖面
适当增加应力
模拟实际不是强化和高加速应力
应用工程要点
明确的增长目标和模型,重点在于故障分析和有效的改进措施
找出设计缺陷采取有效纠正措施,达到预期增长目标,必须在受控条件下进行
纠正措施集中在对任务有关键影响的故障模式上
可靠性增长试验可以替代鉴定试验
可靠性鉴定和验收试验
定义
验证产品设计是否达到了规定的可靠性要求
可靠性鉴定试验是产品可靠性的确认试验,也是研发到量产前的一种验证
属于统计试验
实验方案类型及适用范围
成败统计试验
连续型统计试验方案
定时结尾试验
定数结尾试验
序贯结尾试验
参数
定时截尾试验:规定试验时间,到时间停止,统计故障次数
定数截尾试验:规定允许出现故障数,发生到了直接停止,统计时间
序贯结尾试验:按照事先拟定的接收、拒收、截尾时间线按判据做出决定
全数试验:对一批的每一个产品都进行试验
抽样特性曲线:表示抽样方式特性曲线,看出抽样方式对检验产品质量的保证程度
观测值:点估计,产品总工作时间除以关联责任故障数或试验总数除以失效数
检验下限:拒收标准,合同规定的最低可接受值
检验上限:
使用方风险:
生产方风险
鉴别比
概念
样本量:按合同确定样本量
试验时间:由试验方案确定
决策风险:制定试验方案要力求方案实际决策风险接近于指定风险值
鉴别比:检验上限/检验下限
指数分布统计试验方案
定时截尾统计试验方案
定数截尾统计试验方案
序贯截尾统计试验方案:先抽样再试验,再判据是否通过
二项分部统计试验方案
定数试验方案
序贯截尾试验方案
可靠性验证试验剖面的确定
基本原则
模拟现实
用实测应力制定验证剖面
没有实测数据用类似任务数据参考
按国家标准进行
制定程序
按寿命剖面确定环境剖面
按环境转换成试验剖面
一种类型任务,任务剖面与环境和试验剖面一一对应
多任务剖面,制定合成试验剖面
确定方法
试验环境应力的确定
选取试验环境应力类型
确定应力等级:实测、估计、参考三个层次
试验剖面的组成
确定应力种类和等级
环境应力配合时间轴安排
冷热天气交替循环
冷透、热透时间安排
选取环境应力要确立应力种类、量值、持续时间等参数
可靠性验证试验前要具备的条件
受试产品设计定型
预计结果大于任务要求
实验前进行FMECA,识别可能故障模式
受试产品通过环境应力筛选
同批产品已经通过环境鉴定试验
可靠性验证试验通用程序
编制验证试验大纲
试验前准备工作评审
实验中故障的统计
同一原因引起间歇性故障算一次
多种故障由同一原因引起,算一次
多个元件同时失效
同一原因、部位、性质引起的故障,没有排除再次出现,算一次
受试产品还有其他故障,算作单独责任故障
试验结果的判决
关联责任故障累计数超过方案规定,做出拒收判决
多台设备受试,一台不合格,即可拒收
应用工程要点
关键、重点、新技术系统进行试验
能组成系统的尽量按系统考核
可靠性鉴定试验一般定时截尾
可靠性验收试验一般定时截尾或序贯截尾
使用方风险和承制方风险:20%~30%
鉴定试验尽可能模拟产品真实使用环境
确定振动应力,不能用累计疲劳损伤机理
假如发生故障,只能修复,不能改进设计,否则试验无效
试验结果不论接受还是拒收,故障都要高度重视,采取改进措施
置信度取决于检测手段可靠性
寿命试验和加速寿命试验
定义
测定产品在规定条件下的寿命
目的
发现可能过早发生损坏的零部件
确定影响产品寿命的根本原因和需要的纠正措施
验证规定条件的使用和储存寿命是否达标
适用范围
损耗性质的机械、机电类产品
设计定型、试用、使用三个阶段
分类
正常应力寿命试验
试验条件
环境
工作
维护
受试产品选择
新研发的,选取具备定型条件的合格产品
已定型的,选用使用过产品做测试
受试产品数量
不少于2个
低价、批量大的产品根据寿命指标估算数量
故障判据
关联故障
损耗性故障
偶然故障
试验时间和试验终止
测定试验:持续到超过要求寿命或者出现损耗故障
鉴定试验:持续到要求的寿命终止
要求寿命周期没有出现故障:达到寿命要求
出现故障:未达寿命要求
验收试验:大修期大于等于规定寿命
加速寿命试验
分类
恒定应力
步进应力
序进应力
加速模型
温度加速变量
电压、压力加速变量
寿命加速系数
试验步骤及事项
加速变量选择
应力水平选择
各级应力下进行寿命试验
检验寿命分布,估计分布参数
配置加速曲线
求加速系数
工程应用要点
进行系统重要性分析,选取重要系统
考核寿命指标不是产品保证期
产品多,制定寿命试验条件依据实际情况确定
目前没有统一标准,但高度重视,合理选择加速应力,建立准确的物理化学模型
5. 软件可靠性与人机可靠性
软件可靠性的基本概念
硬件可靠性
软件可靠性:软件失效率高于硬件失效率一个数量级
需要同时考虑
软件工程
软件开发、运行、维护、引退的系统方法
基本原则
按软件全寿命周期
分阶段制定并实施计划
逐阶段进行确认
坚持严格软件产品控制
使用现代程序设计技术
明确相关方责任
持续改进软件开发过程
软件工程化
利用系统工程方法处理软件生存期的全部过程
本质是软件过程工程化
吸收硬件开发的经验
软件生存期过程分阶段的划分进行规范化
提高可视性,便于管理,不断改进
设计、制造、检验三个阶段
硬件制造有实物,软件设计有程序
软件失效原因
软件可靠性
软件在规定的条件下,规定时间内,不引起失效的能力
不仅与软件存在的差错缺陷相关,与系统输入和系统使用也有关系
规定条件、规定时间、规定功能
软件失误、缺陷、故障、失效
失误:开发过程中弄错了
缺陷:产品做好了有BUG
故障:运行过程发现不正常
失效:程序操作背离程序的要求
软件失效原因
运行过程中发生故障
故障产生两类原因:内在和外在
内在原因是人为的,分成偶然和恶意逻辑
外在原因有人为和环境两种因素
外在原因的人为失误是故意侵袭和操作失误两种
软件缺陷形成
用户需要阶段:软件不符合客户实际需要
软件需求分析阶段:不符合用户需要
软件设计阶段:不符合用户需要、需求规格说明、容错能力不够
软件编码阶段:不满足设计需要
软件测试阶段:覆盖率不满足需要,残留缺陷过多
软硬件可靠性的异同
软件特点
无形
一致
不变
易改进
复杂
软硬件可靠性区别
物理实体、逻辑表示
可见性好,不可见,难控制
设计、生产、使用均有故障点,开发过程中缺陷
零部件结合、程序结合
失效有先兆、失效无先兆
软件可靠性分析
软件可靠性参数
可靠度
平均失效前时间
平均失效间隔时间
软件可靠性指标
“需要”和“可能”两项原则
针对参数确定量值,确立可靠性指标
考虑因素
系统重要度
系统可靠性要求
国内外相似产品可靠性水平
管理水平和开发工具的使用
进度要求
经费保障
指标要求的可验证性
软件可靠性设计
避错
预防为主,采用软件工程方法
考虑可靠性的软件设计准则
模块化
模块独立
信息隐蔽
局部化
启发规则
改进软件结构,提高模块独立性
控制软件深度、宽度、扇入和扇出
模块作用域需要在控制域之内
降低模块接口的复杂度
设计单入口和单出口的模块
控制模块规模
编程风格
具体准则
习惯做法
逻辑简明、清晰、易读、易懂
结构化程序设计
编写正确完整的开发文档
数据说明便于查阅、易于理解
语句简单清晰
查错
被动式查错
主动式查错
容错
N版本程序设计法:一个模块同时运行N个版本,结果一致才正确,不一致则启动表决或判定机制
恢复块法:每次运行结束,检查结果,发现异常启用替代模块,替代模块要独立存在
只用于关键任务模块
软件可靠性验证
可靠性测试概念
软件可靠性测试的目的
发现影响可靠性的缺陷
为排除缺陷提供信息
验证软件可靠性是否满足可靠性要求
通过软件增长测试,预测可以达到的可靠性水平
软件可靠性测试过程
构造操作剖面
生成测试用例
准备测试环境
可靠性测试运行
收集可靠性数据
软件输入和输出数据
软件运行时间数据
失效数据
可靠性数据分析
失效分析:根据运行结果和预期结果判定是否失效,失效原因,失效后果
可靠性评估:根据运行时间数据和失效数据估计可靠性水平
失效纠正:通过失效分析,找到并纠正引起失效的程序中缺陷,实现可靠性增长
可靠性增长测试
目的:为了满足软件可靠性要求对软件进行可靠性测试--分析--修改--再测试--再分析--再改进的过程
特点
人员:软件开发方进行
阶段:软件测试阶段
场所:实验室
对象:研制中后期,验证测试之前
方法:操作剖面随机测试
特征:失效后立即修改软件,验证修正措施
可靠性验证测试
目的
验证在给定置信水平下,软件可靠性水平是否达到规定的可靠性指标要求
验证结果是软件定型的依据
特点
人员:使用方
阶段:软件确认阶段
对象:软件最终版本
方法:软件操作剖面的随机测试
特征:不进行软件缺陷剔除
过程
确认可靠性要求
选择验证方案
构造操作剖面
生产测试用例
测试运行
结果分析
判定接收或拒收
可靠性评价
可靠性验证测试方案
工程应用要点
硬件与软件可靠性一样重要
软件工程化是可靠性前提,避免自编自导自演
硬件的提高可靠性技术适用于软件,简化、冗余、FMEA,可靠性验证
掌握提高软件可靠性方法,避错、查错、容错
软件可靠性主要是因为开发人员失误产生,要从预防、发现、纠正、验证纠偏措施着手
技术与管理两项活动都要用上
人机可靠性概念
三大要素:人、机、环境,相互关联,互相影响
人为差错概念
人为差错分析:正常行为特征不一致的人员活动或与规定程序不同的活动,不是故意的
人为差错分类
按作业要求
执行性:该干的故意不干
疏忽性:该干的忘了干
多余性:不该干的干了
次序性:不按顺序干
时间性:不在规定时间内干
错误性:该干的干错了
按工作类型
设计
操作
装配
检查
保养维修
按人的因素
感知与确认
判断与记忆
动作与操作
人为差错原因
缺少知识和能力
训练不足缺经验
操作说明不完备
工作单调不新鲜
超过人员操作能力
外界信号干扰
不舒服、不协调的作业环境
控制器和显示器不合理布置
设施或信息不足
人为差错预计技术
预计由于人为差错造成的整个系统或者分系统的故障率和可靠性
分析步骤
确定系统故障及影响后果,每次处理一个故障
列出并分析每个故障有关联的人工作(动作分析)
估算差错率
估算认为差错对系统故障影响
提出改进建议
人机可靠性设计基本方法
概念
考虑人因素的设计,达到人与机器的有效结合和人对机器的可靠使用
通过设计减少人为差错,提高人使用产品的可靠性和安全性
减少维修人员在维修过程中的人为差错,提高维修正确性
人体量度设计
各种高度匹配人员身高
各种把手、按钮等方便操作
设备布局方便人员移动
工作空间匹配人员身材
通道窗口尺寸根据人体、肢体、物体外形设计
人的力量设计
操作姿势
用力的身体部位
施加力:拉、推、旋等
是否有支撑
用力持续时间和用力快慢
身体方向借力 大肌群用力 整体用力大于局部用力 推和拉,选取用力大的方式
人的感觉能力设计
人的感觉分类
视觉
听觉
嗅觉
味觉
触觉
视觉
分辨颜色、尺寸、光亮度、光闪烁率
照明强度与识别率的关系
视觉角度
适应亮度变化的能力(黑暗到明亮)
剧烈亮度对人视觉的损伤
显示、警示要设置在最佳视野范围内 有明显色差 重要显示要增加图形变化 视觉显示器要有足够亮度、对比度、视距
听觉
响应频率:1000~3000赫兹
声强:小于120分贝
考虑心理因素的设计
心理因素是人为差错的重要原因
考虑人的积极性设计
产品安全,人员放心
产品简单,操作维修容易
使用维修环境要优化,人员满意
考虑人的能力设计
降低人员素质技能要求
提高人员覆盖面
工程应用要点
三要素密切联系
抓住人为差错
人为差错分析是基础
防差错设计、可靠性、功能性联合起来活学活用
重视数据收集和整理
6. 数据收集、处理和应用
概述
定义:收集数据定量评估产品可靠性
目的、作用
方案阶段,对比选择
研制阶段,找出薄弱环节,纠正解决
设计定型阶段,评估能否达标,为定型和生产决策提供参考
批量阶段,评估工艺能否满足可靠性要求,为接受产品提供依据
使用阶段,收集数据,最终检验可靠性,改善依据
数据类型
是否连续
离散型
连续型
质量特性
专用质量特性
通用质量特性
按场地
实验室
现场
有无故障
无故障数据
有故障数据
是否完整
完整数据
删失数据(不完整数据)
寿终数据
左删除数据
右删除数据
区间数据
储存删失数据
来源
试验
使用
本身来源
行业
公用
外部来源
收集
试验数据
使用数据
试验报告
调查表
处理
故障数据统计原则
关联故障和非关联故障
关联故障统计原则
同单元多次故障算一次
同单元引起多种故障算一次
多单元同时失效,没有互相影响,算多次
已故障未修复再发生算一次
独立故障引起从属故障算一次
拆卸事件不计入故障次数
非关联故障不计入次数
分布的假设检验
拟合优度检验法
作图法
解析法
皮尔逊检验法
使用范围
使用条件
步骤
随机截尾样本检验步骤
参数估计
指数分布的点估计
可靠性参数的点估计
可靠度
故障率
平均寿命
可靠寿命
指数分布的区间估计
适用范围
使用条件
定数截尾样本的区间估计
定时截尾样本的区间估计
无故障数据的区间估计
使用范围
使用条件
估计公式
威布尔分布参数的点估计
范围
条件
完全样本时两参数威布尔分布参数的极大似然估计法
定时截尾和定数截尾量参数威布尔分布参数的极大似然估计法
威布尔分布的可靠性性参数点估计
可靠度
故障率
平均寿命
可靠寿命
使用寿命
二项分布的可靠性参数估计
适用范围
使用条件
可靠度的点估计
可靠度的区间估计
数据管理和应用
管理系统:FRACAS:故障报告、分析、纠正措施系统
统一规划、报表、制度
及时性:数据一旦形成,要及时加以收集和管理
系统性:可靠性数据按不同产品分别进行系统收集和管理
完整性:数据要全面,完整,包含时间、环境等因素
目的性:应用是目的
应用要点
研发单位负责制定制度进行可靠性数据的收集、处理、应用
供应商可靠性数据要纳入
产品数据库中药能提取、导入可靠性数据
数据收集进行初步判断,是否符合实际
评估数据出现异常要检查是不是数据本身异常了
根据需求选择合适的使用方法和条件
12.环境适应型工程基础
环境适应型基本概念
概述
人、机、环境三要素相互影响,关系密切
环境与产品关系也很重要
内含
产品在寿命周期预计会遇到的各种环境下,能实现预定功能且不被破坏的能力
环境包括自然环境和诱发环境
产品的环境适应型很重要
满足要求才能设计定型
不满足要求不能量产
达不到要求按故障处理
环境效应导致产品耐受强度下降
环境效应
高温环境效应
高温会改变产品材料的物理特性或尺寸
暂时或永久降低产品的性能
高温环境效应分类
膨胀导致配合咬死
润滑粘度变化或液体外流造成连接处润滑下降
材料尺寸或方向变化
包装密封垫或轴承失效
衬垫变形
外罩、密封条损坏
阻值变化
温度梯度不同、材料膨胀不同、电子线路稳定性变化
变压器过热
继电器耦合变化
材料褪色,龟裂
低温环境效应
材料硬化、脆化
收缩不同,相互咬死
粘度增加,流动性变弱
电子件性能改变
减震架刚性变化
玻璃疲劳
水冷凝
人员灵活性下降
加速度环境效应
机构变形
永久性变形
紧固件断裂
支架断裂
电子线路断裂
执行机构卡死
密封泄漏
压力和流量调节
振动环境效应
产品及内部结构动态位移
引起结构疲劳,零件损坏,
零件碰撞,功能损坏
环境效应分类
导线磨损
紧固件移动
电气断续
电气短路
密封失效
元器件失效
机械、光学失调
结构裂纹
微粒掉落
噪声过大
轴承磨损
环境适应型与可靠性关系
规定环境条件是可靠性的输入和评价依据
环境适应性与可靠性的差异
施加应力类型
施加应力水平
通过判定标准
环境适应性试验是可靠性鉴定试验的前提
环境适应型主要工作
适应性管理:全寿命管理,有序展开
环境分析:自然环境、诱发环境进行全面分析和测量
适应性设计:通过设计消除或减缓环境影响,选用耐环境能力强的机构、材料、工艺避免环境影响
环境试验
研制:适应性研制试验
研制:环境响应特性调查试验
设计定型:环境适应性鉴定试验
生产:环境验收试验,例行试验
环境适应性要求
立项阶段:环境分析,分析能遇到的环境类型及量值的极值
环境适应性定量要求:适当的参数及赋值
例如
工作环境温度
储存环境温度
相对湿度
天候条件
高度条件
环境适应型设计
通过设计和工艺保证环境适应性
制定和贯彻设计准则
防潮
防水材料
排水系统
干燥装置
保护涂层
憎水处理
绝缘填充
防盐雾
电化学
电偶
应力
晶间腐蚀
防霉菌
防霉剂
密封干燥
密封前杀菌
耐冲击、噪声、振动
消源
隔离
减震
抗震
防共振
引线剪短
元件固定
导线固定
插头支撑
软硬导线选择
避免悬臂
共振消除
共振方向调整
套管防护
电阻卧装
电路板锁紧
减震装置
耐冲击、振动的安装
安装简便,空间十足
安装不拆卸其他零件
功能相同,对称通用、替换
安装人员按逻辑和顺序
适当培训即可上岗
安装方法简单,图解化
避免人工差错
非对称安装防错
对称安装可互换
危险部位警告标识
安装照明
减少振动
避免导管
液压远离人员、其他结构,排气管、电气电路等
液压放在最底层
不同液体管道区分
回油管路用不锈钢
管路安装,支撑间隔
导管间、部件间有足够间隙
缩短管路
管路远离运动器件,足够间隙
结构易变性,不设置管路
卡箍固定管路,管路间隔6mm以上
运动物体留间隙
护孔圈防止偏斜
刚性连接软管加支撑
接头的导管尽量长
接头有支撑
旋转接头考虑液压平衡
拐折对管路的影响
合理装配顺序
恰当工艺补偿间隙
防止应力损伤和腐蚀
原料、零件、元件选用
材料符合环境要求
零部件对整机影响
遵循标准
有限选用标准件
尽量国产替代进口,不能替代要注意标准转换
综合牌号、品种、规格
考虑零件制造工艺简化
技术成熟度
新材料评审验证
结构材料的耐受性
强度、塑性综合考量材料
选用成熟零件
零件磨合
元件二次筛选
零件满足的使用环境
关键零部件清单
封装零件用陶瓷、金属、玻璃,不能用塑料
包装设计
考量运输、储存
便于启封、清理、崇封
便于装卸、储存、管理
符合部门规章
考量物理因素
承受应力特性
运输的环境条件
危险因素影响
现有包装条件
防护和装箱等级
储存方式设计
预期使用、维修要求确定储存方式
储存方式与包装防护协调
特殊储存要考虑多因素
储存任务分析,样式、空间等
参照规定、协调储存等级
设施防护措施
长期储存要专门进行储存设计
装卸方式设计
机械、人工等装卸方式选择
被装卸物品有辅助设施
遵循规范,确保装卸安全
运输方式设计
保证任务要求,采用符合运输要求的运输方式,公路、铁路等
难运输产品、敞开运输产品、非装箱产品进行运输装载加固设计
运输过程的适当防护措施、安全、应急措施
电磁兼容设计
考虑元件电磁敏感度
避免信号与电源公用地线
高电压、强辐射要明显标志和说明,有效防护
相邻插孔不能把电源和信号放一起
有效防护措施
重复性和一致性,不限要采用母线板
缩短导热通道
开展环境适应性设计
环境鉴定试验的依据,不是环境设计的要求
设计值高于规定值
耐环境设计落实到产品设计中
重视选用耐环境能力部件
环境适应性预计与分析
充分考虑每一种工作模式
根据工作特性和工况确定最恶劣情况的量值
利用结构手册确定元件耐环境极限
用分析结果判定能否承受,给出耐环境余量
环境适应试验
实验室环境
环境适应性研制试验
寻找设计和工艺缺陷,增强环境适应性的早期试验
考虑环境应力、量值、施加顺序和方法
一般选用加大量值的应力
产品耐极限应力的摸底试验,确定限制性量值和界限
环境鉴定试验
考核产品环境适应性是否满足确定性要求
定型试验的一部分,为定型提供依据
有先选用独立第三方
制定鉴定大纲并获得认可
批生产产品环境试验
按规定对交付产品进行环境试验
出厂检验的组成部分
环境例行试验:考核生产过程的稳定性
自然环境
长期暴露在自然环境下,确定环境影响
基础性试验,获得很多基础数据
需要编制试验大纲
使用环境试验
规定的实际使用环境中评价产品的环境适用性试验
评价自然环境和诱发环境的影响程度
环境适应性评价
利用自然环境试验和使用环境试验的结果来评价产品的环境适用性水平
环境适应性管理
制定工作计划
方案研究阶段就要开始
计划内容
总要求与合同要求
负责机构及职责
工作项目、内容、要求、范围等
其他工作的协调关系
评审要求
需要资源
适应性工作评审
专家团弥补团队不足
发现薄弱环节
明确节点、类型、要求
环境信息管理
建立信息管理系统
避免重复工作
包括环境剖面的采集信息
供应商监督与控制
评审
现场检查
产品环境适应性验证
工程应用要点
认识重要性
环境效应是开展基础
消除减轻环境对产品强度的影响
提高设计赋予产品的强度和抵抗环境的能力
设计准则目的是提高环境耐受性
试验做到位才能发现薄弱环节
重视历史数据,实现知识共享
11. 安全性工程基础
安全性基本概念
概述
事故的产生:设计缺陷、操作失误、糟糕管理
安全性与安全和事故
安全性:不产生安全事故的能力
由设计赋予的固有特性,产品的重要特性
用概率表示可靠度
安全:没有产生安全事故的一种状态,是一个相对概念
事故:产生损失的意外事件
事故等级
特别重大
重大
较大
一般
危险和危险源
危险是指可能导致事故的状态
主要来自设计和制造缺陷
危险源:一个系统中具有潜在能源和物质释放危险的区域、位置等
风险
风险是危险的可能性和危险严重性的综合度量
某种危险发生的可能性
危险严重性:某种危险引发事故后果的严重程度
风险是安全性工程一个重要概念,考虑发生概率也考虑危害程度
需要考虑残余风险和次生风险
风险评价用定性或定量的方法
重视安全性关键项目,抓主要矛盾
事件链
危险源在诱发因素影响下发展成危险事件,产生危险后果最终变成事故
安全性工作基本过程
确定安全性要求
策划管理安全性工作
识别危险
安全性分析
安全性设计
验证安全性要求
评价安全性水平并确认
如果达不到则改进后再识别危险
安全性和可靠性关系
安全性和可靠性都是产品的固有特性,都是产品通用质量特性
可靠性关注的是失效或者故障
安全性关注的是危险和风险
产品不安全一般是故障导致的
提高可靠性可以提高安全性
产品可靠不一定安全,不可靠也不一定不安全
安全性有时候与可靠性是矛盾的,比如冗余设计
联系密切,差别明显
安全性要求
安全性要求是进行设计、分析、试验、验收的依据
定性要求
定量要求
事故率:事故总数/寿命单位
年平均死亡人数:不能超过规定人数
安全可靠度:故障次数/任务(使用)次数
安全性分析
可靠性工作的重点是与故障或失效做斗争
危险分析是安全分析很重要的工作
危险源检查单分析法
收集危险源清单
识别潜在危险源,安全性设计时候可以有针对性采取预防措施
常用检查单
危险能源检查单:为系统完成规定功能提供动力源
任务关键功能检查单:危及安全的关键功能
使用、维修和保障活动危险检查单:危及安全的误操作
设计危险检查单:设计完成后检查设计产品及设计的操作方法是否存在危险
初步危险分析
研制早期开展
初步识别设计方案中可能存在的危险源,进行初步风险评价
危险分析的基础
重点考虑
产品故障或功能异常
危险物质
环境因素和使用操作的结束条件
产品部件之间相互作用引发的危险
系统危险分析
进一步识别各种因素导致的危险,编制危险清单
对风险进行评价
分析展开层面:系统、分系统、单机、部件、组件
重点考虑内容
规定的安全性设计要求
分析独立失效、关联失效、同时发生的危险事件
软件故障对安全性影响
安全性与性能试验的综合
研制过程的设计更改对安全性影响
低层对高层的影响及控制
使用和保障危险分析
识别和评价人员操作导致的危险
考虑各阶段的产品状态等因素
评价用于消除、控制、降低风险的措施充分性和有效性
重点考虑
危险环境下完成工作、时间以及风险降到最低的措施
为了消除、控制、降低危险的设计或更改措施
对安全装置和设备提出的要求
警告规程
危险材料的使用、储存、运输
安全性培训和人员任职要求
操作人员可控制的危险状态
职业健康危险分析
分析有害健康的危险并提出防护措施,将风险降低到可接受水平
重点考虑
有害材料的详细信息
确定有害材料被吸收的条件,分析危害
说明有害材料的特征和危害等级
估计危害材料使用率
推荐材料处理方式
因素分析
化学危险
物理危险
生物危险
人机功效危险
防护装置失效危险
安全性设计
控制能量:确定可能发生最大能量失控时候能量释放的危险地方,进行控制预防
清除和控制危险:安全性设计消除和控制危险严重性
设计措施防割伤
阻燃材料
气压、液压代替电气系统
液压代替气压系统
连续整体管道代替接头管道
消除凸出部位
避免燃烧时产生有害气体的材料
无法完全消除危险,采取有效措施控制危险严重度
隔离设计
用物理分离将人员、设备隔开
防止危险或降低风险到最低程度
闭锁、锁定、联锁设计
防止不相容事件发生
闭锁:防止某事件发生或防止人物进入危险区域
锁定:保持某事件的某个状态不变,避免人物脱离安全限制区域
联锁:规定发生顺序,违反顺序无法操作
概率设计与损伤容限设计
强度--应力概率设计
损伤容限设计:对材料选择与控制、应力水平的控制
降额
提高可靠性
提高安全性
冗余
提高安全性和可靠性
工作冗余:热储备:所有单位一起工作
备用冗余:冷储备:备用单位一般不工作,发生故障后启动工作
状态检测
持续检测工况
被测参数不会达到事故发生程度
故障-安全
确保故障不会导致安全事故的发生
故障--安全消极设计:发生故障,停止工作,能量降到最低
故障--安全积极设计:发生故障,采取纠正措施或启动备用系统
告警设计
向有关人员通告危险、设备问题等状态
标志设计
目视警告手段
文字
颜色
图样
损伤抑制防护设计
隔离及防护设备设计
人员通常是穿戴
能量缓冲装置
逃逸、救伤、营救
自身携带资源实现
自我救护和营救
挽救紧急状态人员
防薄弱环节
故障最小化设计
考虑容易发生故障的环节进行可靠性设计
安全系常用分析方法
通用安全性设计准则具体要求
通过设计消除危险或降低到可控水平
危险物质要进行隔离
不能消除的危险要采取补偿措施减少风险
补偿措施不能降到允许范围,要进行告警
减少恶劣环境的危险
产品设计同时要进行防错设计
产品布局要让危险源尽量远离人员
综合考虑多种不利因素,留有一定的设计余量
一级、二级危险采取容错设计
影响安全的关键功能冗余在物理和功能上进行隔离
进行故障隔离设计
安全性起关键作用的系统进行安全设计,发生故障后不影响安全
具体要求
环境危险:
自然环境
诱发环境
热危险
将温度和热流控制在规定范围内
要设计冷却系统
三种热传递方式:辐射、传导、对流
压力
保证系统完成任务,压力尽可能降低
设计压力系统必须考虑压力媒介和环境温度
液压比气压安全
考虑正压和负压的影响
毒性
影响人员,不一定影响设备
分为窒息物和刺激物
颗粒物、液体物、气体物
通风口要原理废气口,远离操作员
隔离空间要用呼吸装置帮助
振动
时刻注意震源
注意是否有共振
无法消除共振要对振动隔离
噪声
噪声是振动的结果
噪声与振动是同样的原因
方法是消除和控制、防护三种
无法消除就控制,无法控制再防护
防护有隔离和设备两种措施
辐射
辐射控制是专业性很强的工作
屏蔽
联锁
挡板
制定规程
化学反应
剧烈反应
温和反应
避免使用会剧烈分解的化合物
物品混合要考虑可能的化学反应
污染危险
污染源可能是固体、气体、液体以及组合形式
找到污染可能来源,采取有针对性的措施
不干净的外界环境引入要选用合适处置设备
防止溢出和泄漏
密闭设施内部出现污染要考虑
材料变质
强度减低
特性变化、失效
控制变质
着火危险
阻燃
隔离
爆炸
严格控制起爆的措施
电子电气危险
点击、短路、过热、意外启动、静电
不按规程操作电气
交叉出现多种情况
采取绝缘、防电等措施
防加速危险
运动中的物体造成人员和财务损坏
设计同时采取措施予以消除
安装防护装置防止冲击
机械危险
大型机械的结构性危险(尖角、突出物)
设计同时要考虑减少或防护
加强措施防护
防止误操作
安全性验证方法
安全验证方法
概述
目的是验证是否达到研制要求
安全事故是一个极小概率,定量要求很高
安全性验证贯穿在研发过程中
层层把关
转阶段把关
定型把关
工程分析
分析原来的工程设计计算
核算影响安全的关键部件承受的应力是否在范围内
验算设计师在做安全性设计的其他工程计算
仿真
仿真和虚拟现实
定性验证
定量验证
检查评审
目视
工具测量
检查清单
转阶段要进行专家安全性评审
演示
不用设备
用通过或不通过表示是否按期望运行
通过实物模型、样机、产品等多种演示
试验
实验室模拟实际
实际现场测试
采用试验和验证的方法
安全装置、告警装置、特殊规程:要通过专门安全性试验来验证措施有效性
复杂产品:通过低层次产品试验和高层次产品的综合分析结合来验证
安全验证评价
目的和内容
重点
危险分类和排序以及依据、来源
识别危险的分析和试验结果
确认安全性设计要求或验证安全性设计措施
残余风险及安全性改进
现阶段安全性工作成果
安全性评价三个问题
产品安全性与要求的符合程度
产品状态与相关标准的符合程度
产品安全性工作过程、结果、与工作计划的符合程度
安全性评价的方法
风险评价法
根据可能性和后果严重性来评价预计损失和采取措施的有效性
风险分析和评定两部分构成
风险分析
识别
估算
风险评定
处理
可接受性
常用方法
风险评价指数法:简单直观、主观性强
总风险暴露指数法:风险评价指数法的扩展,用货币表示、量化
可靠性工程的风险评价法:可靠性工程原理与实践经验为基础的定量法
综合评价法:汇集报告和资料进行综合分析
评价方法和准则
系统及说明
安全性数据
安全性试验评价
危险物的数据和资料
软件安全性
危险三要素:硬件、软件、人为
安全工作项目
外购和通用软件的分析测试
软件安全需求分析
设计安全分析
代码安全分析
运行阶段的安全
安全性管理
涉及寿命周期的各个阶段、各个层次
包括内容
安全性要求确定
安全性设计与分析
安全性验证与评价
安全性保障
全过程、全要素严格安全管理
加强监督和控制
事故是极小概率时间,要保持高度警惕,进行监督和控制
开展工作内容
制定计划
建立组织
对供应商综合管理
安全性评审
危险跟踪与风险处理
安全性关键项目的确定与控制
试验安全
安全性工作进展报告
安全性培训
工程应用要点
安全性是最重要的质量特性
安全事故是小概率事件,要高度重视
寻找和发现危险源是一项重要工作,掌握危险分析方法
消除和控制危险是根本途径
可靠性与安全性,冗余设计与安全性,要进行权衡
重视信息管理,从信息中挖掘安全保证
10. 保障性工程基础
保障性基本概念
概述
使用保障、维修保障
全寿命周期保障
装备设计特性
计划的保障资源满足平时和战时需要的能力
保障性
产品保障性设计特征
与保障有关的设计特性
与产品故障相关的维修保障特性设计
与产品使用有关的维修保障特性
维持产品正常使用的保障性
通过设计赋予保障性
保障资源
完成产品的维修保障和使用保障要有保障资源
人力、备品、器材、工具、设备
不同产品保障资源不同
孤立的保障资源有机组合起来,高效发挥效用
平时战备和战时使用要求
平时:可用性、战备完好性,随时开始执行预定任务的能力
战时:要求任务持续性、达到要求的执行任务程度
从产品本身和保障系统运行两个方面进行设计、分析、试验、评价
综合保障
内容
保证设备完好、降低寿命周期费用、综合考虑装备保障、确定保障性要求
综合保障是一种理念,实质是吧各项工作尽早落到实处的迭代过程
综合保障要素
规划维修:确定维修方案,制定维修计划
人力:达到保障性需要的人力
供应保障:规划、确定并获得备品的过程
保障设备:实现保障、维修的设备
技术资料:使用、维修所需要的资料
训练和训练保障:
计算机资源保障
保障设施
包装、装卸等:方法和规范
设计接口:利用接口实现保障性、维修性
任务
确定保障性要求
设计过程中进行保障性设计
规划并及时研制需要的保障资源
建立有效保障系统,使装备获得需要的保障
原则
保障性要求作为性能要求的组成部分
论证阶段考虑保障问题,纳入设计中
充分进行保障性分析,权衡要求和资源保证,以合理寿命周期费用满足系统战备
寿命周期各阶段,各要素要协调
资源规划过程充分考虑现有资源
系统
资源、活动、组织构成的有机整体
资源包括人力、物力、设备、资料
活动包括使用保障活动和维修保障活动
组织包括不同维修级别的组织
要求:及时、有效、部署、经济、可用、通用
主要工作
规划、管理、评审、监督、控制
规划使用保障、维修、保障资源
研制、提供资源
装备部署保障
试验与评价
可用性
可用性是产品在任意时刻和开始执行任务时候,处于工作状态或者可使用状态的程度
可用度=能工作时间/(能工作时间+不能工作时间)
固有可用度:故障间隔时间/(故障间隔时间+平均维修时间)
可达可用度:平均维修活动间隔时间/(平均维修活动间隔时间+平均维修时间+MTTP)
增加预防性维修时间
使用可用度:平均维修活动间隔时间/(平均维修活动间隔时间+平均维修时间+MTTP+MTMLD)
增加管理和保障资源延误时间
保障性要求
取决于装备本身的保障性设计水平和保障系统的能力,保障性包括不同层次、不同方面
定性要求
保障性设计的定性要求
可靠性
维修性
运输性
各个维度
保障系统及资源的定性要求
特殊保障要求
定量要求
保障性参数
可用度参数
保障性特征参数
保障系统和资源的参数
保障性指标
已选择参数进行赋值
综合保障规划与管理
装备说明、工作要求、工作机构、职责
关键因素改进
分析计划、使用保障、维修和资源保障
项目、目的、内容、主持单位、评审时间、判据、评审意见
保障性试验与评价计划
综合保障和其他工程协调
供应商监督与控制
工作进度
规划使用保障
以客户要求为输入
不同类型装备执行相同任务需要保障不同
相同装备执行不同任务,需要保障也不同
工作类型
检查、审核
挂装、添加
调试、校准
挂扣、连接
软件操作
规划维修保障
规划预防性维修:编制有关维修技术资料
修复性维修:LORA修理级别分析
规划与研制保障资源
人力和人员
使用和维修人员
技术水平、业务素养不尽相同
供应保障
备件和消耗品保障
确定原则、方法、约束条件
保障设备研制
通用保障设备
专用保障设备
训练和训练保障
初试训练:研制方主导,使用方配合,要求快速掌握使用方法
后续训练:使用方主导,正规、严格培训
技术资料编写
构造
使用
维修
保障
合格证明
操作维修手册
保障设施规划与建设
永久性设施
半永久性设施
配套设备
包装、装卸、贮存、运输保障
规划计算机资源保障
硬件保障
软件保障
保障性试验与评价
人力
供应
设备
训练
技术
设施
包装运输
计算机
工程应用要点
两大主题:使用保障、维修保障
使用保障简单、主观,维修保障比较复杂
综合保障要抓住8中保障资源的内容及要求,10个综合保障要素
保障性与各个维度因素密切联系,综合考虑
保障性要贯穿装备全寿命周期
注意保障性基础数据的收集、处理、共享
9. 测试性工程基础
测试性基本概念
概述
准确的发现和正确的隔离故障
PHM(故障预测与健康管理)
只要是产品都有测试性问题
测试与测试性
测试:一种技术操作
测试性:产品能及时准确的确认状态并隔离内部故障的能力
是产品设计特性,固有属性,产品通用质量特性的一种
设计产品时为故障诊断提供方便的特性
故障检测与隔离的难易程度直接影响故障修复时间
产品越复杂,检测越难,影响越明显
提高可用性、缩短故障监测和隔离时间
提高产品固有测试性
采用机内测试(BIT)自动测试设备(ATE)和中央测试系统等诊断技术或工具
常用术语
被测单元:被测试的系统或部件
测试点:注入信号的电气连接点
故障检测:发现故障存在的过程
故障隔离:确定故障产品层次的过程
故障定位:确定故障位置的过程
固有测试性:取决于产品设计,不受到激励数据和响应数据的测试性,反映对测试的支撑性
机内测试:系统或设备内部提供的监测和隔离故障的自动能力
虚警:指示有故障,实际不存在
诊断方案:对产品诊断的总体构想
嵌入式诊断:内部提供的故障诊断能力
综合诊断:分析多种要素,使系统诊断能力达到最佳结构化设计与管理
中央测试系统:用于采集测试相关数据进行集中处理的综合测试系统
测试性定性要求
定性要求反映无法定量描述,但是又应该考虑的测试性设计要求
定性测试项目
合理划分测试单元:准确隔离故障的能力为基础进行功能和机构分析
多个现场可更换单元
多个车间可更换单元
关键性能监测:影响关键任务完成和涉及使用安全的功能部件
确定机内测试和中央测试系统:确定嵌入式诊断具体配置和功能
测试点设置:设置充分的内外部测试点
诊断能力:提供一致且完整的诊断能力
测试性定量要求
故障检测率:正确检测到的故障数和被测产品发现的故障数之比
故障隔离率:正确隔离到不大于规定模糊度的故障数与检测到的故障数之比
虚警率:规定时间内发生的虚警数与故障指示数之比
测试性常用度量参数
测试性指标是对具体测试对象所用测试方法的指标
统计时间要足够长,使得测试数据接近真实值
统计的是发生故障的总数,是正确测试和正确隔离的故障数
共计的虚警应该包括“假设”和“报错”
测试性设计与分析
固有测试性设计
基于测试性的结构设计
产品结构和功能划分:
测试可控性
测试通路
初始化
元器件选择
兼容性
嵌入式诊断方案设计
BIT配置方案
性能监测方案
中央测试系统配置方案
制定和贯彻测试性设计准则
一般要求
一般要求的设计准则
测试设计必须与主设备设计同步进行
测试数据
嵌入式诊断设计:应对监测点
传感器:满足环境适应性,快速、一致、可重复响应
测试点设计:尽可能在前面板、按照可达性和方便测试顺序组合
电子功能结构设计:留有足够空间,允许插入与测试有关的探针
电子功能划分
测试控制设计
测试通路设计
元器件选择
模拟电路设计
射频电路设计
电光设备设计
数字电路设计
基于边界扫描的电路板设计
BIT设计
设计要求
产品设计的一部分
分别设置必要的BIT电路
BIT可靠性高于被测单元一个数量级
电路中故障不应影响产品功能
尽可能与产品所用电路类型相同
能区分是设备故障还是BIT电路故障
BIT应设计成不需要调整和校准的
BIT电路虚警尽可能少
使用微处理进行测试和监控
BIT电路不应超过电子系统电路5%~10%
BIT软件要求
产品数据和测试数据分开
尽可能用现有数据库
检测到故障情况,依靠软件可以最大限度的获取所有测试点信息,提高置信度
估计BIT软件用存储器的容量
存储器的字长满足BIT要求
软件层次结构足以控制和观察硬件
故障信息要存入非易失存储器
减少BIT虚警设计
增大灵活性,系统总体变化、软件易于改变不影响任务软件
分布式测试时钟直接支出故障点
提供数据记录功能
确定合适容差
三种BIT应用
周期BIT:不间断工作,实时监测和隔离故障
加电BIT:系统通电,就开始测试,系统自检
维修BIT:操作人员或系统自己启动
显示系统状态
显示补充数据
进行人机交互
抹去故障数据
设备、系统参数调整
测试点设计
原则
测试点是产品设计的一部分,允许定量测试、性能监测和校准
测试点包括在I/O连接器中,诊断测试点在设备外部
测试点要baohu测试点要保证人身和设备安全
选择
故障隔离要求
迅速通过产品插头连接
测得电压、电流符合安全要求
测量值以公共设备为基准
保证不会因为测试连接而降低设备性能
测试点要考虑高低电压隔离
数字与模拟要分别测试
外部测试点设计
外部测试插座,平时留有盖子
允许施加外部激励进行测试
内部测试点设计
功能插座和外部测试点一起将故障隔离
端对端定量检测
测量必要参数进行调整和校准
必要的故障隔离
LRU测试点设计
测试点必须在负载不敏感的电路节点
增加缓冲电路保证兼容
为假定故障设计测试点,不是所有故障
故障诊断设计
嵌入式诊断设计
多系统融合
充分应用设计资料
产品使用和维修的要求
产品诊断、故障预测和健康管理的要求
外部诊断设计
有效利用各项诊断资源
满足各级维修的外部诊断要求
包括测试点设计、诊断程序设计、外部测试设备兼容性设计
测试性验证方法
目的是发现缺陷,提供改进依据,考核测试性要求进行评价
测试性核查
最大限度利用数据
测试性验证试验与评价
目的:验证产品是否达到规定测试性指标要求
故障检测率和隔离率的试验验证
用模拟故障的方法进行
模拟故障样本量
模拟故障分配与模拟
试验程序
数据处理
虚警率验证
测试性管理
制定计划
监督供应商
评审
数据处理
测试性增长
工程应用要点
测试性好,缩短维修时间
与其他质量特性密切相关
及时准确检测,正确隔离故障是两大主题
坚持定性与定量结合
重视测试性数据的收集、分析、处理
8. 维修性工程基础
维修性概念
维修概述
出问题快速修好才算好产品
预防性维修保养要迅速、经济
研究可靠性同时要研究维修性
可靠性再高也要维修
产品越复杂,维修保障费用越高
维修性
维修性:规定条件和规定时间内,按规定方法维修保持或恢复到规定状态的能力
包括:保养特性和修理特性
关注焦点:尽量减少维修人力、时间、费用
规定约束条件下完成维修的可能性
规定条件、规定程序方法
维修是为了保持或恢复到产品规定状态所进行的全部活动
维修性度量参数
时间范围
维修性函数
维修度:可以修好的概率
维修时间密度函数:规定时间内可以修好的可能性
修复率
维修时间分布
指数分布:维修率为常数,适用于大系统中的维修任务
正态分布:故障简单,维修单一,作业时间固定
对数分布:复杂产品和系统的维修时间分布
维修种类
修复性
预防性
维修事件、维修活动与基本维修作业
维修事件:按预定计划的维修活动
维修活动:使产品保持或恢复到规定状态的维修作业
基本维修作业:一项维修活动可以分解的工作步骤
可更换单元
规定维修级别上整体拆卸和更换的单元
现场可更换单元
车间可更换单元
维修性要求
定性要求
良好可达性
提高标准化和互换性程度
完善防错措施及识别标志
保证维修安全
良好测试性
符合维修的人素工程要求
定量要求
维修性参数
平均修复时间
最大修复时间
修复时间中值
预防性维修时间
维修性指标的确定
过高指标需要更先进技术和设备实现
过低指标将使得产品停用时间过长,降低可用性
维修性设计与分析
将维修性要求落实到产品设计的一个过程
维修性分析的目的
对产品开发过程不同阶段推测,评价维修定量要求,为比较和优选产品方案提供依据
发现和确定产品薄弱环节,改进
分析确定维修需要的关键保障资源
分析结果是进行维修设计的重要依据,不能直接影响维修性
维修性分配
定义
把维修性的定量要求分配到各个组成部分
目的是通过分配明确组成部分的维修性要求或指标,形成设计依据
尽早开始、逐步深入、适时修正
分配程序
系统维修职能分析,确定维修职能和流程
系统功能层次分析,确定组成部分的维修措施和要素
确定系统组成部分维修频率,修复性、预防性频率
维修性指标分配到各组成部分
研究分配方案可行性,综合权衡,局部调整
考虑因素
故障率,故障率高维修时间短
维修级别,相应级别条件分配工作指标
维修类别,区分修复性还是预防性或者综合的
产品功能层次:自上而下分配到需要更换或修理的低层次产品,按照产品功能层次和维修需要划分单元
维修活动:每次维修都要按合理顺序完成维修活动,一次维修时间由响应若干时间元素组成
常用方法
故障率分配法
相似产品数据分配法
故障率和设计特性加权的综合加权分配法
维修性分配要分配各种维修活动时间
维修性预计
根据经验和相似产品维修性数据,预测其维修性参数,了解满足维修性要求的程度和发现薄弱环节
维修性预计参数与规定指标参数一致:平均修复时间、最大修复时间、工时率、预防性维修时间等
维修性预计的具备条件
参考的产品数据
新产品设计方案或硬件结构设计
新产品组成部分的故障率
新产品初步的维修工作流程、时间、顺序
维修性预计难于可靠性预计
RCMA
RCMA:以可靠性为中心的维修性分析(reliability centered maintenance analysis)
以最小的维修资源消耗保障产品固有可靠性和安全性的原则
系统和设备RCMA
收集产品概况
分析故障是否影响安全性、任务性、经济性
确定是否是重要功能产品
确定的重要功能产品进行FMECA分析
确定故障原因、模式等
用维修工作逻辑判断预防性维修工作
有效性是根据预防性维修工作对产品故障后果的消除程度
预防性维修工作费用要低于产品故障引起损失的费用
有历史数据的最好,没有的根据客户要求确定
结构RCMA
确定结构的检查登记、间隔期、维修级别
适用于复杂结构
尽可能收集结构信息,划分为重要结构和非重要结构
对每个重要项目进行FMECA分析
逻辑图决断
非重要结构项目进行RCMA,确定适宜的工作要求,通常是目视
区域检查分析
分析确定区域的检查要求
按相关规范文件和订购方、供应商协议确定检查方式和标准
区域检查间隔期与预定产品维修间隔期一致
维修级别分析
维修级别
LORA:level of repair analysis
产品开发阶段对有故障产品进行非经济性或经济性分析以确定维修级别
维修级别
基层:产品操作和保障人员执行维修的机构,只限于简单维修保养
中继:较高的维修能力
基地:产品大修、大部件修理、备件制造和中继完成不了的
离位维修与换件维修
离位:拆下来维修
换件:拆下来换备件
产品修理约定层次
外场可更换:基层
车间可更换:中继
基地可更换:基地
目的是确定最适宜最经济的方式
考虑维修任务、使用单位、编制体制、维修原则
确定产品在哪一级维修或者报废
初始设计如果改了,维修级别分析需要不断迭代
使用与维修工作分析
使用与维修工作分析(operation and maintenance task analysis)O&MTA
将产品的使用与维修工作区分为各种工作类型和分解为作业步骤而进行详细分析
确定各项保障工作所需要的资源要求
确定预防性维修工作及修复性维修工作分解成详细步骤
根据工作特点分别进行工作与技能分析,确定每项作业步骤的保障资源需求
将系统的维修性要求及使用和保障约束转化为具体的产品设计而确立的准则
维修性是产品固有属性,要根据设计使用经验拟定设计准则指导设计
维修性设计准则的制定和贯彻
维修性设计准则的一般内容
简化产品、简化维修
维修可达性
标准化、互换性
模块化设计
完善的防错和识别标志
检测诊断准确、迅速、简便
符合人机工程要求
考虑预防性措施、不工作状态对维修性影响
维修性设计准则制定的注意事项
标准提供依据,不替代设计准则
不同产品突出重点
维修性验证
试验与评价的内容
发现和鉴别有关维修的设计缺陷,采取纠正措施
维修性核查:对研制过程进行试验与评价
维修性验证:是否达到规定维修性要求,制定试验结构进行
维修性评价:实际使用过程中进行
包含定性与定量两个部分
一般程序
准备
制定计划
选择方法
确定试品
培训人员
准备环境
试验设备及保障设备
实施
确定样本量
选择与分配样本
故障模拟与排除
预防性维修试验
收集数据及评价
编写报告
验证方法
维修时间
平均修复时间
预防性修复时间
最大修复时间
试验样本的确定
验证结果评估
维修性管理
目标:通过有效的实施过程控制、确保研制、生产、改性产品达到维修性要求
原则
论证阶段就要开始
纳入产品的研制工作
需要组织结构和职责的保障
贯彻法规、执行标准
预防为主、早期投入
需要依赖完整、准确的维修性信息
经费保障
要点
制定维修性工作计划
做什么
何时做
谁去做
如何做
保证落实和管理
反映重视程度
便于评价
作用
供应商监督与控制
维修性评审
根据合同要求制定评审计划
评审点、内容、类型、要求
提前安排,保证成员有准备的参加
评审结果要形成文件,方便差异
维修性数据收集、分析、纠正措施系统
维修性增长管理
以维修性增长为目的,促使产品经济且有效达到维修性目标
跟踪与控制要及时掌握维修信息
工程应用要点
维修性与维修的区别
维修性是一种特性,需要开展一系列的工作
维修是一种工程活动
明确修复性与预防性维修的区别与关系
修复性:已发生故障,故障处理
预防性:未出现的故障,故障预防
目标都是让产品达到规定状态
尽早将维修性设计分析纳入产品研发过程中
维修性是设计出来的
从早抓起,从系统抓起
维修性要早起投资如,不但要达到规定性能,还要考虑实现维修性要求
了解FMECA\LORA\RCMA\O&MTA的关系
FMECA:
LORA:
RCMA:
O&MTA:
维修性试验与评价要有计划进行
7. 可靠性管理
可靠性管理基础知识
概念
可靠性来源:设计赋予、制造保证、使用中发挥,综合要管理
涉及产品寿命各个阶段
可靠性管理是组织管理工作的一部分
基本职能:各项可靠性活动策划、组织、监督、控制
包括内容
企业整体可靠性
具体产品研发可靠性
可靠性涉及范围
高管
部门领导
一线技术人员
制造
售后
认识层面
技术层面
人员素质方面
试验条件方面
可靠性发展战略
可靠性
维修性
测试性
保障性
安全性
指导思想和工作原则
专业队伍建设
制定中长期培训规划
建设系统
改进流程
可靠性有机的融入企业流程中
制定企业标准和规范
划定人员职责
完善试验系统
建立奖惩规则
制定可靠性目标
可靠性工作基本原则
目标是达到可靠性要求
产品研发时候要进行定量要求,且要求可实现
预防为主,早期投入
可靠性纳入产品研发环节中
遵循成熟设计的可靠性设计原则,控制新技术应用
软件开发符合工程化要求
采用有效方法和控制程序
规范化工程途径开展工作,形成报告
加强监督与控制
重视用户使用过程的可靠性
新产品开发要选择效费比高的方案
可靠性工作规划
故障报告分析及纠正措施系统
可靠性工程的任务:防止故障发生
可靠性度量:无故障工作的概率或无故障持续时间
FRACAS基本概念:故障报告、分析和纠正措施系统
功能:收集、传递、反馈、分析、处理、归档、显示故障信息
FRACAS工作流程
闭环系统
开始
发现
报告
核实
隔离
更换怀疑系统
验证怀疑系统
故障分析
根源分析
纠正措施
纠正措施验证
评估纠正措施有效性
纠正措施应用
推广借鉴
结束
FRACAS实施步骤
发现报告故障
观测到故障
记录观测到的故障
发生的系统、设备、部位
日期、时间、时机、故障前正常工作时间
故障症候和现象
故障发生的重要条件,包括使用、环境等
故障核实:填表记录
分析确定故障原因
隔离故障,将故障确定到最低层级
更换可疑故障产品,重新测试系统,确认原有故障已消除
故障产品进行测试,故障复现,核实是否确实有故障
故障原因和机理分析
查找类似故障
确定故障发生的条件、原因、趋势、填写故障分析报告
纠正措施,故障归零
提出改进措施
措施纳入原试验系统
改进的系统进行试验,填写措施实施报告
纠正措施落实到设计文件,工艺文件、实物上
跟踪实施了纠正措施的产品试用情况
举一反三,借鉴推广
系统有效的标志
研发结束,尚未量产
研发过程中的故障及质量问题完整、准确的故障分析和纠正措施记录
量产后
小批量产品要有出厂后的使用过程故障及正常工作完整、准确的记录
大批量产品要选择不同地区、不同客户的系统跟踪记录
不断与故障做斗争,跟踪数据提供依据
故障归零管理
归零:对产品发生的质量问题和故障从技术上的五个方面和管理的五个方面逐项落实
技术五归零
定位准确
机理清楚
问题复现
措施有效
举一反三
管理五归零
过程清楚
责任明确
措施落实
严肃处理
完善制度
可靠性评审
定义
及早警告原理
同行专家评议原则
专家智慧和经验弥补开发团队及个人不足之处
团队在专家指导下开展工作
规定评审点,组织专家及公司代表
审查发现薄弱点,提高设计成熟度,降低决策风险
作用
评价产品设计是否符合可靠性设计准则,规范及有关标准
发现薄弱环节,提出改进意见
全面检查产品可靠性保证大纲实施的效果
减少设计更改,缩短开发周期,减少寿命周期费用
原则
谁设计谁负责,谁总抓谁负责
有计划、组织、结论的评审程序,严肃、权威
强调评审有效性,不能走过场
实施
评审前准备详细资料,不得以保密为借口拒绝提供
制定评审提纲和具体要求,防止泛泛而论
评审专家经验丰富,敢于直言,知识广博,善于组织会议
给专家充分时间审阅资料
保证审查时间
审查结论客观公正
建议有针对性和可操作性
评审结论要跟踪
可靠性工程知识培训
需求分析
企业面临的质量问题和挑战
解决问题和迎接挑战需要的质量与可靠性知识和技能
不同岗位人员现有的知识和技能
实现可靠性战略目标,岗位需要的可靠性知识
转岗人员和新员工的培训
培训种类
长期与短期
基础知识与专业知识
培训方式
核心人员派出去,全员培训请进来
形式多样,培训班,研讨会,专题讲座,成果交流,可靠性年会
培训效果
制定有针对性的培训计划,每次目的明确
选好老师,经验丰富、擅长沟通互动
理论联系实际
相互促进和学习
培训后认真总结,提出改善培训的建议,持续不断提高培训质量
可靠性工程师的角色
公司骨干
工程师基本要求
工程经验丰富,全面
掌握质量与可靠性的理论知识
善于沟通、相处、解决问题、管理团队
要有职业道德
安全健康第一
城市公正
忠于职守、不断改进
强化知识和技能
不承担做不了的事
以职业方式处理人际关系
不参与利益冲突
帮助同事提高能力,不进行不正当竞争
可靠性信息管理
概述
可靠性信息:产品形成全过程中产生与可靠性、维修、保障、测试、安全相关的资料数据
要系统化管理可靠性信息,不然数据会失去连贯性,可靠性上升到企业战略中
可靠性与质量管理密不可分,可以放在研发也可以放在品质
两方面管理内容
具体项目的可靠性数据
各种产品可靠性信息的综合
质量与可靠性信息主要内容
国内外各种现成的规范、标准、政策
研发过程中产生的可靠性信息
制造过程中产生的
顾客使用过程中产生的,售后服务产生的
投诉产生的
信息管理注意事项
要有制度和流程进行保障
重视信息源,落实到责任部门和个人
信息及时、准确、完整
信息综合分析和共享
产品可靠性保证大纲
概述
产品研发立项之初要对可靠性要求进行全面的策划
制定可靠性保证大纲来确保产品可靠性
可靠性工程师来负责
总体结构
参照国家标准
国际标准
地方标准
行业标准
工作项目要求
最小投入实现最有效的工作
客户要求是实施前提
立项时候论证可靠性要求
确定研制总要求要权衡、协调、调整可靠性的各个维度,用合理周期费用满足客户
确定门限值,目标值、最低可接受值
纳入合同文件,形成工作说明
计算工作效益
可靠性管理
制定可靠性计划
任务
做什么
何时做
谁来做
如何做
作用
从组织层面获取工作保障
反映承制方对可靠性要求的保障能力及重视程度
便于评价承制方的组织工作是否到位
对供应商监督控制
签合同时候结合定性、定量、复杂程度提出监控措施
持续跟踪监督
重要结点要进行控制验证
出现严重故障要及时分析,甲方要确认是否准确,措施是否有效
恰当时候采取恰当措施
可靠性评审
供应商内部评审
甲方外部评审
评审要有严格的计划,包括评审点、内容、类型、方式、要求
提前做出日程安排并通知各方代表
提前提供评审材料
评审结果要汇总成文件
建立综合系统
按照国家标准建立系统
尽早排除故障,提高可靠性
输入信息要准确,故障要核实,必要时候要复现
由低层向高层排查,做好标记,闭环管理
建立故障审查组织
大型设备要建立负责故障审查的组织,对故障进行有效管理纳入系统
组织的组成和工作要与质量和研发部门密切协作
甲方乙方共同参加
参加审查的要包括相关方面代表
可靠性增长管理
拟定增长目标、增长模型、增长计划
充分利用可靠性管理中形成的数据资料
跟踪控制系统,完成目标
可靠性设计与分析
设计的重要性
可靠性是设计出来的
分析尽早发现产品薄弱环节提高可靠性
设计直接影响周期寿命和费用
建立可靠性模型
目的:可靠性分配、预计与评价
包括可靠性框图和可靠性数学模型
框图:逻辑关系
数学模型:函数关系
可靠性分配
可靠性指标逐级分解到较低层次
整体到局部,由上到下
研制早期进行可靠性分配
分配到产品层次的目的
各层次设计人员尽早明确可靠性要求,为他们提供设计依据
为供应商提供依据
根据可靠性要求配备资源
分配要结合可靠性预计逐步细化,反复迭代
模型逐渐细化,分配反复进行
将分配结果与经验数据集实际结果做比较,确定合理性
分配无法达到要重新分配
按照规定值进行分配,留有安全余量
可靠性分配为其他研发模块提供信息
可靠性预计
估计规定条件下的可靠性
较低层次推导到较高层次
局部到整体,由下而上,反复迭代
用于选择最佳方案
预计值不能作为达到可靠性的依据
结合复杂程度、费用、进度、开发阶段等因素
约定层次越低,工作量越大
与FMECA最低产品层次保持一致
进行FMECA
规定的产品层次进行
包括类型
FMEA
设计FMEA
过程FMEA
CA
故障树分析
确定产品故障原因的各种可能组合和概率
从上往下逐级分解
发现薄弱环节,采取响应措施,提高可靠性
潜在分析
假如所有系统都正常,找一下什么潜在原因会导致异常出现
试验很难发现
识别潜在状态,不考虑环境影响
设计阶段后期进行
难度大,成本高,只在关键产品进行
电路容差分析
容差累计会造成输出超差
在关键节点进行容差分析
确立可靠性设计准则
根据要求和固有特性制定设计准则
执行中不断完善
评审时候将准则和符合性报告列入检查清单
元器件、零部件和原材料的选择与控制
减少零件品种,保持提高固有可靠性,降低保障费用和寿命周期费用
研制早期进行元件选择,应用、控制,贯穿寿命周期,提高优化程度
多维度考量
确定可靠性关键产品
一旦发生故障严重影响安全性、可用性、任务成功及寿命周期费用的产品
价格昂贵的产品属于可靠性关键产品
主要研究对象,要做好产品确定和控制工作
确定方法
安全、任务、费用
故障就得不到关键数据了
严格性能要求
新技术含量高
故障引起大范围整体故障
应力超出规定降额准则
已知某种条件下的寿命,需要进行特别控制
需要采取专门预防措施
难以采购,技术较新,难以制造
历来就可靠性差
新零件,没有历史数据
缺乏数据可追溯性的
大量使用的
清单动态更新,定期评审
确定支援工作对可靠性影响
包装
包材与产品长期解除发生化学反应
包装应力导致产品失效
运输
运输与包装不匹配
运输中的振动等因素影响
贮存
内部老化
外部作用
要进行贮存设计 合适的材料和部件,防腐措施采用 控制贮存环境、改善封存条件、减少环境故障
装卸
不适当装卸方式
包装破损
维修测试
多次维修会降低可靠性
储存的产品进行测试也会降低
有限元分析
产品结构划分成结构单元描述应力和位移
单元间通过矩阵方程联结,用计算机求解
难点是建立合理模型,选择合适软件进行特定功能分析
分析结果可以指导设计,提高可靠性
耐久性分析
用耗损故障前时间表示
用于机械和电子产品
尽早识别解决过早出现耗损故障的设计问题
分析耗损特征来估算产品寿命
确定超过寿命后继续使用的可能
为维修策略和产品改进提供依据
可以用试验,也可以用使用反馈数据
可靠性试验与评价
试验的两个目的
发现缺陷,暴露潜在故障
获取评价可靠性的各种数据
可靠性验证是一个鉴定工作,评价是否符合要求
工程试验
环境应力筛选
可靠性研制试验
可靠性增长试验
暴露缺陷,加以改进,提高可靠性
统计试验
可靠性鉴定试验
可靠性验收试验
寿命试验
可靠性分析评价
验证设计是否达到要求
具体步骤
环境应力筛选
剔除制造过程中使用的不良元器件和引入的工艺缺陷
每个组装层次都展开
剔除低层次产品组装成高层次产品过程中引入的缺陷和接口缺陷
着重发现早期故障,无需准确模拟
依次施加环境应力,种类和量值不断调整
最佳效用费用进行剪裁
可靠性研制试验
增长摸底试验:以增长为目的,无增长模型,不确定目标值的短时间增长性试验
可靠性强化试验:通过加速应力不断激发缺陷予以改善
不要求模拟环境真实性,强调激发故障
加速应力试验,可以超过规范极限
三轴六自由度振动和高温变率试验
设计、元件、材料、生产、工艺都落实的样件上进行试验,尽早进行,以便改进
高加速寿命试验:
结合性能试验
环境试验
可靠性增长试验
可靠性鉴定试验
如果客户认可,增长试验可以代替鉴定试验
可靠性验收试验
可以抽样进行
不得放弃验收
根据费用效益加以权衡
可靠性分析评价
评价装备和分系统的可靠性
多种方法评估是否达到规定的可靠性
寿命试验
耗时,费用高
评价长期预期使用环境对产品的影响
需要仔细分析,收集磨损数据并及时分析
明确寿命试验要求,若可行要采用加速寿命实验法
使用可靠性评估与改进
包括信息收集、可靠性评估、可靠性改进
目的
利用信息评估装备可靠性,验证是否满足规定,如不满足,提出改进建议和要求
发现缺陷进行改进
为客户使用、售后维修提供参考信息
改型、新研可以参考