导图社区 临床生物化学检验项目临床应用性能评价
临床医学第三章 临床生物化学检验项目临床应用性能评价知识梳理,包括性能评估、检验项目临床应用意义、检验结果判断依据、检验项目的诊断或筛查性能等等。
编辑于2022-09-14 00:15:15 江苏省概述
概念
生物化学检验项目
指应用各种生物化学检验技术和方法,通过对患者血液、体液和组织中的物质进行检验,为临床对疾病的预防、诊断、治疗、检测和预后判断等提供实验信息和诊断依据的实验室诊断方法或试验
分类
筛查试验
用于检测整个人群或部分人群中待测物的存在情况的检测方法
通常情况下,筛直试验结果阴性,提示被检测人待测物阴性的可能性很高,而筛直试验结果阳性仅提示阳性结果的可能,需要进一步的确认
诊断试验
用于识别临床上疾病人群中相应待测物存在情况的检测方法
如果待测物对于治疗以及判断预后有重要意义,则该诊断试验应具有足够高的灵敏度和特异性
确认实验
用于验证筛査试验或者诊断试验结果的检测方法
对于确证试验,特异性和阳性预测值比灵敏度和阴性预测值更为重要,确证试验的特异性应当大于98%
性能评估
技术性能评估
诊断性能评估
临床效应评估
经济效应评估
检验项目临床应用意义
检验项目临床应用面临的问题
新技术、新项目的临床应用产生了疑问
临床生物化学检验学科发展的需要
决定新检验项目的临床应用
合理选择检验项目的适用范围、科学解释检验结果
为制定临床检验实践指南提供依据
临床生物化学检验工作的基本任务之一
合情合理地开展和使用众多的检测项目
开展全方位咨询工作
与临床沟通,进行后效评价
指导检验工作者撰写研究论文
检验结果判断依据
在某种疾病的患者和非病者之间,检验结果及分布是否存在定性或定量的差异性
是否建立判断机体是否健康或疾病状态的参考标准,如参考区间(包括参考上限和参考下限),用于判断机体有无疾病
是否建立判断疾病发生、发展不同阶段,或疾病程度的参考标准,如医学决定水平、危急值,用于疾病的分级管理等
检验结果
真阳性(TP)
指检验项目正确分类的患者的数目
假阳性(FP)
指检验项目错误分类的非患者的数目
真阴性(TN)
指检验项目正确分类的非患者的数目
假阴性(FN)
指检验项目错误分类的患者的数目
检验项目的诊断或筛查性能
准确性
为鉴别和预测患者或非患者能力的指标
敏感度
特异性
似然比
预测值
......
可靠性
是重复试验得到相同结果的稳定程度指标
变异系数
符合率
......
参考区间、分界值与医学决定水平
参考区间的建立与验证
介绍
当特定的参考区间不再适用服务人群时,应进行适宜的改变并通知用户
实验室在引进新仪器和新试剂盒或进行相应改进后,应对厂商等提供的参考区 间进行验证或自行建立参考区间
文件
目前最常用的建立和验证参考区间的方法:2010年, CLSI C28-A3c《临床实验室如何定义、建立和验证参考区间》
我国卫生行业标准 WS / T 402-2012《临床实验室检验项目参考区间的制定》基本引用该方法
概念
参考个体
根据设计标准筛选出进行实验的个体,健康状况需符合要求参考人群
参考人群
由所有参考个体组成的群体,为数量未知的假设实体。参考群体只有一个成员时,主要是为自身或其他人做参考
参考表本组
选出的代表参考人群的适当数量的参考个体所组成的群体
参考值
通过观测或者测量一定数量的某种特殊类型的参考个体而获得的值或测量结果
参考分布
即参考值的分布,采用适当的统计学方法对参考值进行处理可得到参考值的分布特征
参考限
通常设定为包含中间95%的参考值。大多数项目以参考值分布的2.5%为下,97.5%为上限;如果只有单侧参考限具有临床意义,可以确定5%或95%为参考限
参考区间
介于或包含于两个参考限之间的范围。一般指从参考下限到参考上限的间隔值。在某些情况下可能仅有一个参考限,通常是上限 x ,相应的参考区间则为( 0 ~ x )或 ≤x
关系
建立参考区间
指在一个地区的健康人群中,规定若干条规格标准,从参考群体中抽取一定数量的参考个体进行调查测定,将测定结果进行统计学处理,求出相应的统计参数,并确定参考值和参考区间的过程
参考文件
参考值研究程序(如CLSI C28-A3)
步骤
个体的纳入与排除
直阅文献,列出该项目的生物变异和分析干扰因素,建立纳入和排除标准
设计调查表和书面知情同意书,参考个体完成调查表
参考个体数的确定和分组
参考个体数由参考区间上、下限相应的置信区间设置范围决定
参考上、下限90%、95%、99%置信区间,所需参考个体数分别为120、153、198
于严重偏态分布的结果,参考个体数可以高达700个
标本采集与测量
做好采样前的各项准备工作
正确收集和处理标本,处理方式须与为患者进行的实际常规操作一致
在良好的控制条件下,用事先指定的方法对处理好的标本进行检测,获得参考值结果
参考区间的统计学处理
参考限的确定:95%或2.5%~97.5%
参考限的可信区间:参考限的置信区间就是参考限值的可能分布范国,通常选择置信水平为90%时参考限值的分布宽度。增加参考个体的样本量可提高参考区间估计的精度
离群值的识别和处理:1/3规则,将疑似离群点和其相邻点的差值 D 和数据全距 R (该组数据的最大值与最小值之差)相除,来 D/R 比值
确定参考区间的方法:参数法(正态分布)或转換(如对数形式等)成“正态”后,用中心95%数据分布范围,非参数法(通常易除最低和最高的2.5%以外的观察值)
参考区间分组:对于三个成更多组别均值的比较,推荐使用 ANOVA ,若任何两 均值间的差异具有统计学意义时应用更严格的z检捡重新分析
多中心参考区间研究
要求
检验项目的测量结果要具有溯源性
确定参与的分中心数量及募集个体的数目,并应满足按年龄、性别和种族分组的要求
明确定义检验前过程及需要注意的影响因素
证明各分中心的测量结果具有溯源性及参与实验室已实现标准化
具有明确的质控规则,以此为依据接受或拒绝各分中心的数据
意义
对于测量结果具有溯源性的检验项目来说,可通过多中心研究建立参考区间
可减轻每个实验室收集120个参考个体的负担
多中心研究应考虑不同人群间的差异
但对绝大多数被测量而言,不同人群之间很少存在差异
一旦建立多中心参考区间,每个独立实验室只需要验证参考区间
参考区间的转移与验证
概念
参考区间的转移
是指将一个已经建立的参考区间改变成适应新分析方法或者新地点的过程
参考区间的验证
是使用相对较小标本量的参考个体、合理的置信度,检验将别处研究或建立的参考区间转移应用于本地时的可接受性的过程
可接受性
需采用参考值研究称素来验证,以下为主要内容
检测系统的可比性
不同检测系统或方法的可比性,可使用 CLSI EP9-A2文件《利用患者样本进行方法学比对和偏倚评估》验证确认
受试人群的可比性
相同或具有可比性的分析系统,其参考区间在实验室之间转移时,服务对象或人群的可比性可通过三种方法来评估其可接受性
主观评定
小样本参考个体的验证(约20例)
大样本参考个体的验证(约60例)
分界值与医学决定水平
分界值
概念
又称阈值、临界值、鉴别值、指定值等,是指划分检验项目结果正常与异常,或阴性与阳性的界值
分界值的位置直接影响检验项目的诊断性能
无重叠,假阳性=假阴性=0
完全重叠,敏感性=特异性=50%
分布有交叉,分界值的确定应综合研究确定
当D向右移动,假阳性减少,假阴性增加,敏感性降低,特异性増加
当D向左移动,假阳性增加,假阴性减少,敏感性增加,特异性减少
分界值的选择
传统方法:一般是先初步确定几个分界值,分别计算真阳性、真阴性、假阳性、假阴性数值,进一步计算诊断敏感性、诊断特异性等指标,最后根据早期诊断、疗效观察、流行病学调查等各种不同目的确定分界值
国际上公认推荐米用 ROC 曲线的方法选择分界值(石上角)
医学决定水平(MDL)
概念
指对疾病的诊断或治疗起关键作用的某一被测成分的浓度,即临床按照不同病情给予不同处理的指标阈值
包括
提示需要制定进一步检查计划的阈值,即待诊值
提示需要采取治疗措施的界值,即确诊值
提示预后或需要紧急处理的界值,即危急值
制定依据
医学决定水平的制定不但要根据健康人群参考值,也要根据无关疾病患者的参考值及有关疾病患者分型、分期的测定值,同时还要考虑文献资料及听取对实验诊断有丰富经验的医生意见
危急值
概念
指某项或某类检验的异常结果,而当这种检验异常结果出现时,表明患者可能正处于有生命危险的边缘状态,临床医生需要及时得到检验信息,给予患者迅速、有效的干预措施或治疗,以挽救患者生命,否则就有可能出现严重后果,失去最佳抢救机会
包括
危及生命的极度异常的检验结果
国家重大传染病:反映那些需要引起我们足够重视的患者的检验结果
界限的确定
根据年龄、种族、性别等人口统计学特点来设置不同亚组的界限值
基于医学决定水平,提出可能危急值界限
基于医疗机构、不同专业科室的临床救治能力提出可能危急值界限
基于本单位检测系统的生物参考区间
卫生部临床检验中心,建立危急值界限数据库
可参考公开发表的文献及循证医学的依据
由医院行政管理部门组织相关科室专家协商确定
周期性评估危急值界限,调整界限值
以参考区间为基础,根据不同临床目的,通过流行病学调查把诊断敏感性和特异性等指标放在适当的水平产生的“分界值”、“医学决定水平”
检验项目诊断性能的临床评价
内容
真实性
指检验项目本身能真实地反映疾病的本质或病理过程,其评价指标包括诊断准确性、可靠性等,评价过程符合临床流行病学的基本原则,能真实地反映检验项目的本质
先进性
先进性指与其他检验项目或旧检验项目相毗,新检验项目本身应在某项或某些方面具有优越性,包括诊断准确性、可靠性等,或实验性方面具有先进性
实用性
指新检验项目比原检验项目在某项或某些方面更易于推广应用,包括仪器设备、成本、来源、操作难度及效率、效益、效能副作用、对病人的危险性、病人的依从性等均应列为评价指标
方法
采用病例对照研究方法,将待评价的检验项目与标准诊断方法进行盲法比较
基本步骤
临床评价研究:在“盲法”的条件下,运用标准诊断方法将研究对象区分为有病和无病两组,再用待评价的检验项目将相同研究对象划分为阳性结果组和阴性结果组
评价指标计算:两种试验的结果列入四格表,得出真假阳性和真假阴性的结果,并计算诊断灵敏度、特异度、预测值等诊断性能评估指标
研究
设计要点
确定研究目标
被评价的检验项目是什么?
评价试验观察的内容有哪些?
研究的临床意义何在?
是一个新检验项目、还是已应用的成熟检验项目?
是否已有类似检验项目,或可以与之竞争的检验项目?口在研究期间,该检验项目可能会发生什么变化?
选择研究对象
确定纳入和排除标准
原则是使纳入的对象能代表目标人群,即检验项目检查对象总体
研究对象分组
根据金标准将用于评价检验项目的受试对象进行分组。检验项目评价属于内对照设置,在检验前不分组,整理资料时才按金标准分组
病例组
是其总体的一个随机样本。可能影响试验结果的因素,如性别、年龄、疾病类型、病情等应能代表整个患病人群。病例组疾病的类型应包括各型病例,如典型和不典型病例,早、中、晚期病例,轻、中、重病病例,有、无并发症病例、经过治疗与未经过治疗的病例
对照组
除被证实未患该病之外,在其他可能影响检验项目结果的因素方面应与病例组有可比性。对照组应包括各种非该病患者,特别是与所研究的疾病容易混淆,需要鉴别的病种
确定抽样方法
确立诊断标准
必须是金目标/规范标准
指当前国内外公认的、诊断某种疾病最可靠的、在临床上能获得肯定结论的方法
估算样本含量
检验项目评价需要有足够的样本含量。一般诊断性研究的样本量不小于100例; 特殊情况下样本量不小于30例
多组计算时,一般要求各组间样本量相等(也有例外)
最好结合多种估算方法,取最大者
研究时最好在最少样本需要量上增加10%-20%
各参数值要符合实际,必要时做预实验、查文献,寻找证据支持
选择测量指标和确定测量方法
选择测量指标
检验项目的诊断指标有主观指标、半主观指标和客观指标。观察指标要客观、特异,判断结果要标准明确、具体
测量方法应标准化
有具体的规定、明确的标准
同步盲法测量
将病例组或对照组样本用金标准与待评价诊断方法进行同步盲法测量比较。测量在不了解其他情况下进行。同步是指同时间、地区、人群;金标准和所研究的试验一般要同步进行
选定截断店伙分界值计算评价指标
分界值的选定
统计学方法(包括正态分布法和百分位数法)
受试者工作曲线( ROC 曲线)法
两组分布交叉法
尤登指数计算法
计算评价指标
诊断准确性
诊断概率指标
数据处理
使用 SPSS 统计软件,按要求输入数据之后直接计算 ROC 曲线下面积、选择 cut - off 值,以及 cut - off 处的敏感度和特异度等
临床性能指标分析和比较
已有相关的其他实验诊断项目,一般会对新、老项目的诊断性能展开比较
防止偏移
偏倚防止
在诊断性能评价的各个环节均应防止偏倚。可通过选择可靠的金标准、盲法同步、统计学的正确使用等
均衡性检验
实验条件各方面均衡一致,才有可比性。当样本数目很大时,只要严格按照随机化方法抽样及分组,即可大体做到均衡。当样本数目很小时,则要求提高样本的均一性和采用随机的配对分配或多组分配方法
指标
检验项目的诊断准确性评价和指标
诊断准确性/真实性
指检验项目的结果与受试者的实际情况的符合程度,即判断受试者有病与无病的能力
诊断灵敏度与漏诊率
诊断灵敏度( Sen )/真阳性率( TPR )
指在患病者中,应用某检验项目检查得到阳性结果的百分比
漏诊率(β)/假阴性率( FNR )
反映将患者诊断错误的概率
互补关系
高灵敏度的检验项目应用于
拟诊为严重但疗效好的疾病,以防漏诊
拟诊为有一定治疗效果的恶性肿瘤,以便早期确诊,及时治疗
存在多种可能疾病诊断,可排除某一诊断
普査或定期健康体检,筛选某一疾病,以防漏诊
诊断特异性与误诊度
诊断特异度( Spe )/真阴性率( TNR )
指在非某病者中,应用某检验项目获得阴性结果的百分比
误诊率( α )/假阳性率( FPR )
反映将非患者诊断错误的概率
互补关系
高特异度的检验项目应用于
拟诊患有某病的概率较大时,以便确诊
拟诊疾病严重但疗效与预后均不好的疾病,以防误诊,尽早解除病人的压力
拟诊疾病严重且根治方法是具有较大损害时,需确诊,以免造成病人不必要的损害
诊断一致性
反映检验结果与患某病情况一致性程度的指标
诊断准确度(AC)/总符合率/诊断效率(DF)
是指在患病和非患病者中,用检验项目能准确划分患者和非患病者的百分比
多用
正确指数/尤登指数(YI)
表示检验项目发现真正的患病和非惠病者的总能力
Kappa指数/rater一致性
它比较稳定,不易受发病率的影响
一般不用
预测值(PV)/诊断价值
阳性预测值(PPV/+PV)
表示在检验结果为阳性的人数中,真正患病者所占的百分率,也叫患病的试验后可能性
阴性预测值(NPV/-PV)
表示在检验结果为阴性的人中,非患病者所占的百分率,也叫非患病的试验后可能性
似然比(LR)/似然比
表征验后概率较之验前概率的符合程度和变化方向的量化指标
阳性似然比
阴性似然比
验前概率和验后概率
比值比
检验项目目的诊断可靠性评价指标
诊断可靠性/重复性/精密度
是检验项目在完全相同的条件下进行重复试验得到相同诊断结果的稳定程度
变异系数
评价计量资料精密度的指标为标准差和变异系数等。用变异系数有利于相互比较。变异系数愈小,表示可重复性愈好
总符合率
用同一检验项目方法对同一批受检对象进行重复检测,将检测结果列四格表,然后用上述相应的公式计算总复合率、 Kappa 指数等指标。总符合率愈高,试验的可靠性愈好。
检验项目诊断性能评价指标的综合评价
灵敏度和特异性
最基本的评价指标,如果缺少该两项指标,则对检验项目无法进行评价
诊断指数和诊断效率
综合了敏感度和特异度两个指标,但敏感度高的检验项目用于疾病筛直,特异度高的检验项目用于疾病的确诊,所以,用其来评价一个试验的优劣,其作用有限
阳性预测值和阴性预测值
临床上对检验结果做出临床解择时,比较直观,但受患病率影响较大
似然比
将敏感度和特异度较好结合起来的综合指标,可以计算出验后概率,是目前评价检验项目临床价值及指导临床应用的较好指标
可靠性与准确度
四种关系
真实性与重复性都好
真实性好但重复性差
真实性差但重复性好
真实性与重复性都差
CCA4630386C55F9BC64F171126480CAF
CCA4630386C55F9BC64F171126480CAF
检验项目诊断性能的ROC曲线分析
地位
是国际公认的比较、评价两种或两种以上检验项目或诊断方法的诊断性能的客观标准
构成
ROC 曲线是根据一系列不同的二分类方式(分界值或决定阈)
纵坐标:真阳性率(灵敏度)
横坐标:假阳性率(1-特异度)
特点
与传统方法不同
ROC 曲线是根据实际情况,允许有中间状态,采用多个(≥5)分界值,把试验结果划分为多个有序分类再进行统计分析。
能提供试验准确性的完全图象,全面描述试验的性质
类型与意义
最理想诊断价值的 ROC 曲线
一个完美的试验(疾病与非病例的分布没有重叠)的 ROC 图通过左上角,其真阳性率为100%,特异性为100%,即正常人均为阴性
有诊断价值的 ROC 曲线
大多数试验的 ROC 图介于上述两种极端之间。 ROC 曲线越靠近左上角,即曲线下面积越大,检验项目的准确性就越高。 ROC 曲线上最靠近左上角的点是错误最少的最佳阈值点,其假阳性和假阴性的总数最少
完全无诊断价值的 ROC 曲线
如果疾病与非病例的分布一致,不能鉴别病与非病的试验的 ROC 图是45°的对角线
主要作用
查询某分界值时对疾病的识别能力
ROC 曲线能很容易地查出任意界限值时的对疾病的识别能力。 ROC 曲线图上的每一点代表某一分界值的一对敏感性和特异性 ROC 曲线能反映不同界限值时两者的变化。同时, ROC 曲线上各点的切线的斜率,就是似然比
选择最佳的诊断界限值
ROC 曲线是表示灵敏度与特异度之间互相关系的一种方法,所得的曲线可以决定最佳分界值。一般多选择曲线转弯处,即敏感度与特异度均为较高的点为分界值
两种或两种以上不同检验项目对疾病识别能力的比较
应用 ROC 曲线对同一种疾病的两种或两种以上诊断方法进行比较时,可采用肉眼图形批较和统计量比较的方法,帮助医师作出最佳选择
分析
ROC 曲线下的面积值通常在1.0和0.5之间。在 AUC >0.5的情况下, AUC 越接近于1,说明诊断效果越好
AUC 在0.5~0.7时有较低准确性
AUC 在0.7~0.9时有一定准确性
AUC 在0.9以上时有较高准确性
AUC =0.5时,说明诊断方法完全不起作用,无诊断价值
AUC <0.5不符合真实情况,在实际中极少出现
联合试验的诊断性能评价
联合试验的类型
并联实验/平行试验
概念
该联合方法是同时做几种检验项目,其中一项为阳性即判断为阳性。与单项检验项目比较,平行试验可提高诊断敏感性,但降低了特异性
临床应用
能从不同角度揭示检验项目与疾病的关系
诊断性能
串联试验/系列试验
概念
该联合方法是依次进行几项检验项目,如先做特异性高的试验 A , A 为阳性者再做 B ,如此类推,只有全部试验结果为阳性时才能判断为阳性。串联试验可提高诊断特异性,但降低了诊断敏感性
临床应用
提高诊断特异性和阳性预期值,降低了误诊率,增加了漏诊率。当几项检验项目的特异性不高时,采用串联试验最为适宜
诊断性能