ivd产品如何定价（IVD产品经理系列-生化知识细说之方法性能）

花末一季 2023-01-20 10:36:52

方法性能

小桔灯提供了知识文库的服务，这周分享的是第八部分8.生化检测，提到生化就必须要提及当前生化检测试剂性能，本篇将讲述临床医生及检验医生眼中生化试剂性能的计算方式及表达含义。

节选《临床生物化学诊断试验的性能基础与评价》作者

江苏大学基础医学与医学技术学院

姜旭淦

临床诊断试验(clinical diagnostic test)：临床上用于确定或排除疾病的方法或项目。

临床生物化学诊断试验：临床生物化学实验室中用于疾病筛查、诊断和监测的方法或项目。

诊断试验的诊断性能评价：方法或项目与疾病之间的关系，评价该方法或项目对某种疾病的诊断价值。

1.参考个体——按预定标准选择的正常个体。

纳入标准：地区、民族、性别、年龄段等；

排除标准：不能有血压不正常、器质性疾病、乙肝阳性、近期的急性感染、输血或手术、用药、妊娠或哺乳等。

2．参考总体——所有参考个体的集合。

3．参考抽样组——参考总体的抽样，又称参考样本。

4．参考值——每一个参考个体的检测值。

5．参考值范围——各个参考值剔除离群值并补充数据后的集合范围。

6．参考值区间——包含95％的参考总体的参考值范围。

双侧正态（均数法）： ±1.96s，即（－1.96s）～（＋1.96s）；

双侧偏态（百分位数法）：

2.5％位数（P2.5）的参考限～97.5％位数（P2.5）的参考限。

单侧正态：－1.65s以下或＋1.65s以上；

单侧偏态：P5的参考以下或P95的参考限以上。

注意事项：

正确选择受检对象——具有代表性。合理规定参考人群的条件，如年龄、性别、民族，以及标本采集的时间和地区因素等。

保证一定数量的受检人数，一般应有100例以上，若分布呈偏态时应在120例以上，特殊情况至少也应30例以上。

测定方法标准化，保证结果的可靠性和可比性。根据专业知识确定单、双侧位界，严格按照统计要求进行测定结果的处理。

参考范围的使用有一定的范围，仅适合于符合参考个体要求的参考人群。

参考范围仅覆盖研究人群的95%，因此，参考值范围不能盲目地作为正常与疾病的分界点。

注意年龄、性别、饮食、药物、个人习惯和体力锻炼等因素的影响。

检测方法与参考范围或参考值的关系。

临界值与医学决定水平

2

临界值（cut off value）:划分诊断试验结果正常与异常的界值。又称阈值、分界值、鉴别值、指定值、诊断界值、截断点等。

医学决定水平（medical decision level，MDL/DL）：临床上按照不同病情给予不同处理的指标阈值。

用DL或Xc表示，用来排除或确定某一临床情况或预告将会出现某一生理变化现象。

医学决定水平制定依据：

A、正常人参考范围　

B、无关疾病患者的参考范围

C、有关疾病患者分型、分期的测定值

D、文献资料及医生意见

医学决定水平制定模式：不同指标的DL数量、数值不同。

A　低、高　

B　低、低、高

C　低、高、高

不同实验室的水平值也略有不同。

例如：

“低、高”模式

血清氯参考范围：98～109mmol/L；

有二个DL：90mmol/L、112mmol/L。

≤90mmol/L时，应加做其他检查以确诊或排除：①严重呕吐、腹泻等胃肠道丢失。②长期限制氯化钠的摄入。③代谢性碱中毒。④艾迪生病。

≥112mmol/L时，应加做其他检查以确诊或排除：①高氯血症性代谢性酸中毒。②氯化物摄入过多。③高钠血症：失水大于失盐，氯化物相对浓度增高。

“低、低、高”模式

血清清蛋白（Alb）参考范围： 35～50g/L，

有三个DL：20g/L、35g/L、52g/L。

20g/L表示肝病患者的预后严重；

35g/L为检查低清蛋白血症的界值；

52g/L则稍高于参考范围上限，可排除许多假阳性。

“低、高、高”模式

血清总钙参考范围： 2.25～2.65mmol/L，

有三个DL：1.75mmol/L、2.75mmol/L、3.38mmol/L。

≤1.75mmol/L时，应加做其他检查以明确病人发生低血钙抽搐的可能性，并采取预防措施；

≥2.75mmol/L 时，应加做其他检查以确诊或排除原发性副甲亢的诊断；

≥ 3.38mmol/L时，考虑为高血钙昏迷，应及时做出诊断，不得延误。

3

诊断试验的指标与评价

金标准（gold standard）：当前为临床医学界公认的诊断某种疾病最可靠的诊断方法，可通过活检、尸检、外科手术、随访等所作出的决定性诊断，又称确诊试验。

诊断肿瘤的金标准一般是病理学检查，

诊断冠心病的金标准是冠状动脉造影，

诊断肾炎的金标准是肾活检，

诊断胆结石的金标准是手术所见，

诊断心肌病的金标准是心肌活检等。

研究程序：

确立金标准后，再与诊断试验同步盲法测量研究对象。

据金标准将研究对象划分为“有某病”、“无某病”，据诊断试验的临界值将其划分为“阳性”、“阴性”结果，然后整理出相应的四格表计算准确性、有效性等评价指标。

①真阳性（true positive，TP）：金标准确诊为有某病且诊断试验检出为阳性的例数。

②假阳性（false positive，FP）：金标准确诊为无某病且诊断试验检出为阳性的例数。

③真阴性（true negative，TN）：金标准确诊为无某病且诊断试验检出为阴性的例数。

④假阴性（false negative，FN）：金标准确诊为有某病且诊断试验检出为阴性的例数。

计算方式（举例）：

已知用金标准确定原发性肝癌病人60名，非原发性肝癌400名；血清AFP以＞30μg/L为判断值，共检测出65人为原发性肝癌，其中有8人为假阳性。计算诊断敏感度、诊断特异度、漏诊率、误诊率、 PV、-PV、阳性拟然比、阴性似然比。

诊断试验的指标

4

1. 准确性评价指标：又称为真实性评价指标，包括如灵敏度、特异度和准确度等。

2. 有效性评价指标：包括预测值、流行率和似然比等。

3. 可靠性评价指标：重复进行试验得到相同结果的稳定程度，包括变异系数、符合率等。

理想试验的诊断敏感度为100%。 •敏感度高的诊断试验，用于

① 普查或定期健康体验，能筛选某一疾病。以防漏诊。

② 拟诊为某种疾病时，可起到排除某一诊断或早期确诊。

理想试验的诊断特异度为100%。

特异度高的诊断试验对临床某些疾病的确诊有很大帮助，以防误诊。

5

诊断试验的有效性评价指标

1 . 预测值

2 . 流行率

3 . 似然比

诊断试验与疾病诊断诊断试验的任务是为临床医师对疾病的诊断提供证据。诊断试验的结果不等于诊断。

验前概率和验后概率临床医师对就诊者可能患何种病的初步印象的量化指标，称为验前概率（pretest probability）。

结合诊断试验的结果，得出就诊者患病可能性大小的估计称之为验后概率（post test probability），也称为预测值。

预测值（predictive value，PV）：也称预告值，诊断试验预示金标准结果的程度如何。包括阳性预测值和阴性预测值，分别表示诊断试验结果确定或排除某种疾病存在与否的诊断概率。预测值受流行率的影响。

流行率：可从流行病学调查资料查知，也可以是临床医师在长期的医疗实践中，对门诊就诊者患某病的比例的经验认识。由于不同的地区、不同级别的医院、普通医院和专科医院，其就诊者的组成差别可能很大，同样的疾病在不同的医院的流行率也不同。临床医师必须根据具体情况确定流行率，才能得出较为准确的阳性预测值。

验后概率较之验前概率的符合程度和变化方向的特性量化指标称为似然比（likelihood ratio ，LR）。似然比又称拟然比，包括阳性似然比和阴性似然比。拟然比性质稳定，不因流行率的改变而改变。

似然比直接判断一个诊断试验好坏

LR(＋)＞1.0 ，

当试验结果为阳性时，试验提示患病可能性增高能力的一种度量。

LR(＋)＝2.0-5.0 , 认为该试验不太好；

LR(＋)＞ 10.0 ，认为是好的。

LR(－)＜1.0 ，当试验结果为阴性时，试验提示患病可能性降低能力的一种度量。

LR(－)＝0.5－0.2 ，认为该试验不太好， LR(－)＜ 0.1 ，可认为是好的试验。

可靠性（reliability），又称重复性（repeatability）、精密度（precision）：——诊断试验在完全相同的条件下进行重复试验得到相同结果的稳定程度。

1.变异系数或标准差

2.符合率　

两名操作者同时对比检测，列四格表计算。符合率愈高，试验的可靠性愈好。

变异系数：评价计量资料精密度的指标。变异系数有利于相互比较。

总符合率：

评价计数资料可靠性的指标。方法用同一诊断试验方法对同一批受检对象进行重复检测，将检测结果列四格表，然后用上述公式计算总复合率、Kappa指数等指标，进行可靠性评估。总符合率愈高，试验的可靠性愈好

影响可靠性的因素：

生物学变异包括研究对象的个体内变异和个体间的变异。

观察者的变异由观察者对测定结果判断的不一致所致的差异。

同一观察者内的变异（如不同时间、条件时）和不同观察者之间的变异。

试验方法差异包括仪器、药品和试剂、以及条件等因素引起的变异。

提高医学诊断率的方法

6

1.选择高患病率的人群来提高阳性预告值

Bayes公式：当诊断方法的敏感度与特异度不变时，阳性预告值随患病率（患病率、验前概率）的升高而变大。

2.利用联合试验来提高诊断灵敏度或特异度

联合试验：

平行试验可提高诊断灵敏度，但降低了特异度；

系列试验可提高诊断特异度，但降低了灵敏度。

7

受试者曲线

根据金标准诊断结果将诊断试验数据分段、设定各临界值、划分四格表，再计算各临界值下的真阳性率、假阳性率，最后绘制ROC曲线，计算曲线下面积（area under the curve，AUC）。

以真阳性率（灵敏度）为纵坐标、假阳性率（1－特异度）为横坐标，将相对应的各临界值（截断点）连接起来得到ROC曲线。

AUC的理论取值范围在1.0和0.5之间。

在AUC＞0.5的情况下，

AUC越接近于1，说明诊断效果越好。

AUC在0.5～0.7时有较低准确性，

AUC在0.7～0.9时有一定准确性，

AUC在0.9以上时有较高准确性。

AUC＝0.5时，说明诊断方法完全不起作用，无诊断价值。

判断标准：AUC在0.9以上时有较高准确性。

本例AUC 95％的置信区间为：

AUC ±1.96×SE

＝0.9636±1.96×0.0147

＝［0.9348，0.9924］

该区间大于0.9，表明果糖胺对糖尿病的诊断价值较高。

ROC曲线将灵敏度与特异度以图示方法结合在一起，可准确反映某分析方法二者的关系，是试验准确性的综合代表。

方法简洁、直观，可用肉眼直接作出准确性判断。

例1　500名收入冠心病监护室的病人，在入院当天抽血作CK检查，CK结果分布见下表。医生在不知道CK结果的情况下，根据心电图结果和临床报告，确诊300名病人患心肌梗死，其它200名无心肌梗死。
,