实验室应[使用分析性能规范(APS)]评估和验证所执行检测的测量不确定度(MU)。因此,对MU的APS进行适当的定义至关重要,也要提供一个关于这些APS实际应用适用性的观点。在本研究中,23种常用检验项目(分析物)被分配到2014年EFLM战略会议期间定义的模型中,以推导出MU的APS。然后,我们验证了本实验室所使用的商业检测系统的性能是否可以达到这些要求。
01
评估项目并搜索与选定
Milan模型相关的信息
我们确定了一份包含23项检验项目的清单,它们是我们医疗保健系统中需求量最大的测试之一。包括(按字母顺序):白蛋白(血清和尿液)、血清碱性磷酸酶 (ALP)、血清天冬氨酸氨基转氨酶(AST)、血清肌酸激酶(CK)、血清地高辛、血清γ-谷氨酰转移酶(GGT)、血清高密度脂蛋白胆固醇(HDL)、血浆同型半胱氨酸、血清免疫球蛋白A (IgA)、G(IgG)和M (IgM)、血清乳酸脱氢酶(LDH)、血清镁、血清胰淀粉酶(P-AMY)、血小板、红细胞(RBC)、血清总胆固醇、血清前列腺特异性抗原(PSA)、血清总蛋白、血清甘油三酯、血清尿酸和白细胞 (WBC)。为了推导出MU相应的APS,根据其临床和生物学特征将每种检验项目分配给最合适的Milan模型。
02
属于模型1
尿白蛋白与估算肾小球滤过率(eGFR)一起,是肾脏损伤的一级标志物。根据改善全球肾脏病预后组织的建议,尿白蛋白>30 mg/d,相当于尿白蛋白/肌酐比值(ACR) >30 mg/g,检测时间≥3个月,是诊断慢性肾脏病(CKD)的标准。根据尿白蛋白值分为3个不同的严重程度分级(A1, 10~30 mg/g;A2: 30~300 mg/g;A3, >300 mg/g)。研究表明,如果早期治疗,A2级患者可能会出现肾脏疾病消退,因此,准确检测A2是临床实践中疾病进展监测的核心。Ko等人旨在评估MU对A2级患者ACR结果的影响。ACR质量标准是根据模棱两可的病例数量提出的,这些病例被定义为“由于ACR测试的MU而可能重新分类到不同严重程度类别的病例”。由于没有关于临床目的可接受的模棱两可病例数量的指南,引用了仅根据生物学设定普遍适用的质量目标的经典共识,即接受总结果变异性增加25%(最低)和12%(理想)。产生大致相同数量模棱两可结果的MU水平分别作为ACR标准MU的APS为9.0%(理想)和17.0%(最低)。考虑到尿肌酐测定的标准MU(在我们实验室<2.3%)不会显著影响ACR的既定目标,如Ko等人的文章所示,我们对尿白蛋白采用了与这些作者提出的用于ACR测试的相同APS。
即使最近的指南直接关注低密度脂蛋白胆固醇(LDL),但在定义心血管疾病(CVD)风险时仍经常要求检测总胆固醇,而且一些风险评分仍要求了解这些值。Petersen和Klee评估了总胆固醇的分析变异性对被误分类为假阳性的低风险个体(即高危个体)数量的影响。推导MU的APS分别为3.0%(理想)和7.0%(最低),假阳性结果约为5.0%和7.5%。
03
暂时属于模型2
Ceriotti等人总结了血清白蛋白检测在许多临床状况中的核心作用,建议将其中分配在模型1中。然而,我们无法检索关于分析变异性影响的基于结局的文献研究。因此,考虑到白蛋白在保证胶体渗透压的稳定性方面起着重要作用,暂时将这一项目分配给模型2。为此,我们检索了Carobene等发表的BIVAC-QI评分为“A”的文献。血清白蛋白的平均CVI为2.50%,推导MU的APS为1.25%(理想)和1.88%(最低)。
HDL在CVD风险的定义中起着关键作用,与总胆固醇类似,应采用模型1。然而,我们没有发现基于结局的研究,因此,暂时应用模型2,因为其在正常血脂个体的血液中处于稳定状态。我们利用Aarsand等人的论文,估算血清HDL的CVI 为5.67%,从而得出MU的APS的理想(2.84%)和最低(4.26%)质量水平。
甘油三酯检测是完整血脂谱的一部分,使用适当公式估算LDL时也需要甘油三酯。美国国家胆固醇教育计划成人治疗组III指南(NCEP-ATP Ⅲ) 采用了以下血清甘油三酯浓度分类:生理水平(<150 mg/dL);临界高值(150 ~ 199 mg/dL);升高(200-499 mg/dL);和极高(≥500 mg/dL)。鉴于这些明确定义的决策阈值,血清甘油三酯应优先分配给模型1,即使血清甘油三酯可能是一种生物学上具有挑战性的分析物,如果分析前的方面,如禁食状态不受控制或采用特定的生活方式(如素食、饮酒),其变异性相对较高。尽管有这些问题,但由于缺乏基于结局的研究,我们暂时采用了BV模型。Aarsand等人定义平均甘油三酯CVI为 19.8%,因此,得出APS为9.90%(理想)和14.85%(最低)。
血小板检测在出血过多或凝血异常的情况下是必不可少的,血小板增多症和减少症都可能与严重和危及生命的疾病有关。血小板输注的特定浓度阈值已经确定,因此,模型1会更适用。然而,即使是血小板,由于缺乏基于结局的数据来建立APS,也需要临时使用模型2。不过,在应用该模型时,应考虑到在评估血细胞BV的研究中采用的方法所存在的一个关键问题。当血液冷冻保存时,血小板的稳定性很差,因此在分析前将所有采集样本保存在-80°C下,直到在同一分析批中进行所有检测和消除批间分析变异影响的常规方法并不合适。在描述RBC和WBC的APS时,我们将详细讨论这个问题。我们想在这里强调的是,即使一些在EFLM数据库中获得“A”的论文也没有正确考虑和管理这方面。相反,Pineda-Tenor 等人通过使用之前公布的不稳定分析物实验设计,正确处理了这一问题。在他们的研究中,血小板的估算CVI为9.70%,得出MU的APS为 4.85%(理想)和7.28%(最低)。
04
属于模型2
在Milan模型中,基于BV的模型已被提出用于推导血清酶的APS。Carobene等人在提出这一建议时,重点考虑了血清酶在健康人体内相对稳定的浓度以及很难定义基于结局APS的不同临床应用。例如,血清ALP的升高既可能源于肝胆疾病,也可能源于骨病,而仅检测ALP无法诊断特定疾病,因此这种情况更适合模型2。同样,GGT、AST和LDH也可能因多种肝内外病变而升高。在一篇BIVAC-QI得分为“A”的论文中,ALP、GGT、AST和LDH的CVI估计分别为5.3%、8.9%、9.5%和5.2%。对于CK和P-AMY,分配到用于推导APS的模型可能更加困难。如之前对血清ALT所讨论的,这些酶的临床作用有了更明确的定义。血清CK是可疑骨骼肌损伤的一级实验室检查,而P-AMY的临床表现虽不如胰脂肪酶,但仍被用于诊断急性胰腺炎,这可能需要使用模型1。然而,由于目前还没有基于结局的研究来设置这两种酶的APS,因此使用基于BV的模型是合理的。在同一篇论文中,CK和P-AMY的CVI分别为14.5%和6.3%。表1显示了所有上述酶的推导APS。
血清蛋白定量在特定疾病或临床状况中没有作用,在各种状态下都会发现其浓度与参考区间的偏差。此外,最具代表性的蛋白质的半衰期相对较长,且体内水分含量受到激素的严格控制,使得血清中的总蛋白质浓度足够稳定。因此分配给模型2。从EFLM数据库中检索到一篇被评为“A”的论文,估算其CVI为2.60%。 得出MU的APS为1.30%(理想)和1.95%(最低)。
免疫球蛋白是由浆细胞合成的一组具有抗体功能的糖蛋白。免疫球蛋白浓度升高与感染、炎症或自身免疫性疾病以及恶性疾病有关。因此,免疫球蛋白对特定疾病没有作用;此外,由于其血清浓度受到稳态机制的严格控制,因此应将其分配到模型2。关于免疫球蛋白的BV,Ford等人提供了更准确的CVI信息,IgG为 4.40%,IgA为5.00%,IgM为5.90%。表1列出了MU的相应APS。
PSA具有组织特异性,但不具有癌症特异性,因为良性前列腺增生、前列腺炎以及对腺体进行干预后,血清中PSA浓度都会升高。虽然血液不是生理性分泌PSA 的生物单元,但当受试者健康状况良好时,血清PSA浓度是稳定的。因此,可分配给模型2。Carobene等人估计平均CVI为6.80%,并将MU的APS定义为3.40%(理想)和5.10%(最低)。
镁离子是细胞内含量第二高的阳离子,在细胞能量代谢中发挥着关键作用。镁离子在血液中的浓度由肠道吸收、肾脏排泄以及骨骼和软组织沉积之间的动态平衡来维持。与其他血清离子一样,镁也应分配到模型2中。我们确定了一篇评分为“A”的论文,从中得出的CVI为2.88%,MU的APS为1.44%(理想)和2.16%(最低)。
尿酸是嘌呤核苷分解代谢的最终产物。其在血液中的浓度受到严格的稳态控制,因此必须分配给基于BV的模型。在已经引用了其他检验项目的同一篇论文中,估算的CVI为8.32%,MU的APS为4.16%(理想)和6.24%(最低)。
同型半胱氨酸是一种参与蛋氨酸代谢的含硫氨基酸。同型半胱氨酸检测适用于疑似高胱氨酸尿症(一种蛋氨酸代谢的遗传性疾病)、既往有静脉或动脉血栓栓塞症的患者以及叶酸和钴胺素缺乏症患者。由于同型半胱氨酸具有稳定的生物学行为,因此应将其归入模式2。根据BIVAC-QI评分,Garg等的研究结果为最佳。本研究得出的CVI为7.03%,MU的APS为3.52%(理想)和5.27%(最低)。
健康人群中RBC和WBC计数较为稳定,使用BV模型推导APS是合理的。如前所述,在冷冻保存的血小板样本中,血细胞的不稳定性要求在估算这些项目的BV时采用不同的实验设计。特别是,血样采集后必须立即进行检测,根据该方案产生的日间CV应通过每次检测浓度接近研究对象均值的控制物质来估算,然后从数据的总变异中减去,得到BV估计值。由于 BIVAC-QI没有明确考虑到这一重要方面,因此我们对检索到的所有涉及血细胞BV的论文进行了重新评估,除了检查表中的其他项目外,还特别关注了这一问题。Pineda-Tenor等人的研究对不稳定的分析物采用了正确的实验设计。因此,我们认为估算的CVI是准确的:红细胞和白细胞的CVI分别为3.10%和11.3%。表1显示了推导的APS。
05
属于模型1&2
血清地高辛:地高辛是从洋地黄植物中提取的一种强心苷。虽然由于有了更新的药物,地高辛的使用频率比过去有所降低,但由于其对房室结传导的活性,治疗室上性心律失常仍需要地高辛。由于地高辛的治疗范围较窄,因此有必要在进行临床监测的同时进行密切的TDM。Fraser利用基于地高辛药代动力学和生物学知识的理论模型确定了该药物理想的分析变异目标如下:CV≤¼ [(2T/t-1)/(2T/t+1)]×100%,其中 T为两次服药之间的时间间隔,t为药物的平均消除半衰期。考虑到地高辛通常为每日单剂量给药,且肾功能未受损者的平均半衰期为38.4 h,如之前所述,可将理想的APS固定为6.0%,质量水平调整到最低目标9.0%(6.0% + ½ 6.0%)。
06
评估实验室检测MU并与已
建立的APS进行比较
如开篇所述,ISO技术规范20914:2019向医学实验室推荐的“自上而下”的MU 估算方法依赖于整个校准层级结构中的MU定义,假设所有重大系统误差(偏差)均由IVD-MD制造商估算和校正,并定义校正不确定度(ubias)。uresult的计算公式为√(ucal2 + uRw2),其中ucal=√(uref2+ uvalue assignment2 + ubias2),如果不可忽略的话,uRw由ISO/TS 20914:2019定义为“实验室精度条件下的不确定度分量”。
在本研究中,我们对IVD-MD进行了检测,将获得的ureult与23项选定检测的既定APS进行了比较,但没有一家IVD-MD制造商提供ucal和相应的uref,即使在大多数情况下可以提供。制造商被要求提供计量溯源信息,以确定用于为其校准品分配可溯源值的高级参考系统(参考品和/或测量程序),并获得所应用校准层次的描述。在大多数情况下,我们都是通过参考品提供者网站上的标准物质分析证书来获取uref值。某公司系统在酶检测中使用校准因子而不是校准品进行校准,在这种情况下,如之前在验证研究中所述,获得了uresult。“自上而下”的MU估算方法的基础是医学实验室对随机变异性(uRw)的正确估算。uRw应根据之前论文中详细描述的室内质量控制(IQC)数据得出。在本研究中,根据ISO 20914:2019建议,使用了6个月期间获得的控制物质的每日检测结果。如前所述,用于uRw估算的IQC材料应不同于用于检测系统校准验证的IQC材料,具有互换性,并且如果可能,如果可能的话,被测浓度应接近所采用的临床切点。如果市场上买不到,则应准备机构内IQC材料(例如,通过安排选定的样本池)。此外,IQC材料的检测应在分析中随机进行,模拟临床样本的检测条件,并在经过适当验证的系统校准下进行。
表2报告了使用我们实验室现有检测系统进行检测时,MU对评估检验项目的贡献,突出了已建立APS的实现(或未实现)情况。我们的数据可以用来直接回答这个问题:“有多少种检测方法可以达到推荐的MU水平,被测试的检测系统能达到这些目标吗”。结果显示,有16项检测达到了预期的APS,5项达到了最低的MU APS,只有2项(血清白蛋白和血浆同型半胱氨酸)超过了预期的APS。血清白蛋白结果约40 g/L(3.54%)相关的MU比BV得出的最低APS(≤1.88%)高约2倍。由于血清白蛋白的生物学特性和严格的稳态控制,对其测定所需的分析质量要求极高,MU应尽可能小。在之前的论文中,我们详细讨论了血清白蛋白的MU问题,以及目前可用的参考品(即ERM-DA470k/IFCC)的MU可能不够小,从而不能保证检测的临床实用性。我们以前建议,uref消耗的MU APS不应超过1/3,让剩余的允许不确定度用于校准层次较低的其他MU源,即uvalue分配和uRw。因此,血清白蛋白是一种具有代表性的检验项目,应优先考虑大幅减少与计量溯源链上层相关的不确定性,另一方面,还应设想平行的策略,侧重于减少溯源链最低部分对总不确定性累积的影响。血浆同型半胱氨酸似乎离达到最低APS不远(5.67% vs 5.27%)。但需要注意的是,某公司没有为其检测方法提供uref,从而导致uresult值被低估。更重要的是,考虑到在检验医学溯源联合委员会(JCTLM)数据库中列出的基于质谱的参考测量程序的可用性,制造商应使用这些程序(而不是内部标准),以提供对高级参考品的溯源性,并确保适当消除偏倚。所采用的检测系统的uRw也相当宽,因此制造商应考虑提高其精度。
除了这两项检验需要进一步提高检测质量(至少在特定的检测系统中)外,在我们的工作条件下,其余21项都至少达到了最低MU的APS标准。至于其他商业检测系统是否也能达到这些 APS,当然还需要进一步研究。不过,我们应该初步认为所提出的 MU APS 是现实的,并非不可能实现。 我们的研究有一个潜在的局限性,那就是为了简化初步评估研究的方案,只采用了IQC材料的一个浓度水平来获取uRw。以前曾强调过多个浓度水平对准确估算测试MU的重要性,因为MU可能随分析物浓度的变化而变化。
编译节选自:Clin Chem Lab Med 2023; 61(2): 213–223
接下来,小编会陆续为大家带来第3期杂志的精编文章,敬请期待!
本期编辑:《临床实验室》编辑部










