医疗上APS是什么溯源时代质控重构体外诊断医疗器械与临床实验室检测性能的监测-上海聚慕医疗器械有限公司

IQC重构

****

由于医学实验室传统上进行的IQC无法提供有关IVD-MD在检测标准化方面的计量溯源性的足够信息，因此在过去几年中，人们就如何在计量溯源时代重新思考IQC提出了许多建议。当前学界已形成基本共识：测量误差的两大来源（相对于高级参考材料的偏差与随机MU）具有不同成因，需要不同的控制方法。因此，因此医学实验室应该建立和保持不同的方法来估计和最小化它们。在本刊的一篇 “观点”文章中，我们详细阐述了一项切实可行的建议，建议为了获得有关溯源及其正确实施的信息（包括MU对临床样本的适用性），用于监测各个实验室IVD-MD分析性能的IQC应适当地重组为两个独立的部分：其一专注于监测IVD-MD的一致性，间接验证制造商声明的溯源性在常规操作中的稳定性，从而识别检测系统误差来源[IQC组分I（IQC-I）]；其二则用于估算随机效应导致的MU[IQC组分II（IQC-II）]（见表1）。通过认识到重新思考IQC的必要性，我们的提议在随后的论文中得到了CCLM 编辑的广泛支持。

1．通过IQC-I监测IVD-MD的一致性情况：尽管IVD-MDs的偏差应在上市前由制造商完成适当校正，但在日常使用过程中，其系统一致性仍可能发生偏移。IQC-I的核心功能在于持续监测此类偏移的幅度及其可接受性。为此，IVD制造商需向终端用户提供专用于IVD-MD日常性能监测的质控材料（下文简称IQC-I材料），终端用户必须严格遵守制造商的操作规范，因为唯有合规使用才能确保IVD-MD的预期用途（包括在计量溯源方面所宣称的性能）得以实现。要求IVD制造商提供IQC-I材料作为IVD-MD 的认证组成部分提供，其设计应满足IVD-MD一致性的日常监测，并具有适宜的靶值及可接受范围。为实现有效的溯源性监测，必须真实分配IQC-I 靶值（并希望其溯源性得到认证），使终端用户能够确认IVD-MD性能处于无偏差（或可忽略偏差）状态。因此，应摒弃制造商普遍采用的做法——即仅通过同一IVD-MD进行的重复实验中得出其质控材料（作为IVD-MD组件提供时）的平均值，而未对赋值进行准确性检查。

2．基于IQC-II的随机来源MU评估：根据ISO 15189:2012要求，医学实验室应掌握检测结果的MU，以评估所用IVD-MD的临床适用性。该要求引发了关于MU实践评估方法的热烈讨论（部分观点对其应用价值持保留态度），本刊亦刊载多篇相关研究成果。尽管测量不确定度表示指南（GUM）提出的评估模型——通过评估和整合测量程序的所有相关MU来源，获得了参考材料供应商及参考测量实验室的认可，但GUM在医学实验室中的实施仍面临操作复杂、实践阻力大等问题，难以融入日常检测流程。作为可行替代方案，”自上而下”（top-down）法应运而生。即利用IQC数据对实验室MU结果进行估算，得出MU的随机分量（u_Rw）和商业校准品信息（u_cal），其中后者整合了制造商从最高可用参考系统（u_ref）至IVD-MD校准品赋值过程（u_{value assignment}）中校准层级引入的所有不确定度。换言之，在系统溯源正确实施（即处于几乎无偏差的条件下）的IVD-MD上，临床样本检测结果的MU主要源于：（a）溯源链的累积不确定度；（b）各个实验室在使用IVD-MD时随着时间变化产生的变异所导致的MU。ISO 20914:2019技术规范将获得u_Rw的最佳条件描述为 “实验室内中间精密度”，需通过连续6个月的IQC每日数据估算得出，以获得涵盖试剂批号更换、校准周期变动、环境条件差异等系统性MU来源。正确估算u_Rw后，需与IVD-MD制造商提供的ucal按√(u_cal²+u_Rw²)公式结合，最终获得临床样本的MU。

用于估算uRw的IQC-II材料需满足以下特性要求（见表1）。首先，材料应该不同于IQC-I的材料；其次，应该具有互换性，因为在非互换性材料上获得的结果可能无法反映同一IVD-MD在uRw方面对临床样本的性能。由于使用天然生物样本（根据定义是可互换的）进行长时间MU评估并不可行，因此使用适当的商业QC材料或冷冻样本池是不可避免的。最后，IQC-II 材料的分析物浓度应接近临床决定阈值，或至少接近检验医学应用的参考限值。这一点至关重要，因为对于大多数实验室检测项目而言，MU可能随分析物浓度变化。图1总结了医学实验室正确评估MU的主要步骤。

EQA重构

****

近十年来，学界致力于明确并探讨EQA提供的信息在评估参评实验室计量溯源性能方面的适用性要求。所有专家一致认为，只有在EQA计划满足特定要求的情况下，EQA计划才可能发挥核心作用（表2）。符合计量标准的EQA计划确实具有独特的优势，可为检验医学实践带来实质性的价值（表3）。

遗憾的是，当前绝大多数EQA计划尚不足以有效评价实验室结果的计量溯源性：大多数计划对样本质量不够重视，并使用同行组平均值（或其他集中趋势的指标）对参与者的表现进行分级，因此参与EQA作为上市后对实验室表现的监督，在标准化/一致性方面的实际益处仍然不大。在评估EQA结果时，使用基于同行组的数值作为参考的方法被认为可以减轻已上市IVD-MD的异质性，然而，“同行组 ”的定义本身就具有异质性，可由以下几种情况组成：(a) 来自一家制造商的相同IVD-MD；(b) 来自一家制造商的相同仪器系列；(c) 来自不同制造商但使用相同试剂和校准品的仪器或(d) 具有相同检测原理但使用不同试剂和校准品的方法。考虑到商用IVD-MD 的溯源性，上述每种定义都存在缺陷。尤为关键的是，若沿用传统EQA策略——即忽略所用质控材料的互换性，采用共识值作为比对基准——可能导致对医学实验室分析质量的过度乐观评估，形成实验室虽持续报告结果偏差却仍能满足法规要求的局面。

1．EQA质量目标：首要要求是在有参考测量程序的情况下，根据参考测量程序对EQA 材料进行赋值；如没有，则根据严格控制的程序进行赋值。这使得能够基于选定的高级参考标准对参评实验室的检测性能进行客观评估，而非依赖次优的同行组判读模式。需特别指出：对于尚未建立参考程序的检验项目，应使用IVD-MD相关靶值评估参评实验室性能；即便如此，EQA材料靶值的赋值工作也应由参考机构（可包含特定IVD-MD的原研厂商）在严格受控条件下完成，以避免结果偏差并尽可能将其MU保持在最低水平，而不是采用同行组的平均值。

2．EQA材料的互换性：就EQA而言，质控材料的互换性是影响项目结果对实验室性能评估适用性的另一关键要素，因只有使用具互换性的质控样本，其性能表现才可转移至临床真实样本。EQA材料制备的许多方面都可能影响互换性。Danilenko等人描述了在不改变互换性特征的条件下采集血液、分离血清、制备混合液和冷冻等份的严格方案，而Jones等人强调了供应商应指定EQA材料基质及其可互换的必要性，因为EQA项目中结果差异的解读在很大程度上取决于所用材料的性质。尽管非互换性EQA材料有时被用于验证IVD-MD是否符合制造商声明性能，但作为实验室从业者，我们更需超越此局限，关注检验结果质量是否满足临床应用需求——这一判断应独立于IVD-MD类型及是否满足厂商声明的技术指标。

分析性能规范(APS)重构

****

为确定检测测量的适用性，必须采用可接受限值精准识别需采取纠正措施的实验室（及涉及的IVD-MD）。鉴于医学实验室检测的特殊性，单纯统计学标准并不充分。检测变异应限制于基于医学相关性的阈值内，以确保结果对临床决策和患者管理具有可靠性。若APS未被客观定义及实现，实验室结果的变异可能掩盖临床信息，甚至对患者结局产生负面影响。因此，为保证患者安全而需要达到的质量水平应得到精确定义，并针对每项检验项目作出具体规定。欧洲临床化学和检验医学联合会（EFLM）在2014年组织了一次战略会议，就建立APS模型的定义达成了共识，具有里程碑意义（相关成果专刊发表于CCLM，2015; vol. 53, issue 6）。提出了三种模型：模型1，基于分析性能对临床结局的影响；模型2，基于被测量生物变异组分；模型3，基于检测的最新技术水平（定义为技术上可达到的最高分析性能水平）。这种方法的新颖之处在于强调某些模型比其他模型更适合某些检验项目，因此应主要关注检验项目及其生物学和临床特征。因此，这三种模型并不一定构成严格的层级关系。

EFLM战略会议具有里程碑意义，其成果丰硕。Ceriotti等学者深入探讨了检验项目与模型适配的实操原则，因选择最适模型推导APS是确立检测质量适用性的关键步骤。模型1（“基于临床结局的APS”）：适用于检验项目在特定疾病或临床情境的决策中具有明确核心作用，且检测结果需通过既定决策阈值解释的场景。模型2（“基于生物变异的APS”）：适用于健康个体中处于”稳态”的检验项目。最后，当检验项目缺乏模型1或模型2中的特征时，可以将其放入模型3（“基于技术现状的APS”），这种模型也可暂时用于那些仍在等待基于结局的APS定义或等待可靠的生物变异数据的检验项目（图2）。当其他模型正确导出APS对某一检验项目要求过于严苛时，不可将模型3简单视为”补救”方案。另一方面，模型2不可用于缺乏严格稳态调控机制的检验项目，不得仅因生物变异数据比基于结局的信息更容易获得，便对该类检验项目强行采用此模型。对特定疾病诊断具有明确作用的检验项目，必须通过基于结局的研究验证并制定相应APS。然而现实是，基于临床结局的数据仍普遍匮乏，因此开展此类研究是为此检验项目制定APS建议的核心前提。通过模拟研究，分析检测方法的分析性能对临床（错误）分类的影响，进而评估其对患者结局概率的作用，是一个切实可行的选择。

最近，我们发表了使用这些模型建立39种常用实验室检验项目MU的ASP的APERTURE项目的结果。通过对现有文献的稳健性初步核查，确定临床样本标准MU的APS最低质量水平和理想质量水平。表4总结了所选检验项目的标准MU模型分配和APS，用于实验室实践以验证使用的IVD-MDs的MU，并确定给定实验室结果的估算MU是否会显著影响其解释。最近报告的血浆电解质案例表明，采用客观推导的APS开展MU评估能有效驱动实验室提升检测结果质量。

IQC-I的验证标准

****

IQC-I的可接受范围定义了相对于无偏倚靶值的允许偏差容限(该靶值由制造商通过对质控物在同一IVD-MD上重复测量获得，且该IVD-MD最优校准至选定参考测量系统)，该范围应确保检测结果在临床应用中具备适用性。如前所述，评估 IVD-MD校准偏差对uRw(用于计算患者结果MU)的影响程度，应是结果验证的核心准则。事实上，因校准不佳或试剂/校准品批次变更导致的IVD-MD校准突变引发QC结果漂移，可能导致IQC-II估算的uRw超出可接受范围。因此，IQC-I的可接受范围应与前面各段讨论的（扩展）MU的APS相对应。建议将APS直接标注于IQC图中，使IVD-MD校准性能与预期质量要求的关联性直观可判。

IQC-II的可接受性标准

****

在获得IQC-II数据后，进行uRw 估算前，应开展严格审核并制定数据管理决策，随后计算临床样本的MU。并运用前文所述MU的APS进行判定：若特定检测项目的MU估值可能影响其临床解读，或发现IVD-MD性能呈劣化趋势，则须立即采取纠正措施（见图1）。

EQA结果的可接受性

****

在CCLM特刊上发表的一篇专门针对上述EFLM会议期间所做贡献的文章中，Jones强调了EQA计划使用的APS定义存在很大差异，呼吁通过协作努力实现统一规范。会议建议优先采用会议提出的APS模型，但同样重要的是，EQA计划需明确说明所评估的分析质量的哪一方面。如果EQA计划满足表2所述的要求，允许对参评实验室的检测结果的溯源性进行评估，则实验室检验项目与EQA材料的定值（由更高级测量程序赋值）的偏离应控制在检验项目允许的MU限值内，MU限值（以数值形式）规定了提供满足临床需要的实验室检测信息所需的分析质量。这将使EQA参与者能够理解实验室数据质量对患者诊疗应用的影响，包括校准溯源性及实验室间检测结果的一致性（即结果标准化）。

如果未达到MU APS，则应根据参评实验室提供的EQA结果的表现，考虑并调查两个主要原因。若某实验室在连续多次EQA中的结果随机分布于扩展MU允许的APS限值之外（上下波动），则需识别该测量过程中三个MU贡献值（uref、ucal、uRw）中哪一项过高，并采取改进措施。在上述 EFLM 会议期间，我们提出了定义整个计量溯源链中综合MU推荐限值的理论框架。首先聚焦于与患者结果相关的综合MU APS，建议将溯源链不同层级的特定MU限值定义为APS分数。应为IVD制造商定义其校准品可达到的标准，以便为各实验室留出足够的 MU预算，使其能在临床样本上得出临床可接受的结果。如果在EQA中超出了允许的MU限值，参评实验室应首先核实所有可能影响其uRw的分析条件（如更换试剂批次、校准品、仪器维护等），检查EQA期间的IQC数据（I和II部分）。若上述因素均受控，则需重新审查制造商对校准品赋值及其对应MU的赋值方案，或IVD制造商为实现溯源性所选择的参考测量系统相关的MU。值得注意的是，对同一检验项目选择不同类型的校准层级体系可能导致不同的ucal值，某些情况下可能增加实现MU APS的难度。

相反，若某实验室在后续EQA中的结果全部高于或低于允许的MU限值，则可能提示存在医学上不可接受的检测偏倚。此时，应通过专项实验评估该检验项目相对于参考材料（参考测量程序）的偏倚值，并确认是否存在显著系统误差。（注：即使缺乏高级参考系统，任何处于对应计量溯源链顶端的物质或程序均可作为参考对象）。随后，该偏倚值应纳入临床样本MU的评估中。若重新计算后的MU仍无法满足预设的APS，制造商有责任开展调查，并通过纠正措施（如改进校准品赋值方案）最终解决问题。另一种方案是参评实验室可针对检测到的偏差引入校正因子。但需注意，实验室自行使用校正因子可能改变IVD-MD的认证状态，导致检测系统（及其生成的结果）丧失制造商提供的原始认证效力。

-END-

编译节选自：Clin Chem Lab Med 2023; 61(5): 759–768

接下来，小编会陆续为大家带来第3期杂志的精编文章，敬请期待!

本期编辑：《临床实验室》编辑部

医疗上APS是什么溯源时代质控重构体外诊断医疗器械与临床实验室检测性能的监测

相关推荐

作者介绍

聚慕医疗

热门文章

切换注册登录

切换登录注册