从医学统计学角度评价医疗器械临床试验

国家食品药品监督管理局医疗器械审评中心邓洁

本文从医学统计学角度，结合一次性使用透析器产品的特点分析了医疗器械临床试验设计的一般要求；阐述了制定医疗器械临床试验的基本原则，以及医疗器械临床试验的要点；提出了目前面临的几个现实性问题，以期共同探讨通过运用医学统计理论进行医疗器械临床试验设计的科学性，从而推进医疗器械临床研究与评价的发展。

临床试验管理规范(good clinical practice，GCP是为保证临床试验过程规范，结果科学可靠，保护受者的权益并保障其安全而制定的，包括方案设计、组织实施、监察、稽查、记录、分析总结在内的临床试验全程的标准规范。不论是药品还是医疗器械临床验，均需要遵循这一国际公认的基本操作规范。对医疗器械的临床试验，ISO14155—1和ISO14155-2《疗器械临床调查》是用于世界范围内的医疗器械验，以满足不同国家、地区和国际管理法规中技术层的要求，适用于所有在人体受试者上进行的评价医器械临床安全性、有效性的临床试验。

医疗器械临床试验是初步的临床人体安全、有效性的评价试验。随着科技的飞速发展，医疗器械的研发逐年增多，提高医疗器械临床研究水平显得更加重要。医学统计是医疗器械临床研究工作中的重要组成部分，对医疗器械临床试验中的数据不能简单地比比数字大小就得出结论。目前，许多医疗器械研究工作者越来越重视医学统计在医疗器械临床试验中的作用。

1 医学统计在医疗器械临床试验中运用的基本原则

医学统计(medical statistics)是基于概率论和数理统计的基本原理和方法研究医学领域中数据的收集、整理和分析的一门学科。实验设计、收集资料、整理资料和分析资料是医学统计工作的主要内容。医疗器械临床研究的第一步是临床研究设计。所谓设计，就是对于临床研究计划方案的制定，除了临床专业设计之外，还应包括医学统计设计。如果研究设计出现错误，不论用什么统计分析方法进行数据处理都无法得到正确的结论。因此，统计设计在医疗器械临床研究中占有十分重要的地位。由于医疗器械的特殊性，如何结合医疗器械自身特点做好临床试验设计，是一个值得研究者和评价者共同探讨的问题。

1.1 医学统计在医疗器械临床试验中的作用虽然统计学不能消除临床试验结果的不确定性，但它可以检测并限制不确定性的水平，以便临床研究者把握和处理不确定性带来的风险。几乎所有的医疗手段都是有风险的，但这种风险的发生率各不相同，因此我们需要做的是合理地确定这个不确定性有多大。同时，统计学可以解决医疗器械临床研究中遇到的实际问题，确定足够的样本量、控制入组患者的偏倚、跟踪不良事件的证据、从纷繁复杂的数据中发现新知等。

医疗器械临床试验研究的对象是人类的健康和疾病现象。人体内外环境受多种因素的综合影响，就同一指标而言个体之间也有差异，医学统计学的任务就是透过偶然现象反映同质事物的特征和规律。通过研究总体来认识规律是不可能的，应该从总体中随机抽取样本，对样本进行观察或实验，从获得的信息来推断总体特征。在抽样过程中会有误差，由于抽样时未达到随机要求而造成的误差，这样抽取的样本不是总体的缩影，而是总体中的特殊部分，这样的样本对总体不具有代表性。由于生物的个体变异是客观存在的，样本指标与总体指标间的误差是不可避免的，因而，在开始收集医疗器械临床试验资料、进行临床研究设计时即应充分考虑这些误差。

收集和评价可靠的临床数据是医疗器械获得上市批准的基础之一，一个好的临床试验应该能够提供最客观的具有安全性和有效性的证据。临床试验方案中需要阐明研究目的、研究假设、主要／次要疗效／安全性评价指标、评价方法、样本量及计算依据、具体实施过程、数据收集、管理、质量控制、风险评估、统计分析方法等内容。

临床试验总结是依据试验过程中评价主要疗效／安全性指标后得出产品是否安全有效的结论，为最终产品上市确定合适的适应症、临床使用方法等内容提供科学依据。其中具体应回答如下问题：(1)临床试验的安全性；(2)临床试验效果分析；(3)不良反应的性质、危害程度、发生时问、持续时间等；(4)推荐临床应用的适应症、使用方法、禁忌症、注意事项等内容。

正如美国Naval Medical Centre San Diego临床研究中心Riffenburgh教授所说，由于过去医学研究者没有电脑，没有统计学软件，专业的统计学家也非常少，导致具体数据的统计非常困难，并且非常耗费时间，因此，临床研究的样本量非常小。现在，我们拥有越来越多的统计学工具来帮助计算庞大的研究数据，从数据中得出结果就变得很容易。需要强调的是，尽管医学统计在临床试验过程中非常重要，但医学统计并不能解决所有问题：

(1)医学统计不能使医疗器械临床试验结果的不确定性消失。

(2)如果没有良好的医疗器械临床试验数据作为基础，统计学也不能给出有意义的结果。

(3)如果没有临床研究者对医疗器械拟解决临床问题的探索和努力，统计学对解决实际问题也无能为力。

1.2注重发挥团队在医疗器械临床试验设计中的作用由于医疗器械产品自身的特殊性以及临床试验设计的复杂性，既有临床专业知识又有医学统计学知识同时了解医疗器械的机理复合型专业人才非常缺乏。因此，未来的任何一项医疗器械临床研究都将是一个团队合作的项目，医学统计学家将成为医学研究项目中不可或缺的一员，并且贯穿于临床研究的始终。

统计学家需要与临床医生、医疗器械研究者密切合作，临床研究者和统计学家的知识需要相互借鉴，临床研究者要有基本的统计学知识，统计学家需要了解更多的临床医学知识。同时，临床医生、统计学专家也要了解医疗器械作用机理以及相应的理化性能、生物相容性等方面的知识。未来，无论是统计学还是临床医学的发展都越来越快，医疗器械新产品层出不穷，这对于临床研究者和统计学家来说都是挑战。从合作关系来讲，良好的合作需要三方相互支持，通过沟通协作，从对方的角度思考，为共同的目标而努力，以任何一方为中心均对医疗器械的临床研究无益。

1.3医学统计在医疗器械临床试验设计中的运用

医学统计是确保临床试验设计科学、合理，试验结果可靠的有效手段之一。医学统计由具有临床试验经验和专业资质的医学统计学人员负责，并且全程参与I临床试验设计、实施、数据管理和统计。针对受试产品的具体特性需要确定：(1)研究方案；(2)研究目的和试验设计类型；(3)主要疗效／安全性评价指标；(4)受试人群的选择，拟定的产品适应症；(5)偏倚的控制措施，如：随机、盲法、对照等；(6)对照组的选择；(7)临床观察时间；(8)试验例数，样本量。

1.3.1样本量临床试验方案中需要明确样本量及计算依据。临床试验设计的类型不同，样本量计算方法不同，疗效／安全性评价方法也随之不同。试验设计类型分为：

(1)优效性设计(superiority)；

(2)非劣效性设计(non.inferiority)；

(3)等效性设计(equivalence)。

样本量的估算需要考虑的因素有：

(1)试验设计类型；

(2)对照组主要疗效／安全性评价指标的结果，可参考相关文献资料；

(3)与对照器械相比，估计合理的组间治疗差异(△)，△值由临床专家和统计学家共同确定；

(4)显著性水平按照惯例，值一般设为0.05；

(5)检验效能(power)

检验效能(把握度)：power=1一B，是将差异正确检出的能力，把握度不得低于80％；

(6)失访率

应该明确的是，临床试验的例数往往是预先计算确定的最小样本量，不应只是考虑到满足法规的要求，应根据临床实际可能出现的情况全面考虑。一般一个设计严谨而周密的临床试验，往往试验结束后的最终例数都超过预先计算确定的最小样本量。

1.3.2主要疗效／安全性评价指标疗效／安全性评价指标应能回答临床研究受试产品是否满足安全、有效性结论的问题，并与器械的应用有直接影响；疗效指标应能被直接观察、客观地测量；尽量不选择主观评价指标，如：生活质量，这样可以最大限度地降低获得虚假结论的可能性。

1.3.3入选／排除标准由熟悉试验器械研究领域的临床专家来制订，定义受试人群的特征，以便确定医疗器械的临床适用范围。对于多适应症临床试验，每一个适应症均要进行符合统计学要求的临床试验。

1.3.4控制偏倚的重要措施

(1)随机

随机是试验用器械根据统计学的随机分配表进行编码，受试者严格按照试验用器械编号的顺序入组，不得随意变动，否则会破坏随机化效果。

(2)盲法

盲法实施有一定的困难。由于医疗器械的特殊性，从伦理或可操作性考虑，很难或不可能做到单盲、双盲，可使用额外手段使得偏性降到最低。

(3)对照

(4)临床研究中心按照统一的方案进行临床试验。

1.3.5采用经典的、公认的统计方法、计算公式、统计软件(SAS)

2结合医疗器械特点进行临床试验设计

医疗器械临床试验资料除了上述要求外，还需要结合产品具体的特点进行设计，以一次性使用透析器为例。

2.1试验对象的选择

试验对象具有代表性。试验对象的选择原则上为慢性肾衰竭患者，对人选标准(年龄、性别、适应症、特殊要求)和排除标准(排除产品有风险、有伤害或影响疗效的患者)应有详细说明。

2.2试验记录准确详尽

包括产品名称及其配套设备、治疗程序、操作方法、使用的药物或试剂、肝素用量、治疗参数的设定、观察指标、取样时间与方式、副反应及处理预案、试验过程实时记录、结束时处理、不良反应及处理措施等相关内容。

预计本试验中可能出现的副反应及如何处理，包括：

(1)低血压(处理预案)；

(2)过敏反应(处理预案)；

(3)发烧、毒血症、菌血症、败血症等(处理预案)；

(4)溶血(处理预案)；

(5)出血(处理预案)；

(6)空气栓塞(处理预案)；

(7)破膜漏血(处理预案)；

(8)其他意外(处理预案)。

观察指标包括：

(1)生命体征：血压、脉搏、体温、心律；

(2)患者一般状态：患者自我感觉、首次使用综合症及体征变化；

(3)与使用透析器相关的数据变化；

(4)与透析器功能相关的实验室参数。

2.3 明确的评价指标

如：超滤率、溶质[尿素氮、肌酐]清除率、血生化检查、生物相容性、破膜、残血量、血室容积、跨膜压范围、血浆药物或毒品浓度等。

血生化检查包括：肌酐、尿素氮、钾、钠、氯、钙、磷、磷酸氢盐、白蛋白、球蛋白、血脂等。

生物相容性检查：使用15min后白细胞、血小板和血细胞计数、血氧分压、补体C3a、C5a水平等的变化。

3 医疗器械临床试验中有关问题的探讨

根据医疗器械临床试验实施过程中存在的共性问题以及目前注册审评中面临的几个现实性问题进行探讨。

3.1正确认识临床意义和统计学意义问的差异，关注临床专业判断，统计分析与专业分析相结合很多临床试验结果虽然有统计学差异，但并不具有临床意义。临床意义和统计学意义是不同的，面对结果不同的临床和统计学差异需要分析以下内容：

(1)研究结果同时具有临床和统计学意义，或研究结果无统计学意义也无临床意义，可以直接根据试验结果得出结论。

(2)试验结果有统计学意义，但不具有临床意义，这种情况也不难处理。如果P<0.05，统计学检验上有显著性意义，可能是由于试验病例数少造成的。

(3)试验结果有临床意义但未达到统计学差异显著性，这种情况需要考虑以下方面：首先，临床意义可能实际上并不存在；其次，确实存在临床意义，但由于研究随机化的问题或各种没有检测到的变量使统计学未达到显著性。因此，如果出现这种情况，需要进行更深一步的结果验证，即设计一个更好的研究，或者样本量更大的研究。

临床试验统计是基于对样本资料的推论结果得出的对总体规律的推断，在分析结果的过程中需要关注临床专业判断，统计分析与专业分析相结合，使样本推论整体的结论更可靠、更科学。

3.2在临床试验方案的设计中，医疗器械研发者、临床专家与医学统计学家协调沟通的问题医疗器械临床试验设计是较为复杂和难度较大的，医疗器械研究者和临床医生需要与医学统计学家进行临床试验方案设计与实施的合作。

(1)首先三方应互相了解对方专业领域的特点，才能在同一个平台上协调沟通。尤其由于医疗器械的特殊性，目前经常遇到临床试验设计人员与医疗器械研发人员工作中的脱节，临床试验方案不能反映受试产品的特点，没有针对性的研究内容，似乎是一个模板可用于各种临床试验。

(2)将医疗器械临床试验的特点与医学统计学原则相结合还需进一步深人探讨，有些统计原则很难在医疗器械临床试验过程中实现，如：盲法、对照问题等。

(3)除了医疗器械临床试验设计水平有待提高以外，我国医疗器械统计水平与国际水平也仍有一些差距，需要共同努力与提高，才能真正提高医疗器械临床研究的水平。

3.3针对受试者知情同意书的设计有待提高

通过将审评中医疗器械临床试验知情同意书与国际协调会议(InternationalConferenceonHarmonization，ICH)标准的对照发现，存在如下问题：

(1)对于医疗器械的描述使用语言过于专业化，无法使普通患者理解，如列出较多的临床前检测、生物相容性试验结果等。而对真正可能出现的与器械有关的不良反应的告知却较为笼统，甚至不说明不良反应。

(2)对患者进行临床试验所要进行的程序交代过于简单，应让患者了解将要治疗的每一个过程。

(3)对医疗器械治疗过程中存在的风险不够重视，没有针对器械特点的风险告知，更没有对疾病本身的风险加以陈述。大多数情况总是过多强调受益，而对替代治疗、补偿、继发恶变等情况避而不谈。

(4)没有明确告知患者出现问题咨询的电话和人员。知情同意书的设计在临床研究过程中是非常重要的，是体现医生与患者之间相互信任、相互保护的一个法律文件。合理的知情同意书可以充分体现伦理学原则，保护受试者，同时也是使临床试验能够顺利进行的重要保障。

3.4通过临床试验设计提高对不良事件与器械相关性的分析判定能力

一旦发现个别受试者的不良反应或检验明显异常，应及时进行相关性分析，以判断该结果是否确属器械所致。每位受试者都有一系列时间上的观测数据应重视不良反应发生的时间是渐次加重，还是自行缓解，并进行前后对比分析。

不良反应与产品的相关性判断肯定有关：符合所用产品已知的反应类型，符合治疗后合理的时问顺序，

该不良反应不能用其他原因解释，停止治疗后不良反应减轻或消失；反之，不符合所用产品已知的反应类型，不符合治疗后合理的时间顺序，患者的l临床状态或其他原因可解释该不良反应，临床状态改善或其他原因去除后不良反应消失则肯定与此无关。

在实际操作中需要临床医生提高鉴别能力，设计方案时需要预先考虑到这些问题。其目的在于通过临床试验方案的巧妙设计，降低临床实际过程中鉴定的难度，从而较早而明确地发现该器械的副反应。但如何通过医学统计学家的参与使其具有可操作性还需根据产品的特点进行进一步探讨。

3.5对照组

一个好的临床试验需要设置对照组，将可评价偏倚降到最低，以便可以清楚、客观地评价器械的疗效。对照人群应与受试人群在重要特征和影响因素上具有可比性，除了使用的器械不同外，其它方面应尽可能相同，即基线均衡。建议对照组例数与治疗组例数为1：1。从实际审评情况看，设立阳性平行对照更能准确评价受试产品，降低偏倚，客观地评价器械的疗效。

但由于医疗器械的特殊性、复杂性，目前对于有些产品实施对照有一定的难度，或不符合伦理原则，或没有充分的必要性。从操作层面上来看，有些特殊产品亦可不设立对照组，采用国际公认的评价指标来判断是否治疗成功。

需要注意的是，有少数临床研究采用历史对照，历史对照是最难保证研究人群具有可比性的。尤其是当研究人群与对照人群存在研究时间、地点严重不同时，研究者的治疗水平不同，患者的营养状况差异、社会经济水平不同、人种不同，很可能将疗效的差异错误归于器械的效果，因此尽量不用历史对照。

3.6病例例数与例次问题

目前，临床研究者对一次性使用透析器临床试验病例数的确定有按照例数选择的，也有按照例次选择的。由于透析产品的特殊性，有的专家认为透析后患者在进行下一次透析前患者内环境基本恢复如初，具有可比性，因此可以采用例次方法。这个观点类似于交叉对照方法病例的选择方式，即洗脱期的确立原则是没有第一次治疗的残余效果。而选择例数方法是基于对不同患者安全性进行重点观察，需要有一定的病例覆盖面。从现实情况来看，对于全新产品，使用新材料新工艺、需要着重研究临床安全性的产品，采用试验例数方法似乎更为合适。

4结语

从医疗器械临床试验设计来看，目前医疗器械研究人员、临床医生、统计学专家在临床试验过程中存在不同程度的脱节情况。此外，具有丰富临床经验和科研思路又了解医疗器械临床试验特点的综合型专家的缺乏和研究队伍的不足，也是影响医疗器械临床试验设计水平的重要因素。我国医疗器械临床试验设计与药品的临床试验规范化相比存在一定的差距，从医疗器械临床研究范围看，还有很大的上升空间。同时需要关注的是，医疗器械毕竟有别于药品，在临床试验设计、遵循统计原则等方面都需要根据医疗器械的自身特点进行深人研究。医学统计学家在医疗器械临床研究中需要进一步发挥专业特长，结合医疗器械的特殊性进行设计；盲目地套用药品临床试验指导原则或把医疗器械临床试验设计简单化、随意化都是不科学、不符合GCP原则的，同时也是不符合医疗器械临床研究规律的。我们相信，在临床医学专家、医学统计学家、医疗器械研究专家的共同努力和团结协作下，医疗器械临床试验水平将会逐步提高。