梅斯医学MedSci APP
医路相伴,成就大医

临床试验中降低样本量的15种策略

Tags: 临床试验   样本量   样本量计算      作者:译者:宫晓 更新:2020-03-17

在最终分析中调整自变量

        ~降低0-10%样本量

       在最终分析中可以预先规定调整变量来处理组间的不均衡。例如,在一项心梗研究中,如果一个组有更多的前壁心梗,可以预设使用协变量调整的方法来控制不均衡性。

       这样可以降低变异和样本量。这种方法有多因素分析中的很多明显的缺点,通常不建议使用。

对患者进行分层

        ~降低0-20%样本量

       对患者进行分层,可以帮我们最小化潜在的基线不均衡性,这样可以最大化研究效能。如果患者人群有较强的异质性,并且这个异质性会明显影响结局指标,那么分层方法会更为有效。

对患者进行富集

        ~降低0-20%样本量

       可以向着明显降低样本量的角度富集患者人群。

        第一种方法是增加患者人群同质性。使患者间相似性更高,会降低变异。例如,入组心梗的患者,如果仅入组同时伴有心梗既往史的患者,那结局指标的变异会更小。但这种富集方法牺牲了研究的外推性。

        另一种方法,在power和外推性两方面获得妥协的一种方法,是入组所有的患者,但是把富集的亚组作为主要研究终点,把所有患者组的分析放在二级研究终点或者层次化(Hierarchical)主要终点中。

       第二种方法,是选择最容易对药物起反应或者对药物反应最大的患者人群。例如,如果你要开展一项疼痛研究,平均疼痛5分的患者很可能有3分的疼痛降低,但平均疼痛3分的患者,可能性就很小。或者,比起多年顽固性疼痛的患者,仅仅痛了几个周的患者更容易有反应。

       第三种方法,是选择更容易发生结局事件的患者。例如,相比起下壁心梗,前壁心梗的患者更可能死亡。如果你的结局指标是死亡,那入组更高比例的前壁心梗患者,将会有更多的结局事件,同时整个研究有更大的power。

 

使用持续反应指标

        ~降低0-25%样本量

       在某些疾病中,例如克罗恩病,疾病的自然进展具有很高的变异性,并且结局的测量也有较大变异。

       许多患者很可能会有一过性的假阳性结果,因此,采用持续反应指标可以移除一些噪声。

       持续反应指标需要患者通过多次访视来证明好转,或者好转超过一定的时间长度。

 

使用成对比较

        ~降低0-30%样本量

       如果你可以多次使用同一个患者,那将降低测量值间的变异,增加power。

       例如,我们可以使用每个人平均血压改变值作为结局指标,而不是使用平均基线血压与治疗后平均血压进行比较。

 

使用频数分析

        ~降低0-40%样本量

       在某些情况下,一个患者可能发生多次事件(例如,癫痫)。如果各个事件之间是相互独立的,那我们可以使用事件数来作为结局指标,而不是发生事件的患者人数。

 

使用与预期的反应曲线相匹配的统计技术

        ~降低0-50%样本量

       标准的统计方法都假设一个标准的反应曲线。如果我们预期一个亚组的反应会特别好,或者如果我们预期随着时间进展,反应曲线并不光滑规则,或者如果我们觉得反应会服从一个不标准的分布,那么,我们统计师应当选择使用更恰当的统计方法来提高power。

       例如,如果我们预期要我在短期内有不佳的效果但长期效果比较好,那统计师需要在Cox比例风险模型中引入一项依时协变量。这将在某些程度上解决药物在不同时段效应不同的问题,提供较大的power。

       如果我们预期药物的中位生存期与对照相似,但是生存曲线的尾部不同(或者说,仅有很少的患者,例10%能从药物中有较大获益,但是90%的患者都无获益)。那么我们可能会使用2年生存率landmark分析而不是常规的Cox生存分析。

 

使用替代终点

        ~降低0-70%样本量

       替代终点是与疾病结局(心血管事件、肾衰、骨折)和治疗效果相关的测量值(例如,血糖水平、骨密度)。

       我们喜欢使用替代终点,是因为他们更容易测量,变异较小,通常比最终的临床结局更早的出现。

       但是真正使用替代终点的时候,却会有许多微妙的、意料之外的问题。但总的来说,如果我们正确选择了疾病因果通路上的一个替代终点,那么可以帮我们显著降低样本量。

 

增加事件发生率

        ~降低0-90%样本量

        较低事件发生率的研究需要更大的样本量。例如,如果一项心血管试验,试验组有6%的死亡率,对照组有7%的死亡率,那需要上万的患者。

        有时候,我们可以通过增加事件发生率来降低样本量。有几种方法可以增加事件发生率的,包括:更改结局事件的定义、延长随访时间、使用替代终点、对患者进行富集,或者使用复合终点。

        一个复合终点是把多个结局终点合并成一个。这个策略对于有多种结局的疾病更为有效,例如,糖尿病和红斑狼疮。一个比较经典的符合结局指标是“死亡或者发生心梗”。

        复合终点可能会很难处理,因为我们可能要对不同的成分分别给予不同的权重,这个结局终点可能会变复杂。例如,我们可能会觉得在红斑狼疮复合终点中,肾衰指标的权重应当高于皮疹。

        许多临床统计师并没有受过这方面的训练(金融业的统计师通常更擅长此种方法),所以我们制定复合终点的时候,更应当咨询有过设计、验证复合终点经验的人士。

        回到之前一个例子,如果一项心血管试验复合终点的事件发生率是12%比14%,那么样本量就会大大降低。

        为了使用复合终点获得较小的样本量,两组的绝对差异也要同时增加。例如,事件发生率为12%比13%的研究并不会比事件发生率为6%到7%的研究的样本量小,实际上样本量反而会更大。

 

开始高质量的临床试验

        ~降低5-20%样本量

     粗糙的临床试验设计和执行会让最终的患者数据难以进行分析,或者增加患者的脱失率。样本量通常需要根据脱失率进行增加。质量好的试验跟质量差的试验相比,仅因那些无法利用的患者数据,就会产生5-10%的样本量差异。

       另外,高标准的临床试验,例如,使用中央实验室来评价关键指标,对各个研究中心的研究者进行培训,保证各中心对主要结局指标测量的一致性,每次对患者进行评价都使用同一个评价者,等等,很多方法可以减少变异,减少样本量。例如,一项类风湿性关节炎研究没有要求由同一个医生来评价同一个患者多次访视的关节肿胀,那这个指标的变异将会显著增加,因为多了评价者间差异。

 

对二分类结局指标使用优化的界限值

        ~降低10-30%样本量

       如果我们需要使用二分类变量(比例,率),那我们需要花一些时间来确定最优的界值。例如,我们在做一项关节炎的研究,FDA要求我们使用有效/无效指标进行分析。我们可以做如下选择:

       ACR20作为界值(大约有20%的提升)来判定有效,我们期望试验组有60%的有效率,对照组有效率为40%。

        ACR70作为界值,我们期望试验组有15%的有效率,对照组有5%的有效率。

        ACR5作为界值,我们期望是安祖有95%的有效率,对照组有效率为85%。

        许多人认为较低的标准,例如,ACR20,会得到一个最小的样本量,特别是ACR20位标准,组间差异为20%,而ACR70为标准,组间差异仅为15%。

       但这是不正确的,两组40%和60%的有效率,需要97例样本;两组5%和15%的有效率,需要76例样本;两组95%和85%的有效率,同样需要76例样本(两者有效率对应1-p,所以是一致的)。

        这是因为,Power不仅仅依赖组间的绝对差异。Power依赖于odds(胜率)。当你使用二分类的结局指标的时候,在50%的事件发生率时power最低,在接近0%和100%的时候,power最高。如果绝对率差是一定的,那就服从这个规律。例如,80%和85%比较,需要样本量比40%和45%比较的样本量小,但是不比40%和50%比较的样本量小。

 

使用连续型变量

        ~降低10-40%样本量

       使用一个连续型变量做结局指标是最有效的降低样本量的手段之一。一个连续型指标可以取到任何一个数值,例如1mmHg,5.23mmHg,0.6348mmHg。

       一个非连续型变量仅能取到仅有的几个固定值,例如,春、夏、秋、冬。实际上,最常见的非连续型变量,二分类变量,仅仅可以取到两个固定值,例如,是、否。

       血压平均降低值,或伤口大小平均减少百分比,都可以成为一个连续型变量。我们可以把连续型变量转换成非连续型变量。例如,我们可以把血压值转换成“高血压”和“正常血压”而不是使用原始的mmHg单位。

       相对于非连续型变量,连续型变量含有更大的信息量。如果你知道一个人的血压是150/100,那比起我们仅仅知道他是“高血压”有更多的信息。所以,使用一个连续型变量作为结局指标,因为含有更大的信息量,通常会显著降低样本量。

       举个例子,我们正在测试一种药对伤口愈合的效果。你可以选择这个研究的结局指标。你可以选择平均的伤口愈合百分比(一个连续型变量)、或伤口愈合人数(伤口愈合可以定义为完全愈合,或者75%愈合,等等)。使用愈合百分比,我们大概需要80例患者来达到足够的power。使用痊愈患者的人数,我们差不多需要140例患者。

       这通常是降低样本量最有效的方法。但是为什么大家不总是使用连续型变量作为结局指标呢?有时候,由于逻辑问题,我们没办法使用连续型变量。更常见的,在III期临床试验里,FDA通常坚持使用非连续型的终点指标。

 

使用适应性设计

        ~降低10-50%样本量

       现代适应性设计可以降低样本量、降低费用、降低风险。非适应性设计的样本量计算通常基于各种估计甚至是猜测,往往不准确。因此,我们可能会设计了一项研究,为了保证足够的power,使样本量远远大于需要的样本量。适应性设计允许我们重新设定样本量,使它处在合适的大小。

 

使用交叉设计

        ~降低50-70%样本量

       如果可能的话,使用交叉设计可以通过降低变异和使每个患者提供的信息加倍的方式,降低样本量。做交叉设计有很多挑战,例如,残留效应等。因此尽在特定的情形下可以使用。

 

使用因子设计

        ~降低50-75%样本量

       在某些情形下,我们可以通过在同一个研究中同时设置和检验多个干预措施,使一个研究的信息量加倍。

 

本文译自:15 Ways to Reduce Sample Size In Clinical Trials

原作者:nQuery Sample Size Software Team

译者:宫晓

来源:网络
版权声明:
本网站所有注明“来源:梅斯医学”或“来源:MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有,非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:梅斯医学”。本网所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。同时转载内容不代表本站立场。
在此留言
小提示:本篇资讯需要登录阅读,点击跳转登录

相关推荐

移动应用
medsci.cn © 2020