开篇声明:1:以下内容转自网络,如有侵权,可联系删除
2. 以下观点,仅代表作者个人观点,请带着质疑的态度去阅读。如有问题,欢迎评论区留言或直接联系作者
和前面所提到的盲法一样,随机化也是在临床试验中避免偏倚的重要设计技巧之一。啥是随机化呢,很简单,通俗地说,受试者到底分在那个组,必须是随机的,服从概率论的原理,不受研究者和受试者主观意愿的影响。随机化可以消除由于治疗分配带来的偏倚,可以使治疗组和对照组具有较好的可比性,更为重要的是随机化是合理的统计检验的基础,也就是说只有在随机化的试验中应用统计检验才是合理的。
随机化有哪些方法呢?通常有以下几种随机化方法:简单随机化、区组随机化、分层随机化和动态随机化。下边小胖将对这几种方法一一做简单介绍。
1. 简单随机化
我们可以简单地理解为扔硬币,来了一个受试者,扔一次硬币,正面进一组,反面进另一组,简单易行,但大家可以想到,比如你扔了10 次可能正好有5 正5 反,也可能有4 正6 反,等等,当然你扔的次数越多,正反出现的概率就会越接近。这就出现了一个问题,我们临床试验一般例数有限,有时就会出现各组例数相差较大的情况。曾经有人做过计算,你扔100 次,正好50 正50 反的概率只有8%。
2. 区组随机化
顾名思义,就是按照区组进行随机化,从而保证某一相等区间内各组病人完全相等。举个简单的例子吧,两个处理组A 组和B 组,我们设计4 个病人为一个区组,比如一共A 组和B 组每组要入选100 例病人共200 例吧,那一共有50个区组,4 个病人为一组,在这一组中保证有两个A 和两个B,这样随机1-4号里两个A 两个B,5-8 号两个A 两个B,这样依次类推。。。这样我们就可以较好地做到两组的病人基本相等。为什么呢,很简单,如果我们能完成200 例入组的话,可能会出现下边几种情况:
- 入组例数正好是4 的倍数,比如说200 例,204 例等,这时入组例数正好是整倍的区间数(50,51 个区间),由于每个区间都是两个A 两个B,那么最后每组的病人数肯定是相等的(100,102 例)
- 入组例数除以4 的余数是1,比如说201 例,那么有一个组会多出1 例来
- 入组例数除以4 的余数是2,比如说202 例,这时会有两种情况,一种是多出来的2 例都是一个组的,那么有一个组会多出2 例来,另一种是那多出来的2 例各分在两个组,那么最后两组的例数还是相等的
- 入组例数除以4 的余数是3,比如说203 例,那么多出来的3 例肯定有2例分在一个组,另1 例分在另一个组,最后有一个组会多出1 例来。
如上所述,最不理想的情况,最多一个组比另一个组会多出2 例来,这样我们就可以做到两组病例数的基本相同。
区组随机化一个重要的问题就是区组大小的问题,上边这个例子我们取的区组大小就是4,那么怎么确定区组大小呢?
随机化方法是让医生无法预测下一个病人划分到哪个组,因此我们在确定区组大小时也要谨记这个原则。如果两个组别而你的区组大小为2,那第一个病人是A 组,那第二个病人肯定就是B 组了,那这种随机性就相当差了。很好理解,区组越小,我们就越容易猜到下一个病人是哪个组的,因而我们应避免前边提及的只有两例病人的区组。但区组大小也不能太大,否则会可能产生由于中断一个区组而使两组例数有较大的差异。怎么理解呢,举个例子,两个组别,如果你的区间长度为16,比如说你最后入选了168 例病人吧,这时一共有10 个完整的区组,另外最后还有一个区组被中断了,只有8 例病人,这时这多余的8 例病人的分配就有如下可能:
- 情况1 A:0 B: 8 两组相差8 例
- 情况2 A:1 B: 7 两组相差6 例
- 情况3 A:2 B: 6 两组相差4 例
- 情况4 A:3 B: 5 两组相差2 例
- 情况5 A:4 B: 4 两组相差0 例
- 情况6 A:5 B: 3 两组相差2 例
- 情况7 A:6 B: 2 两组相差4 例
- 情况8 A:7 B: 1 两组相差6 例
- 情况9 A:8 B: 0 两组相差8 例
如上所述,这时就会出现两组例数相差较多的情况,最大可能相差8 例。正如小胖在上篇博文中举的例子,如果区间长度为4 的话,最大可能相差则为2例。
因此,区间长度的选择不宜太小,也不宜太大。通常情况下,如果只有两个治疗组别,区间长度一般可取4-10,就小胖的以前的做法,一般我会取4 或6。小胖还要罗唆一句,区间长度必须是组别个数的倍数哦,不然你咋分配病人呢,呵呵。
3. 分层随机化
啥意思?就是每个重要因素或重要因素组合为一单独层(也就是单独的随机表格),而在每一单独层内,各组病人例数保持均衡,从而最后达到这个重要因素在各个治疗组分布均衡的结果。举个简单的例子,两个治疗组试验组(T)和
对照组(C),按照基因型B 或C 分层,可能会产生以下两个随机表格:
第一个表格:
基因型 分组
B T
B C
B C
B T
……
第二个表格:
基因型 分组
C C
C T
C C
C T
……
在入组病人时,先看以下这个病人是什么基因型的,如果是基因B 型的,则根据第一个表格的随机顺序入组;如果是基因C 型的,则根据第二个表格的随机顺序入组,最后我们能基本保证试验组和对照组的基因B 型和C 型的病人大致相等。这就是最简单的分层随机化的过程。
其实大家应该很熟悉分层随机化,我们现在进行的临床试验大部分都是多中心临床试验,而我们在随机的过程中一般都会采取分中心随机化。这时的分中心随机化其实就是以研究中心为层的分层随机化。在中心随机化中,每个中心都有自己单独的一个随机表格,病人随机时,各个中心入选的病人按照各个中心的随机表格的顺序进行入组,最后保证的也是试验组和对照组在各个中心的病人数大致相等,也可以理解为,每个中心试验组和对照组的病人数大致相等。
为什么我们要进行分层随机化呢?很简单的道理,我们在作临床试验时总希望某些对疗效结果有较大影响的因素在各个治疗组内尽可能分布均衡。举个例子吧,在乙肝临床试验中,大家都知道基因型对最后的应答有很大的影响,通常情况下,基因C 型的比基因B 型的更难治,即疗效差;如果试验组基因C 型(难治的)的过多则试验组的总体应答情况就会被拉下来,试验组与对照组疗效的差异就会比实际的变小;试验组基因C 型(难治的)的过少则试验组的总体疗效就会被提上去了,试验组与对照组疗效的差异就会比实际的变大;总之,试验组和对照组基因型分布差异很大,就会影响到对疗效的评价。因此,我们需要把基因型作为分层因素进行分层随机化,使基因型在两组分布保持均衡。
分层随机化中如何选择分层因素呢?这个更多地根据不同的疾病而定,选择那些对疗效有重要影响的因素。这些更多地取决于临床实践,而非统计学。小胖在这里要说的是,多个分层因素的选择。有的临床试验选择的分层因素不止一个,
最常见的是你首先把研究中心当一个分层因素,然后在此之外又选择了别的分层因素,如年龄、疾病亚型啊等等,这时就会出现分层因素组合的情况。下边是分层因素组合的一个简单例子:
两组:A 组和B 组
分层因素:研究中心(10 个中心)、疾病亚型(两个亚型I 型和II 型)
这时我们一共有10×2=20 层,即需20 个随机安排表:
随机表格1:
研究中心 基因型 分组
01 I A
01 I B
01 I A
01 I B
……
随机表格2:
研究中心 基因型 分组
01 II A
01 II A
01 II B
01 II B
……
随机表格3:
研究中心 基因型 分组
02 I B
02 I B
02 I A
02 I A
……
随机表格4:
研究中心 基因型 分组
02 II A
02 II B
02 II B
02 II A
……
…………………..
随机表格19:
研究中心 基因型 分组
10 I B
10 I A
10 I A
10 I B
……
随机表格20:
研究中心 基因型 分组
10 II A
10 II B
10 II A
10 II B
……
当然,小胖要强调的一点是,分层的因素不能过多,因为因素一多则组合数就多,层数也就多,层数一多,就会使有些层次的人数不足。例如多中心临床试验中心为分层因素(10 个中心),另外还有2 个分层因素,每个因素各分成2 层,则共有10×2×2=40 层,一共需要安排40 个随机表格。如果一共入选200 例病人的话,每层平均5 个人,甚至有的层人数会很少,难以实施统计处理。因此分层因素不宜过多,要进行精选。通常来说两个以上的分层因素就会使分层难以实施。
在实际临床试验中我们最常见的其实是中心区组随机化,即把区组随机化和分层随机化(以中心分层)结合起来。
4. 动态随机化
动态随机化是指在临床试验过程中,病人随机入组的概率根据一定的条件而变化,能有效地保证各组间病例数和重要预后因素保持基本均衡。
那为什么要引入动态随机化呢?如前所述,我们可以采取分层随机化来保证一些重要的预后因素在各组分布基本均衡,但我们也要考虑到分层随机中的分层因素不能很多,如果分层因素很多,便会出现有的层的例数很少甚至没有的情况,而动态随机化就很好地解决这些问题。
在一些样本量不是很大,但又必须考虑预后因素对疗效影响的临床试验中,动态随机化显得尤为必要。
我们先从最简单的动态随机化方法来了解一下动态随机化的思路:
一个袋子里有黑色和白色两个球,你摸到黑球就入A 组,摸到白球就入B组,开始时你摸到黑球和白球的概率为0.5/0.5。假设你第一次摸了个黑球,入A组,然后你要把黑球放回袋子里,同时在往袋子里加一个白球,这时袋子里有1
黑2 白,你第二次摸到黑球和白球的概率就变成0.33/0.67,如果你第二次还是摸到黑球,那你要再加一个白球,这时袋子里有1 黑3 白,此时你第三次摸到黑球和白球的概率就变成0.25/0.75,依次类推,每次随机摸一个球,根据球的颜色确
定入组,然后将该球放回袋子里并加入1 个另一颜色的球,继续摸球。。。。这样通过概率的不断调整,最后达到两组间病例数大致相等。
以上就是最简单的动态随机化,可以实现各组例数大致相等,至于如何实现重要预后因素在两组间分布均衡,则需要更为复杂的方法,现在最常见的方法是最小化法。
最小化法主要解决的就是预后因素在组间分布均衡的问题,我们从下边这个例子来看一下最小化法的基本思路:
在一项临床试验中,年龄和性别是重要的预后因素,我们希望各治疗组在这两个方面保持均衡。已入组10 例病人情况如下:
年龄 A 组 B 组
<30 2 1
30~50 1 1
>50 2 3
性别
男 3 2
女 2 3
现在来了第11 例病人,他是35 岁的男性病人,那他要入哪一组呢?
- 在A 组中,和他年龄水平(30~50)相同的病例为1 例;和他性别水平(男)相同的病例为3 例;两者相加1+3 等于4
- 在B 组中,和他年龄水平(30~50)相同的病例为1 例;和他性别水平(男)相同的病例为2 例;两者相加1+2 等于3
- 3<4, 那么这例病人就入B 组,以使两组在年龄和性别方面的差别减少
以上就是最小化的最基本思路,简单一句话概括,就是根据前边入组的病人的情况,来确定病人的入组,原则上使组间预后因素的差别变小。
说到这里,可能大家觉得很复杂,其实我们需要了解的就是最小化法的简单思路,知道是怎么回事。到底这例病人该入那个组,就要求助于计算机了,咋说呢,现在啥都可以通过computer 来解决,呵呵。
现在基本通常的做法就是,当合格病人要入组时,收集其预后因素的基本信息,然后传真到随机中心,随机中心按照传真上的信息输入计算机,计算机程序就会计算出分到哪一组,然后再传真通知研究者。
上边我们介绍了随机化的四种方法,在我们开展的临床试验随机化入组中,常碰到的情况是1:1 随机,即各组要求病人入组的比例是相等的。当然在一些临床试验中,也会碰到一些随机比率不是1:1 的情况。
首先,我们比较一下1:1 随机和非1:1 随机。1:1 随机在统计上是最有效率的随机比率,在总样本量一定的情况下,其统计把握度是最大的;而非1:1 随机,如果要达到和1:1 随机相同的把握度,则需要更大的样本量。我们从下边这个例子看一下吧:
假设一临床试验,主要疗效指标为应答率,假设试验组和对照组的应答率分别为33.3%和20%;显著性水平为双侧0.05,把握度为90%;
- 如果设计为试验组和对照组随机比率为1:1,则总样本量为460 (230例每组)
- 如果设计为试验组和对照组随机比率为3:1,则总样本量为600(450/150)
从上面的例子可以看出,3:1 随机的总样本量要大于1:1 随机,随机比率越大时,需要的总样本量越大。当随机比率大于3:1 时,样本量会变得很大,因此一般不会采用。
这时大家会问一个问题了,既然非1:1 随机需要更多的样本量,那为什么还要采用呢?
其实我们在以下情况下,会常用到非1:1 随机:
- 治疗组间存在着比较大的成本差异,即一个组治疗的相关费用大大高于另一个组。这时我们就希望更多的病人入到便宜的那组中,这时我们就可以采用非1:1 随机化了;
- 对某些比较严重的疾病,一组疗效较好甚至可以救命,而另一组比如说安慰剂或者常规医疗对疾病没有大的疗效,这时我们需要把较少的病人入到安慰剂组,因此也有必要采用非1:1 随机化了。
总之,究竟要不要采用非1:1 随机,要根据实际情况综合考虑,这里又涉及到小胖自认为的临床试验的三个核心即科学、伦理和成本;这三个东西始终贯穿着临床试验的各个阶段。
0条评论