实例教程：样本量计算之横断面调查+连续变量

Original 2016-11-13 张耀文 医咖会

样本量计算包教包会的上一集讲了结局指标是分类变量的横断面调查，不讲一下连续变量，总觉得少了点什么呀。

小裴：结局指标是连续变量的横断面调查，怎么计算样本量呢？

小咖：对于结局指标是连续变量的横断面调查，计算样本量时，首先也要给出置信度（Confidence Level），一般可选取置信度1-α=0.95。此外，还需要根据既往文献或预试验的结果，给定两个参数：①结局指标的标准差估计值；②容许误差（表示总体均数与样本均数的绝对差值不超过该值）。

小裴：你还是上例子吧。

小咖：

某研究者拟开展一项横断面调查，调查某县高三年级男生的身高。据文献报道，邻县高三年级男生的身高均值大约为173cm，标准差约为10cm。规定容许误差为1cm，置信度1-α=0.95，已知该县高三年级男生共有3800人，则样本含量至少应有多少人？

小裴：置信度1-α到底是个什么鬼，你说了好几回了，有点不明觉厉。

小咖：由于总体参数（如均值、率等）是无法得知的，因此我们要通过横断面调查，以样本参数来估计总体参数。若上述横断面调查的结果是：均值=174cm, 95%CI：170cm-178cm。就可以理解为：研究者有95%的把握认为该市初三年级男生的真实身高在（170-178）cm这个区间内。这里，“95%的把握”就是我们前面规定的置信度1-α=0.95。你也可以规定置信度为0.90、0.99等，那么得到的结果也是相对应90%CI、99%CI等。

接下来我们看看PASS 11软件怎么计算。

1、选择Means→One Mean→Confidence Interval→Confidence Interval for One Mean

2、Find (Solve for)中选择N(Sample)， Confidence Level (1-Alpha)中选择0.95，Distance from Mean to Limit(s)中填入1，S (Standard Deviation)中填入10，Population Size中填入3800。其它选择为默认选项后，点击RUN。

敲黑板，重点来啦：

①Distance from Mean to Limit(s)是指均值到置信区间上限（或下限）的宽度，即容许误差。本例中，容许误差为1cm。

②Know Standard Deviation选项：勾选→表示研究者认为结局指标符合正态分布；不勾选→表示研究者认为结局指标符合t分布。（不勾选时样本量略大，一般情况下可以不勾选）

③Population Size选项：当调查对象总体数量可以认为是无限大时，填写Infinite；当知道调查对象大约总体数量时，填入相应的数值或近似值。（不同总体数量，样本量差别较大，请务必填入）

3、结果解读

PASS软件给出了样本量计算的结果、参考文献、报告中的名词定义和总结性描述。在样本量计算结果中我们需要关注以下一列：

Sample Size (N)：本研究需要352例研究对象。

小裴：不对啊，我发现这个计算方法和“结局指标是分类变量的横断面调查的样本量计算方法”有三个差别，你不会讲错了吧？

小咖：你先一一道来。

小裴：①这里的Distance from Mean to Limit(s)是容许误差，而在分类变量的样本量计算方法中，Confidence Interval Width (Two-Sided)中填入的是2倍的容许误差。

小咖：这个真没错，要问为什么这么设置，你得去问PASS软件的设计师。

小裴：②Population Size选项：当调查对象总体数量可以认为是无限大时，填写Infinite；当调查对象总体数量有限时，填入相应的数值或近似值。

但是在结局指标是分类变量的样本量计算中，没有这个选项啊。遇到的总体是有限总体，怎么办？比如我算出来的样本量需要1000人，但是总人群只有900人，怎么办？

小咖：这，只能怪PASS设计师不够严谨。幸运的是，你遇到我了。这时候的样本量需要校正一下，复杂的公式就不讲了。近似的校正公式为：

n = n0/(1+n0/N)

n：最终样本量；n0：PASS计算的样本量；N：总人群数量

如你刚才举的例子，则最终的样本量：

n = 1000/(1+1000/900) = 474例

另外补充一下，在横断面调查时需要考虑总体数量有限还是无限，是因为横断面调查是对特定时间点、特定地区、特定人群的一次调查。而病例对照研究、队列研究、RCT等研究设计方法不限定特定时间点，可以不考虑总体数量。因为从理论上来讲，只要入组时间足够长，研究对象的数量一定能到达到预先设计的数量。

小裴：我明白了，PASS设计师不如你。

小咖：你应该说：春风十里不如你。来，你总结一下样本量计算的结果。

小裴：

本研究为横断面调查，目的是调查某县高三年级男生的身高。据文献报道，邻县高三年级男生的身高均值大约为173cm，标准差约为10cm。规定容许误差为1cm，置信度1-α=0.95，已知该县高三年级男生共有3800人，利用PASS 11软件计算得到需要调查的样本量N=352例。假定无应答率为90%，则共需样本量为N =352÷0.9=391例。

小咖：给你和小兵一样的待遇，也送一张图，你感受一下。

样本量计算包教包会精彩回顾：

医咖会微信：medieco-ykh长按二维码关注我们吧

小伙伴们建了一个微信群~~~有临床研究设计或统计学方面的难题？快加小咖个人微信（xys2016ykf），拉你进群，和其他小伙伴们一起交流学习吧。

点击左下角“阅读原文”，了解更多医咖会既往推送的内容。