请问sample size到底是跟margin of error有关,还是跟power还有

p
pepsico
楼主 (未名空间)

最近在看t/z test hypothesis testing,被sample size这块完全弄混了。。。不知道
到底怎么理解。

首先,我是看到说决定sample size一般是depend on: (1)margin of error (2)
confidence level(3)standard deviation。这个我还能明白,因为me=z*std
deviation/sqrt(n)

不过后来又看到sample size取决于power (1-beta)还有effect size...那我就不明白
了。。。怎么把这两个联系起来呢?谢谢!!!
m
magliner

绝对是effective size or effect size. 外加alpha, beta
但如果是工作中用用,几个简单的公式也够了
早年香港科技大学一位教授讲的比较清楚,现在早退休了吧; 更早的是艾奥瓦那位,
把简单问题复杂化, 开辟了一大学科。
p
pepsico

可是上面那个用margin error, std还有alpha来算sample size的公式看起来也没有问
题。。。请问是说margin error是可以最后跟beta还有effect size联系起来的么?请
问怎么联系的呢。。。
z
zephyrkj

margin of error算出来的sample size,power只有50%。基础的统计课都有sample
size的公式啊!continuous outcome的是(Zalpha + Zbeta)^2 *variance/(effect size)^2,如果没记错的话

p
pepsico

谢谢你!统计可能一直没学好98这次在网上搜了一些跟sample size有关的公式,文
章,就被这两个不同的公式完全搞糊涂了。。。怎么也link不起来。。。

另外,无论margin of error是设置成多少,power都是50%么?
m
magliner

搞糊涂就对了, 大家都想明白了,老教授们也没法做研究了。
通常简单的公式是复杂公式的特例, 比如只研究proportion, 分布iid,test,
control 1:1等等, 通常够用了。
p
pepsico

....可是现在需要弄明白怎么办。。。现在对这两个方法还是很糊涂。。。

【 在 magliner (magliner) 的大作中提到: 】
: 搞糊涂就对了, 大家都想明白了,老教授们也没法做研究了。
: 通常简单的公式是复杂公式的特例, 比如只研究proportion, 分布iid,test,
: control 1:1等等, 通常够用了。

B
Bighappy


【 在 pepsico (pepsico) 的大作中提到: 】
: 最近在看t/z test hypothesis testing,被sample size这块完全弄混了。。。不知道
: 到底怎么理解。
: 首先,我是看到说决定sample size一般是depend on: (1)margin of error (2)
: confidence level(3)standard deviation。这个我还能明白,因为me=z*std
: deviation/sqrt(n)
: 不过后来又看到sample size取决于power (1-beta)还有effect size...那我就不明白
: 了。。。怎么把这两个联系起来呢?谢谢!!!

Sample size的方法和公式很多,即使是同一个计算目的,基于对数据的假设和分析的
需要,往往会又很多不同的答案,有的答案之间的差异还相当大。
就你的问题而言,按照目的的不同,样本量计算可以大致分为两种:
(1)只控制Type I error, 也就是alpha,那么你所说的sample size depend on (1) margin of error (2) confidence level (3)standard deviation,就是这种情况。
(2)同时控制Type I & II error, 也就是alpha和power。这种情况先一般有事先的假设检验,Null hypothesis和Alternative hypothesis,这个effect size很大也取决于你的hypothesis,那么计算sample size也就同时需要alpha和power。
第一种情况适用简单计算,往往借助Confidence Interval就可以了,文献大多将此法
定义为Precision Analysis。而第二种情况要考虑样本量能达到的以后分析的效能问题,多在Clinical Trials里面使用,所以它的更通用名字为Power Analysis。
除此以外,还有别的方法,譬如仅控制Power而不用管alpha,但很少见,偶尔有质量控制方面的文献用到。另外,方法的命名也没有一定的硬性要求,你也会经常发现
Precision Analysis和Power Analysis之间的滥用现象,但基本上这两个方法之间没有联系,或者说至少没有联系的必要,因为它们的适用理念是不一样的。当然,你要硬性将两者之间拉上个联系,无非是公式上的某些类似,但毫无意义。
B
Bighappy


【 在 pepsico (pepsico) 的大作中提到: 】
: 谢谢你!统计可能一直没学好�9�8这次在网上搜了一些跟sample
size有关的公式,文
: 章,就被这两个不同的公式完全搞糊涂了。。。怎么也link不起来。。。
: 另外,无论margin of error是设置成多少,power都是50%么?

无论你怎么设置margin of error,都和power毫无关系,因为两者压根就不是一个世界的东西。
c
cloudred

赞!!透彻

【 在 Bighappy (快乐大大大) 的大作中提到: 】
: Sample size的方法和公式很多,即使是同一个计算目的,基于对数据的假设和分析的
: 需要,往往会又很多不同的答案,有的答案之间的差异还相当大。
: 就你的问题而言,按照目的的不同,样本量计算可以大致分为两种:
: (1)只控制Type I error, 也就是alpha,那么你所说的sample size depend on (1)
: margin of error (2) confidence level (3)standard deviation,就是这种情况。: (2)同时控制Type I & II error, 也就是alpha和power。这种情况先一般有事先的假
: 设检验,Null hypothesis和Alternative hypothesis,这个effect size很大也取决于
: 你的hypothesis,那么计算sample size也就同时需要alpha和power。
: 第一种情况适用简单计算,往往借助Confidence Interval就可以了,文献大多将此法
: 定义为Precision Analysis。而第二种情况要考虑样本量能达到的以后分析的效能问题
: ...................