请问sample size到底是跟margin of error有关，还是跟power还有

接近 5 年

楼主 (未名空间)

最近在看t/z test hypothesis testing,被sample size这块完全弄混了。。。不知道
到底怎么理解。

首先，我是看到说决定sample size一般是depend on: (1)margin of error (2)
confidence level(3)standard deviation。这个我还能明白，因为me=z*std
deviation/sqrt(n)

不过后来又看到sample size取决于power (1-beta)还有effect size...那我就不明白
了。。。怎么把这两个联系起来呢？谢谢！！！

magliner

接近 5 年

绝对是effective size or effect size. 外加alpha, beta
但如果是工作中用用，几个简单的公式也够了
早年香港科技大学一位教授讲的比较清楚，现在早退休了吧；更早的是艾奥瓦那位，
把简单问题复杂化，开辟了一大学科。

pepsico

接近 5 年

可是上面那个用margin error, std还有alpha来算sample size的公式看起来也没有问
题。。。请问是说margin error是可以最后跟beta还有effect size联系起来的么？请
问怎么联系的呢。。。

zephyrkj

接近 5 年

margin of error算出来的sample size，power只有50%。基础的统计课都有sample
size的公式啊！continuous outcome的是（Zalpha + Zbeta）^2 *variance/（effect size）^2，如果没记错的话

pepsico

接近 5 年

谢谢你！统计可能一直没学好98这次在网上搜了一些跟sample size有关的公式，文
章，就被这两个不同的公式完全搞糊涂了。。。怎么也link不起来。。。

另外，无论margin of error是设置成多少，power都是50%么？

magliner

接近 5 年

搞糊涂就对了，大家都想明白了，老教授们也没法做研究了。
通常简单的公式是复杂公式的特例，比如只研究proportion，分布iid，test,
control 1:1等等，通常够用了。

pepsico

接近 5 年

....可是现在需要弄明白怎么办。。。现在对这两个方法还是很糊涂。。。

【在 magliner (magliner) 的大作中提到: 】
: 搞糊涂就对了，大家都想明白了，老教授们也没法做研究了。
: 通常简单的公式是复杂公式的特例，比如只研究proportion，分布iid，test,
: control 1:1等等，通常够用了。

Bighappy

4 年多

【在 pepsico (pepsico) 的大作中提到: 】
: 最近在看t/z test hypothesis testing,被sample size这块完全弄混了。。。不知道
: 到底怎么理解。
: 首先，我是看到说决定sample size一般是depend on: (1)margin of error (2)
: confidence level(3)standard deviation。这个我还能明白，因为me=z*std
: deviation/sqrt(n)
: 不过后来又看到sample size取决于power (1-beta)还有effect size...那我就不明白
: 了。。。怎么把这两个联系起来呢？谢谢！！！

Sample size的方法和公式很多，即使是同一个计算目的，基于对数据的假设和分析的
需要，往往会又很多不同的答案，有的答案之间的差异还相当大。
就你的问题而言，按照目的的不同，样本量计算可以大致分为两种：
（1）只控制Type I error, 也就是alpha，那么你所说的sample size depend on (1) margin of error (2) confidence level (3)standard deviation，就是这种情况。
（2）同时控制Type I & II error, 也就是alpha和power。这种情况先一般有事先的假设检验，Null hypothesis和Alternative hypothesis，这个effect size很大也取决于你的hypothesis，那么计算sample size也就同时需要alpha和power。
第一种情况适用简单计算，往往借助Confidence Interval就可以了，文献大多将此法
定义为Precision Analysis。而第二种情况要考虑样本量能达到的以后分析的效能问题，多在Clinical Trials里面使用，所以它的更通用名字为Power Analysis。
除此以外，还有别的方法，譬如仅控制Power而不用管alpha，但很少见，偶尔有质量控制方面的文献用到。另外，方法的命名也没有一定的硬性要求，你也会经常发现
Precision Analysis和Power Analysis之间的滥用现象，但基本上这两个方法之间没有联系，或者说至少没有联系的必要，因为它们的适用理念是不一样的。当然，你要硬性将两者之间拉上个联系，无非是公式上的某些类似，但毫无意义。

Bighappy

4 年多

【在 pepsico (pepsico) 的大作中提到: 】
: 谢谢你！统计可能一直没学好�9�8这次在网上搜了一些跟sample
size有关的公式，文
: 章，就被这两个不同的公式完全搞糊涂了。。。怎么也link不起来。。。
: 另外，无论margin of error是设置成多少，power都是50%么？

无论你怎么设置margin of error，都和power毫无关系，因为两者压根就不是一个世界的东西。

cloudred

4 年多

赞！！透彻

【在 Bighappy (快乐大大大) 的大作中提到: 】
: Sample size的方法和公式很多，即使是同一个计算目的，基于对数据的假设和分析的
: 需要，往往会又很多不同的答案，有的答案之间的差异还相当大。
: 就你的问题而言，按照目的的不同，样本量计算可以大致分为两种：
: （1）只控制Type I error, 也就是alpha，那么你所说的sample size depend on (1)
: margin of error (2) confidence level (3)standard deviation，就是这种情况。: （2）同时控制Type I & II error, 也就是alpha和power。这种情况先一般有事先的假
: 设检验，Null hypothesis和Alternative hypothesis，这个effect size很大也取决于
: 你的hypothesis，那么计算sample size也就同时需要alpha和power。
: 第一种情况适用简单计算，往往借助Confidence Interval就可以了，文献大多将此法
: 定义为Precision Analysis。而第二种情况要考虑样本量能达到的以后分析的效能问题
: ...................