Use chi square test. The p-value is < .00001. The result is significant at p < .05. 我们在比较两组数据。 第一组数据是5000个样品,用的是A collection device. 第二组数据只有70个样品,用的是B collection device。 两组数据都是临床病人样品,都是检测一种东西。A的阳性率是4.2%, B 的阳性率是 2.5%。请问:如何做统计意义的分析?想问两组数据是否具有统计意义差别? 我完全不懂统计,想请教大家!谢谢,就是有些clue,我去google也可以。 谢谢。
楼上的姐妹你们的讨论我大约看懂了一些,不是全部。我进一步解释一下。 这两种collection device其实是two different collection method of same collection device. 为了快速问问大家,我简化的说。本来也不是设计好的试验。只是临床的数据摆在那儿大头想利用分析一下。所以造成样品量差距很大。 A 是传统方法,所以样本量巨大。B只有一小撮人使用,所以样品相对小很多。 我随便写了一个阳性率,具体数字没有意义。我就是想知道能不能说两者阳性率是有statistically difference. 怎么分析。
根据现有的信息, 数据组和 collection device cofounded, 即便有区别,也有可能是分组造成的也有可能 device 造成的。要比两组的阳性率,就一个data point :4.2% 和2.5%, 你直接看谁大谁小就行了, 没什么统计方法。假设这是你知道的所有的信息,而且想比较 A, B的区别。 做 Sample1: 比如说1000 个样品, 每个样品用 A 测也有B测,算出阳性率; sample2: 1500个样品, A 测也有B测,算出阳性率;。。。 做30个往上最好,才能比较出A, B的difference。
这个方法的前提是 第一组和第二组是用同样的方法测同样的东西(比如说某种病),第一组数据中阳性率(得病的) 和第二组数中阳性率有什么区别?
我们做化验的,测的是 HPV。想比较第一组和第二组的 HPV positivity rate 是不是因为 collection device的差别而有统计差别。 我感觉我们这数据没法比,但不懂想请教一下班上大牛。
这位美美厉害,先谢谢,一会自己研究一下。 太感谢!!!
你要比的是A, B的difference。 不是假设A, B相同,第一组和第二组的阳性率相等不相等。chi-square 和 t-test都不work,
其实这个没啥区别, test P(A) = P(B) or not, 和 test diff = P(A) - P(B) = 0 or not 从统计上来说一样的,因为A和B样本是独立的,如果A和B样本之间有correlation就不好算了
区别在于, P(positive/group1)=p(positive/group2) 和 p( positive/A) =p(positive/B)不是一个东西。 group 和device cofounded, 即便有不同,也不能说是group 造成的还是device造成的
楼主没有提那5000个和70个样本不一样吧?“两组数据都是临床病人样品,都是检测一种东西”,在没有额外信息的情况下假设iid貌似没问题? propensity score matching的话需要楼主实验室收集这5070个测试者的信息,如果是几十上百个测试者估计这个数据都会有,如果是直接5000个样本,我表示怀疑…… 我那个分析确实很简略,assumption也很strong, 不过除非这两组样本有非常大的不同,我不觉得这个结论会有多少变化
sample size差这么大,怎么会是match design啊?
最好直接贴英文,中文看不太懂。
B的2.5%阳性率不可能是observed from that 70 samples, since 70*2.5%=1.75。从你的中文叙述完全搞不清楚你想干啥?
是的,样本数差异太大。确定哪个是control 哪个是placebo 后可以用propensity score 的 IPTW 或是 PS match, 之后可以 two population percentage test. 要是样本太少可以试试bootstraping
当然是啊。如果连assay都不一样还咋比。
t test不是compare mean of two groups吗? 这里没有mean啊。
有没有以前的研究比较过两种device? 同样的样品用两种方法测出来结果是否一致? 如果不一致的话你这里问的问题没有意义
有些公司内部试验是不一致。但我的焦点是我们自己的数据能否得出任何结论?