今天Dr. Birx新闻发布会上统计知识的普及

m
meekEarth
楼主 (北美华人网)
一个问题,测试仪准确率99%,你的样品拿去测试,发现是positive,那么你确实得covid-19的概率有多少?
下面是计算过程
A= have the disease
B=Test positive
要知道的是,P(A|B), 也就是test positive的情况下,被测者得病的确实概率。

先定义几个量,
1) 测试仪sensitivity 正确率,99%.
得到P(B|A)=99%, 含义:确实有病毒的情况下,仪器测对的概率。
P(B|~A)=1%, 含义:,没有病毒的情况,结果仪器测错了出结果有病毒的概率。
2)假设整个国家大概1%的感染病毒。
整个国家里随机取出一个人,其携带此病毒的概率是1%。得到P(A)=1%
不带病毒的概率是99%. P(~A)=99%.

答案
P(A|B)=P(B|A)P(A)/[P(B|A)P(A)+P(B|~A)P(~A)]=0.99*0.01/(0.99*0.01+0.01*0.99)=50%。

也就是说一半的概率。

明白了之后,看新闻不会被带偏,说什么测试仪很烂的话。
S
Sun6843
一个问题,测试仪准确率99%,你的样品拿去测试,发现是positive,那么你确实得covid-19的概率有多少?
下面是计算过程
A= have the disease
B=Test positive
要知道的是,P(A|B), 也就是test positive的情况下,被测者得病的确实概率。

先定义几个量,
1) 测试仪sensitivity 正确率,99%.
得到P(B|A)=99%, 含义:确实有病毒的情况下,仪器测对的概率。
P(B|~A)=1%, 含义:,没有病毒的情况,结果仪器测错了出结果有病毒的概率。
2)假设整个国家大概1%的感染病毒。
整个国家里随机取出一个人,其携带此病毒的概率是1%。得到P(A)=1%
不带病毒的概率是99%. P(~A)=99%.

答案
P(A|B)=P(B|A)P(A)/[P(B|A)P(A)+P(B|~A)P(~A)]=0.99*0.01/(0.99*0.01+0.01*0.99)=50%。

也就是说一半的概率。

明白了之后,看新闻不会被带偏,说什么测试仪很烂的话。

meekEarth 发表于 4/20/2020 11:03:07 PM

这里有一点逻辑问题。 现阶段,测covid-19还不是全民screening。 测试的人是有一些症状的。对这个人群,p(A)要远远》普通群众的患病率。
R
Riquelme
放心,你这一段条件概率的公式能看懂的就没几个人,估计会直接忽略这一段解释
s
sunfic

这里有一点逻辑问题。 现阶段,测covid-19还不是全民screening。 测试的人是有一些症状的。对这个人群,p(A)要远远》普通群众的患病率。

Sun6843 发表于 4/20/2020 11:08:54 PM

所以说不能全民测试 因为准确度很低

不知道他说的是不是这个意思
c
camfis

所以说不能全民测试 因为准确度很低

不知道他说的是不是这个意思

sunfic 发表于 4/20/2020 11:11:23 PM


如果全民测试,1%的阳性错误率带来的绝对数值会使得整个测试失去意义

打个简单的比方,1000个人测试,错误率1%就是其中有10个阳性是错的,而这里头真正被感染的也是1%,也就是10个,所以可能最终测出来20个阳性,但是10个是错的,也就只有50%的正确率

如果我理解错了,请指正
f
firmiana
这不就是不全民检测的理论基础吗,之前好像看到过 就是人群中实际患病的很少时候普遍测就会大量false positive
l
lrose
那把ny nj都测了先,这两个地方肯定不止1%
m
meekEarth
回复 5楼camfis的帖子

这个是非常reasonable的引申。
但其实解决方案也简单,就是采样的时候多搞几个swabs, 假设1)有足够多的swab,machine;假设2)PCR对同一个人的样品不会产生系统性的误差。
l
layman1989
一个问题,测试仪准确率99%,你的样品拿去测试,发现是positive,那么你确实得covid-19的概率有多少?
下面是计算过程
A= have the disease
B=Test positive
要知道的是,P(A|B), 也就是test positive的情况下,被测者得病的确实概率。

先定义几个量,
1) 测试仪sensitivity 正确率,99%.
得到P(B|A)=99%, 含义:确实有病毒的情况下,仪器测对的概率。
P(B|~A)=1%, 含义:,没有病毒的情况,结果仪器测错了出结果有病毒的概率。
2)假设整个国家大概1%的感染病毒。
整个国家里随机取出一个人,其携带此病毒的概率是1%。得到P(A)=1%
不带病毒的概率是99%. P(~A)=99%.

答案
P(A|B)=P(B|A)P(A)/[P(B|A)P(A)+P(B|~A)P(~A)]=0.99*0.01/(0.99*0.01+0.01*0.99)=50%。

也就是说一半的概率。

明白了之后,看新闻不会被带偏,说什么测试仪很烂的话。

meekEarth 发表于 4/20/2020 11:03:07 PM


纯粹偷换概念,基本的概率都不懂。机器每次测都是独立事件,和全民感染率有毛关系,还拿全民感染率来说事。
99%的准确率是说有1%的阴性其实可能是阳性。是阳性的100%就是阳性。也就是说如果你的测试结果是阳性,那100%就是感染了。如果测试结果是阴性,那你还有1%的可能性是感染了。
C
CK
假设#2上来就是编造的。不要拿公式来糊弄人,假设都错了结论哪里能正确?
l
layman1989
就是一个来带节奏的
s
sssccc
多次测量只要一个阳性就算阳性的话就是说必须所有的测试测出来是阴性那才认定阴性。这样的话提高了specificity但是降低了sensitivity,假阳率增加。 如果多次测量必须所有的都是阳性才算阳性的话,提高sensitivity降低specificity,虽然假阳减少但是假阴率会增高。所以多次测量不能完美解决问题。 我可能说反了,自己都绕糊涂了。point is,只要正确率不是100%,多次测量也要compromise。就看决策层认为降低假阳和假阴哪个更重要。
回复5楼 camfis 的帖子 这个是非常reasonable的引申。 但其实解决方案也简单,就是采样的时候多搞几个swabs, 假设1)有足够多的swab,machine;假设2)PCR对同一个人的样品不会产生系统性的误差。 meekEarth 发表于 4/20/2020 11:24:00 PM
s
surezzz
回复 1楼meekEarth的帖子 基本逻辑错误。 P(B|A) = 99%,只能得出来P(~B|A)=1%。而你理解成P(B|~A)=1%,也就是假阳性是1%。事实上是PCR测试的假阳性是非常底的。所以你的结论完全不能成立。
m
meekEarth


纯粹偷换概念,基本的概率都不懂。机器每次测都是独立事件,和全民感染率有毛关系,还拿全民感染率来说事。
99%的准确率是说有1%的阴性其实可能是阳性。是阳性的100%就是阳性。也就是说如果你的测试结果是阳性,那100%就是感染了。如果测试结果是阴性,那你还有1%的可能性是感染了。

layman1989 发表于 4/20/2020 11:29:35 PM

你所见的,并非是事实的全部。

这是生物测试,99%其实是非常好的。
即使是物理,你让一串完全一样的光子通过双缝,也搞不清楚每个光子是否通过其中一个缝。
z
zhegufei


如果全民测试,1%的阳性错误率带来的绝对数值会使得整个测试失去意义

打个简单的比方,1000个人测试,错误率1%就是其中有10个阳性是错的,而这里头真正被感染的也是1%,也就是10个,所以可能最终测出来20个阳性,但是10个是错的,也就只有50%的正确率

如果我理解错了,请指正

camfis 发表于 4/20/2020 11:18:09 PM


这也是为啥2月份CDC不给测的道理。一定要找到高危人群才给测,也就是武汉旅行或者直接接触新冠患者。
k
kongxincai
你这里P(B|A)是true positive rate(又叫sensitivity,recall)。P(B|~A)是false positive rate,也是1-specificity。准确率是另外一个概念。有的人把准确率定义为(sensitivity + specificity)/2。你知道准确率,是没法推出true positive rate和false positive rate,因为这两个是独立的变量。你这第一步都不对,所以这里的结论都不对。
s
sssccc
你理解错了准确率了。通常所说的测试灵敏度sensitivity是指假如一个人被感染了,他被测出阳性的概率。条件是在这个人已经感染的基础上,所以与人群感染率无关。同样specificity是指一个人没有感染被测出阴性的概率。 而我们想知道的是一旦被测出阳性,到底是不是真的感染了,这是ppv,这个和人群感染率,测试准确度有关。
纯粹偷换概念,基本的概率都不懂。机器每次测都是独立事件,和全民感染率有毛关系,还拿全民感染率来说事。 99%的准确率是说有1%的阴性其实可能是阳性。是阳性的100%就是阳性。也就是说如果你的测试结果是阳性,那100%就是感染了。如果测试结果是阴性,那你还有1%的可能性是感染了。 layman1989 发表于 4/20/2020 11:29:00 PM
i
imgp
建议先把sensitivityspecificity概念Google清楚了再来给大家科普