【新冠时代】 新冠测试的准确性

平等性
楼主 (文学城)

记得两年前大选的时候,文攻武卫,打得正欢。突然一声晴天霹雳,川普总统被测试出新冠阳性。这一下两党震惊,有沮丧的,有祝福的,有高兴的,也有嘲弄的。结果没过两天,剧情反转,川总出院了。这一下更是捅了马蜂窝,各种质疑纷至沓来。很自然的,就有人说,总统在装病。阴谋论总是太复杂,姑且不谈,让我这个理工男,从概率的角度来聊聊新冠测试出现假阳性的可能性。

要判断一个人的测试是否为假阳性,首先要讲一点新冠测试的准确性问题。一谈到准确性,当然就要搞清楚到底什么是假阴性和假阳性。这个比较简单,如果有100个病毒携带者,100个非携带者。如果通过某种试剂的测试,这100个携带者中只有90个显阳性,那假阴性就是10%;而这100个非携带者中有20个显阳性,那假阳性就是20%。那么问题来了,为什么不能做个理想的试剂,让假阴性和假阳性都是零呢?

答案很简单,这是因为现有的技术条件有局限。一般的试剂盒或者其它类似的生物测试,都是依据某种算法,来得到一个测试指标。这种指标一般是某种测量数值,比如说是个范围从0到100的数值。我们可以假设,病毒携带者的数值范围是60到100,而非携带者的范围是0到90。要判断是阳性或是阴性,一般需要事先确定一个标准值(cutoff value),当某个测试对象的测量数值小于这个标准值(比如说80),就定义为测试阴性;而如果大于等于80,就定义为测试阳性。这样一来,测试的准确性就和两个因素息息相关,一个是测试范围,一个是标准值。如果因为技术的限制,测试范围没办法进一步改进,那么提高精度的核心就在于这个标准值的确定。

这里有一个问题,到底是应该更多的控制假阳性,还是更多的控制假阴性。为什么会有这样的考虑呢?原因是,如果我们人为的把这个标准值定为0,那么所有的测试都将是阳性,假阴性就是零;而如果把标准值定为100,那么所有的测试都是阴性,假阳性就是零。显而易见,这两个极端的例子都没有任何实用的价值。所以一个好的试剂,它所确定的标准值总是假阳性率和假阴性率的协调和均衡,不能走极端。在新冠测试的时候,假阳性率和假阴性率这两个指标都很重要,如果是假阴性,会造成病情的延误;如果是假阳性,嗯,这要是搁在年初的上海,就有可能会造成整个小区被封,甚至小区的所有居民都被送到方舱医院。不过,假阳性和假阴性的均衡也不是绝对的数学上的一半一半,总还是有所侧重的。一般来说,对极具传染性的重症,为防止漏诊,假阴性率会尽量控制得更低一点。当然总的来说,对一种可靠的试剂,假阳性率和假阴性率最好都小于5%。

另外,测试的操作也是一个大问题。测试的精度和准度在不同环境和衡量手段下会有较大的变化。这个道理很简单,我们每次测心跳还有不同的数值,更何况这复杂得多的生物测试。试剂的标准一般是事先就定死了的,如果出现了因测试操作而造成的系统误差和较大测量误差,那么假阳性和假阴性的提高也就在所难免。

还有一个问题,那就是有一个概念上的重要区别,试剂测试的假阳性率和假阴性率,和实际测试中的假阳性和假阴性,是完全不同的。比如说,现在有一款核酸试剂的假阳性率和假阴性率都是5%,准确性相当不错了。假设我们用这款核酸试剂测试一百万人,其中五万人是病毒携带者。那么问题来了,根据所列的这些条件,如果有一个人被测出了阳性,他是病毒携带者的可能性是多大?

有朋友可能会说,这不是很简单吗,不就是95%嘛。其实不然!这个是需要用到条件概率来计算的,具体的公式我不写了,并不难,有高中数学的基础就足够了。答案是:

这个人的假阳性概率是50%!

当然现在大部分的核酸测试的准确性比我刚才举的例子还要高一点,但是也的确存在一些快速试剂,它们的测试标准比这个还低。回到我们开始讲到的问题,我觉得排除人为因素,如果只凭概率计算,川普总统当时是假阳性的可能并不低。

总结一下,如果同学们在家里做快速试剂的测试,查出来是阳性,先不用太惊慌,可以查一下这个试剂的假阳性率和假阴性率是多少,然后再估算一下当前社会上的病毒携带者的比例(我个人觉得可能在10-30%之间),然后就可以算一下自己是假阳性的概率了。只不过,这种方法,并不能降低您感染新冠的可能。要想做到后面这一点,我觉得第一是戴口罩,第二是打疫苗,简单易行,爱人爱己,童叟无欺。

祝各位健康如意!

(本文图片来自网络)



更多我的博客文章>>> 投桃报李,答谢亮亮妈妈 【新冠时代】 新冠测试的准确性 婚礼现场,那个当众悔婚的男人 新冠疫苗的副作用 爱国的高度
l
lovecat08
谢谢。收藏了。
望沙
严谨的思维,果然是理工男,
n
nearby
平兄高手啊。计算假阳性,什么TP, TN, FP, FN, 还有 Bayes, 也花时间的 :-)
可能成功的P
是不是应该测两次呢?
平等性
祝爱猫中秋快乐!
平等性
哈哈哈,理工男不会做家务,写这种文章那倒是手到擒来 :)
平等性
是,挺花时间的,敲了俺半个小时呢 :)
平等性
如果测试的假阳性是50%,那么,假设测两次的条件是完全独立的,那么两次都是假阳性的可能就是25%
l
ling_yin_shi
求真不易,尤其新问题。问题在于,一般人没有科学人员的素养,这样讲出来,会被普通人骂没用。:)
尘凡无忧
哇,假阳性概率竟然这么高。。。一直戴口罩能解决问题吗?好像有一种说法,一直戴口罩会降低人体免疫力?
平等性
哈哈哈,所以做科学研究,首先要练一张厚脸皮,任它风吹浪打,我自岿然不动 :)
平等性
啊,还有这个说法?有人做过临床试验证实了吗 :) 祝无忧中秋快乐!
青青的山
赞,再补充一点,勤洗手
平等性
有道理!谢谢青山兄
颤音
专家出马了
鲁冰花
有关新冠的文章我基本不看了,还是要赞一下。。:)
匿名3333
对不起这数据显然是错的,我看了几秒钟就得出结论了。

楼主是不是没学过统计学?

匿名3333
搜索下这篇文章

The impact of false positive COVID-19 results in an area of low prevalence

Public Health England reports that RT-PCR assays show a specificity of over 95%, meaning that up to 5% of cases are false positives.2 The impact of false positive results includes risk of overestimating the COVID-19 incidence, the demand on track and trace, and the extent of asymptomatic infection.

假阳性5%,计算方法?

During the same period, there were 5,079 negative tests; thus a total of 5,110 tests were carried out. The false positive rate (single gene low level positive) in this period was 0.5% (26/5110), giving a specificity of 99.5% (5,079/5,105). Over the same period, the true positive rate was 16% (5/31). From this data collected in a very low prevalence setting, the negative predictive value was 100% (no identified false negative results) and the positive predictive value was 16% (5/31).

拜托假阳性up to 5%已经够高了。

平等性
谢谢您的留言。这里有一个简单的公式,您可以试一下:

这里是计算这个条件概率的公式:假设检测阳性是+,检测阴性是-;实际带病毒是D,实际不带病毒是d。那么,如果一个人检测出阳性,他是实际带病毒的概率就是:
P(D|+) = P(+|D)*P(D)/( P(+|D)*P(D) + P(+|d)*P(d) )

 

平等性
哈哈哈,专家不专家,都是睁眼瞎 :) 祝颤音兄中秋快乐!
平等性
不看文章都要赞,看来冰花真是俺的铁粉 :) 祝中秋快乐!
匿名3333
不需要我们计算,人家给出的最终结果,数据是实验获得的

您所说的中间数据的假阳性比率其实是0.5%而不是5%,整整相差一个数量级。

匿名3333
所有这些科技论文,人家给出的都是最终结果而不是中间计算结果
平等性
您可以选择相信别人给出的最终结果,那是您个人的选择和自由。只不过,既然是科技论文,应该是要经过评审的。如果是俺在审稿,

论文的适用范围,对应人群,假设条件,计算过程,都是需要仔细检查的。如果论文中没有提供中间计算结果,俺一般是会要求作者补齐的。

 

平等性
我文中的例子,假设条件讲得很清楚了。您说不对,因为有人的条件和我用的不一样。您觉得我们是在讨论同一个问题吗?
k
kirn
Hoho,你可以去算算怀孕检测的假阳性了~~~~~
C
CBA7
哇,都快过节了,平兄还忙着给大家举办专业讲座,敬业精神实在是可嘉,大赞!祝平兄和家人中秋快乐!
颤音
赞!可惜有您的严谨的太少了
平等性
哈哈哈,小K真调皮 :) 不过呢,这道理还真是相通的 。。。
平等性
哈哈哈,就是好玩儿,连玩也有敬业精神? 这下可好,下次老婆抱怨,俺可有借口了 :)祝中秋快乐!
杨别青
这个计算是错的,每一个阳性的人的假阳性率是50%,检测就没有意义了。
杨别青
我觉得你的公式或数据代入值得再检查
平等性
我上面给出了公式,杨兄有空的时候不妨检查一下 :)中秋快乐!
平等性
如果杨兄真的发现了我所列的公式或是计算上有任何问题,请具体指出来。如果没发现问题,也请回复一下。谢谢!
杨别青
这个计算没有考虑群体中实际感染的发生率(群体中实际感染率)以及检查对象的感染可能性,

对结果有很大影响. 病史(接触病人,旅行,疫苗等)和临床症状也是另外的影响因素。

杨别青
群体中实际感染的发生率以及检查对象的感染可能性对结果有很大影响结果
杨别青
很好的提议
平等性
请注意审题。我在文中专门给出了这个条件:“假设我们用这款核酸试剂测试一百万人,其中五万人是病毒携带者。” 其实,

这是一个经典的流行病学的例子,是对群体检测准确性的大样本评估。

我在文中指出:”比如说,现在有一款核酸试剂的假阳性率和假阴性率都是5%,准确性相当不错了。假设我们用这款核酸试剂测试一百万人,其中五万人是病毒携带者。那么问题来了,根据所列的这些条件,如果有一个人被测出了阳性,他是病毒携带者的可能性是多大?“

很多人不相信根据这样的条件,会得到50%的假阳性结果。有一些人就如同杨兄所说,会直觉这个结果不对头,他们的依据是,如果是这样,那么群体检测还有什么意义?

其实这个问题要这样看,群体检测有没有意义,是要建立在试剂的高精确性和群体的高发病率上的。举个简单的例子,如果现在核酸检测试剂的假阳性率和假阴性率都是0.1%,算是非常精确的试剂了吧?比起前面一位网友所提到的0.5%的假阳性率还要低。而另一方面,如果全社会的实际病毒携带者的比率只有0.01%,那么,在成都这样规模的城市进行全城全员核酸检测(假设一天一千万人员的检测规模),那么,每天我们都会检测出一万左右的阳性;而实际的病毒携带者呢,其实只有一千左右。也就是说,绝大多数的检测阳性者都是假阳性。

我觉得共产党并不是不懂这个道理,它是希望所有的老百姓都不懂这个道理!

 

平等性
请见我在下面的跟帖
杨别青
检测阳性的实际感染率还是受群体感染率的影响,群体感染率高,检测阳性的实际感染率就低,

检测结果不结合临床症状和病史就做出判断就会偏差,同意低灵敏度的试剂不适合低发病率的群体检测, 

杨别青
检测对象的可能性也影响阳性结果的实际阳性率, 孕检阳性的人的假阳性率不是50%.

怀孕检测试剂盒的检测就是这样的道理
平等性
您说的有道理,我还可以举出很多和检测准确性相关的不同因素。可以用来丰富我文中所讨论的主题
杨别青
你提出的问题很好,促进了我对群体检测的思考,觉得题目是群体检测就会更好。
平等性
握手,握手!祝杨兄节日愉快!
P
Peace418
好提议
姗姗d来迟
+1
姗姗d来迟
赞一个