老钱:关于“样本池”的普测方法

老_钱
楼主 (文学峸)

(5/26/20,130)

老钱:关于“样本池”的普测方法 5/25/20



今天网上流转两篇文章,《武汉千万人核酸检测,真实感染率曝光》和《全民检测50万人已感染 武汉女斥政府脑残(视频)》。
 
武汉市的感染情况到底如何。这个问题不仅仅是武汉人关心,政府关心,也是全世界都很关心的问题。5月14日,武汉市掀起了“十日大会战任务”,要在10天之内,对全武汉的一千一百万人做一次核酸检测,彻底摸清武汉市的详细情况。


这么大的测试量,怎么能在十天完成。据说这是因为采取了“混合样本池”的方法。这个方法是英国科学家在《柳叶刀/Lancet》上发表的,为了提高大规模普查的效率和降低成本。
 
我思考了一下,想来做一个进一步理解和解释。
 
设想把一群人(比如说64人中的一半,32人)的每个人的采样样本混合在一起,成为一个样本池。因为32人的样品都搅合在一起了,只要其中有一个人是阳性,这个样本池整体就是阳性。如果检测结果是阴性,那么这个样本池里的任何一个人都必定是阴性。那么就不用对这32人一个一个地检测(但是仍然需要做了32个采样),而是仅一次测试就把这32个人都排除了。减少了31个测试。
 
对于剩下的另一半的32人呢?如法炮制。
 
再取一次16人的混合样本池,如果最好的结果是阴性。这16个人就一下子排除了。
第三次对剩下一半16人,做8人的混合样本池,最好的结果是阴性。这八个人就一次排除了。
第四次是对剩下8人,进行4人的混合样本池,最好的结果是阴性。这四个人就一次排除了。
第五次是对剩下4人,2人的混合样本池,如果是阴性。这两个人就排除了。
第六次,仅剩下最后两个人了。就要对每一个人都做测试。如果可能是3种。
两人都是阴性,那么这全部的64人就没有一人被感染!
如果一阴一阳,就是只有感染一人了;感染率就是1/64,即1.56%。
如果都是阳性,就是只有两人感染:感染率就是1/32,即3.12%。
 
这样的“样本池”法,最好的结果就是,对全部64人,采了64次样,但是仅仅做了7个测试,就完成了对全部64人的测试。每个人都必须被采样,这是必须的。但是,不是每一个人都需要做测试。最好的情况,就是只做了7次测试,就查清了64人。7/64,即是挨个检测的11%的检测量。
 
对于昂贵的耗料耗时耗人工的核酸检测来说,“样本池”法是非常有效,非常经济合算的。极大地降低了测试成本!
 
这样的“样本池”法,也叫做“二分法”。
 
上面是最幸运的情况。如果不幸呢?我们来看看“最不幸”的情况。
 
如果这个32人的“样本池”的测试结果是阳性,就必须对这个“样本池”里的人重新来一次采样和测试。可以一个人一个人的测试,找到具体谁是阳性,谁是阴性。不仅仅必须要对这32个人重新测试,还要对另一半的32人从头开始。
 
也可以,对这个阳性的“样本池”再来一次16人的混合样本池,最坏的结果是阳性。不仅仅必须对这16个人重新测试,还要对另一半的16人从头开始。
第三次是8人的混合样本池,最坏的结果是阳性。不仅仅必须对这8个人重新测试,还要对另一半的8人从头开始。
第四次是4人的混合样本池,最坏的结果是阳性。不仅仅必须对这4个人重新测试,还要对另一半的4人从头开始。
第五次是2人的混合样本池,如果结果是阳性。那么这最后四个人的每一个人都要采样测试。
 
这样的“样本池”法,最坏的结果就是,对全部64人,每一个人都被重复了4次采样和4次检测。一共采了256次样,做了256个测试。最终结果,最坏是64人都被感染了,百分之百的感染。最坏之下的最好的结果是,每个4人里只有一个人是阳性,另外3人都是阴性。就是四分之一,即25%的感染率。但是,仍然是要采256次样,做256个测试。
 
这样,“样本池”法反而增加了工作量,还不如64人,每一个人都测试一次了。
 
所以,“样本池”法的运用是有条件的,需要随机应变,灵活运用的。
 
而且,“样本池”太大了,可能降低了检测的灵敏度。我前面用的32人的“样本池”就太大了。这样“夸张”的“样本池”法,只是为了使得“减少测试量到11%”可以显易而见。如果32人中只有一个阳性的话,阳性的浓度立刻就降低到了1/32,很可能就检测不出来了。10人的“样本池”就会把一个阳性的浓度降低到1/10。多大的“样本池”是合适的呢?这就不是纸上谈兵,而应该从试验中总结出来。从微信上武汉大嫂的抱怨来看,在武汉的“大会战”中,是采用了10人的“样本池”。那个大嫂抱怨:“把我们十个人的样品不注名地放在一个容器里”。大嫂说,“那查个鬼啊!”。这是因为她不知道到“样本池”的理论。
 
那么,我们就用10人“样本池”来分析。如果这个“样本池”是阴性,那么这10人就全部是阴性,就节约了9/10的测试量。如果是阳性呢,就要把这10人叫回来重新测试。
改为5人“样本池”,如果结果是阴性,这5个人都是阴性,不用再测试了。
对于其余5个人,一一测试,总测试量就是7次,7/10,也减少了3次。
如果再采取3人“样本池”,如果是阴性,这3人都是阴性,只要再分别测试剩下的两个人就完成了。这样的总测试量就是5次,减少了50%的工作量。
如果3人“样本池”是阳性,那么这5个人都要逐个测试。总工作量就是8次。8/10.
如果第一个5人“样本池”是阳性,就重复上面的分析,总测试量大约为50%到80%。因为他们有把握,剩下的5人应该全是阴性。因为,在决定采用“样本池”方法之前,他们已经做了前期试验,得到了平均感染率是5%。但是,为了避免漏侧,还是要对剩下的5人,做一个“样本池”测试。这样来,总测试量大约人人检测的为60%到90%。
 
到这里,我们要回过头来说,“武汉大嫂”的抱怨是完全正确的,即使采用“样本池”方法,不可能把受测试的老百姓,反复的叫回来重新采样,更要被老百姓骂死了!一次采样的量必须够用测试3次。
 
所以,那个大嫂抱怨:“把我们十个人的样品不注名地放在一个容器里,那查个鬼啊!”。她是完全正确的。不管她懂不懂“样本池”。
 
由此看来,“样本池”的方法也只能用于第一步,顶多到第二步,到了4人“样本池”,就没有什么优越性了。
 
对于美国斯坦福大学研发出来的抗体快速检测来说,测试与采样基本上就是一件事儿。除了昂贵复杂的核酸检测,这样的“混合样本池”法,也就没有多少优越性了。
 
我不是生化医学领域里的人,只是一个工程师,只是有兴趣从简单算术来理解“样本池”的理论。本文不谈如何政治问题,只是数学和逻辑。可能贻笑大方。欢迎专家批评指正。
 
 (全文到此结束)



更多我的博客文章>>> 老钱:关于“样本池”的普测方法 老钱:我看方方日记(2) 老钱:我赞成公投公决封还是开封 老钱:她为苍生说过话 老钱:莫斯科的地铁
x
xintian
你还没有考虑国产核酸检测试剂盒的准群度和敏感度对混合测试的影响
杨别青
成本主要是取样,处理,检测,分析四部分。节省与实际阳性率有关,实际检测结果接近0.002%,节省了95%耗材和处理时间

取样的成本大概是混合的倍数,比如20人混合,200人为阳性,则最后采样成本增加20X200=4000人的第二次采样。

由于阳性率很低,结果混合还是节省了处理,检测和分析的时间和耗材(省了19/20=95%)。

混合的最大问题是牺牲了敏感性,假定检测下限为5 个病毒,混合后只能检测到含100个病毒以上的病人。5-100个病毒的人被漏检了。

L
LingYuan
对这一段不明白。你肯定有一定的假设

如果这个32人的“样本池”的测试结果是阳性,就必须对这个“样本池”里的人重新来一次采样和测试。可以一个人一个人的测试,找到具体谁是阳性,谁是阴性。不仅仅必须要对这32个人重新测试,还要对另一半的32人从头开始

L
LingYuan
为什么要重新采样呢? 第一次抽血多抽一些不就行了吗?
L
LingYuan
这个方法的关键是怎样分组。不一定对半分就是最佳的,黄金分割可能更好。如果预先有个大致估计可以用概率法来求。
L
LingYuan
灵敏度为什么降低呢? 推理的过程是什么?

假定检测下限为5 个病毒,混合后只能检测到含100个病毒以上的病人

杨别青
不是抽血,是鼻咽拭子,也是成本的核算,保存1000万个样本还是重检4000人加保存200万样品?那个省事
杨别青
低阳性率的不用对分,阳性组每个重检,也就4000人
杨别青
这是指20人样本混合组,其中有一个阳性病人,他的病毒数量达到100个/1 ul,混合后终浓度是5个/1ul,才能被检测出阳性
L
LingYuan
???
杨别青
数学理论上需要对分再检,由于极低阳性率,选阳性组20人逐个重检更节约时间和经费
p
pickshell
嗯,怎样分组,组的人数要有技巧。觉得重灾区分小组,非重灾区分大组。之后阳性组再黄金分割细筛。。于此类推。
杨别青
既然是普筛,我觉得敏感度是首先考虑的分组依据而不是重或轻灾,否则结果偏差太大
葱蒜
在CT双肺都白了,还要测3-4次才能确诊,可以知道国产试剂的灵敏度了。稀释十倍也就是得到它想要的数据而已
p
pickshell
你所指测试敏感度吧? 当然保证准确是一切的前提。敏感度与阳性率有关,而重或轻灾与阳性人口密度有关。

越重灾地方,分组人数应越小。。 就是等于过筛子,分大中小孔,越重灾地区,筛子孔越小:)

老_钱
谢谢你们的讨论。 我理工男,对医学是外行。喜欢瞎琢磨。只是抛砖引玉。 显然你们都是行家。向你们学习了。谢谢了。

谢谢你们的讨论。
我理工男,对医学是外行。喜欢瞎琢磨。只是抛砖引玉。
显然你们都是行家。向你们学习了。谢谢了。

杨别青
从报道的情况看, 主要不是试剂盒的问题,而是医护人员取样和处理的问题(病毒数量不够)
杨别青
个人说自己的观点,有合理的也有可能不合理的,大家平和讨论就好,谢谢你的话题,
杨别青
对,我指的是测试的技术底限敏感度,你指的是临床的检测敏感度
f
fuz
你真的搞过医学统计么?
O
OceanSound
像布尔代数, 000=0, 001=1, 011=1, 111=1. 我认为大部分人没有感染的情况下, 才效率高.

数学好的同学给证明一下。

未知
“样本池”最大问题是灵敏度。池子越大,灵敏度越下降,会导致许多False Negative (假阴性)

举个例子,一小瓶香油,闻起来很香,卖的价也高。店小二想出了个挣大钱的“高招”,把一小瓶香油,倒进一大桶菜籽油里,当香油卖。可之后来店里的顾客,都说闻不到香味。店小二感觉很“委屈”和困惑,这大桶里明明有香油呀!

新冠检测的灵敏度好像本身就不很高,好的也就95%~98%, 即有2%~5%是假阴性。经常需要做“双取样,双测试”,来减少假阴性的Probability。

 

p
pickshell
嗯,明白你意思,会有假阴性们漏网。精准与节省本身就是对矛盾。