【想自己估计至少多少人感染了请看图计算】武汉感染率数学模型

b
boguagua
楼主 (北美华人网)
最近大家都在估计武汉的感染比例,比如25号杭州那架飞机说116个武汉人有2个感染,日本撤侨206人有3人感染
所以大家说感染比例是1%以上。但有人不服,说出租车三个人有一个感染,难道就30%的感染率了。

因为潮水哥不在,我就用民科知识做一下分析,欢迎大家喷啊。
问题的数学模型:116个武汉人25号从新加坡回来,2人感染,假设感染率都独立同分布,尝试估计每个人的感染率p的概率分布

分析:如果我们已经知道感染率p,那么我们就可以算出116个人当中恰好2个人感染的概率。这个就是最基本的二项是分布问题。
然而我们现在是要估计p的概率分布,所以就需要用Bayesian的方法来解决。二项分布的共轭分布是Beta分布,所以这个问题其实就是
求p的Beta分布。
我们先假设这116个人没有任何人感染,那么先验分布可以假设为是Beta(0, 116)。 如果我们知道有2人感染,我们就需要
更新对p的分布,根据Bayesian方法,知道2人感染,p的后验分布就是Beta(2,230)。(具体推导略过哈)

然后可以求p的逆Pdf就是如下图。解释一下,比如0.003对映的点是0.85,就意味着p大于0.3%的概率是85%。
所以我们有8成把握知道感染率高于0.3% (看清楚不是等于,是大于0.3%,这个非常重要)。


非常保守就取0.3%。武汉10million,那么在25号就有3万人感染,而且这只是25号的情况,而且还只是武汉,以后的传播之类不包括。
这么看来当时省长大人准备10万病床一点不夸张。
h
henshuhen
10million的3%是30万
b
boguagua
10million的3%是30万
henshuhen 发表于 1/31/2020 8:29:45 AM

我写错了,是0.3%。
p
pwwq
来,看我的数学水平也来分析一下: 3/206*10,000,000=145631
b
boguagua

来,看我的数学水平也来分析一下:

3/206*10,000,000=145631
pwwq 发表于 1/31/2020 8:30:44 AM

你这个没科技含量,就是小学肄业的那种。
p
pwwq

你这个没科技含量,就是小学肄业的那种。

boguagua 发表于 1/31/2020 8:31:44 AM


至少我小学毕业了,跟庆丰的学历一样
h
henshuhen
日本撤侨206人里查出来5个 和武汉那100多人的感染率基本上吻合 小学生数学算出来感染率就是2—3% 不知道你那个模型怎么得出0.3%的结论
b
boguagua
日本撤侨206人里查出来5个 和武汉那100多人的感染率基本上吻合 小学生数学算出来感染率就是2—3% 不知道你那个模型怎么得出0.3%的结论
henshuhen 发表于 1/31/2020 8:39:40 AM


那我说,那个出租车三个人有1个人感染了就是33%。这样也没错啊。
我们要做专业分析,不能当包子帝。
紫心汤圆
CDC的人出来辟谣了,死亡年龄组,大家不要过分担心


系统提示:若遇到视频无法播放请点击下方链接
https://www.youtube.com/embed/eo1DlPBuTrU

叫你们不要过分担心
w
weiweide
回复 7楼henshuhen的帖子 他求的是感染概率的概率分布,就是有多少信心在概率在0.3%, 这个算法更靠谱,随着概率值增大信心值就降低,比如概率在0.4%下信心就降低到了70%
e
en010272
p
pxs06
简单说就是采样的大小会影响这个概率估算的精确度。2-3%是一个点估计,并不知道实际的偏差有多大。 .3%是模型给的染病比例估算的一个下限,就是基本上可以相信这个得病比例是大于.3%的,用这个得到一个得病人数下限的估计 采样数据越大,估算会越准,上限和下限也会更接近,可以得到一个比较精确的估计
日本撤侨206人里查出来5个 和武汉那100多人的感染率基本上吻合 小学生数学算出来感染率就是2—3% 不知道你那个模型怎么得出0.3%的结论 henshuhen 发表于 1/31/2020 8:39:00 AM
b
boguagua
回复 9楼紫心汤圆的帖子 包帝当时也是这么想的。
c
cistim
最近大家都在估计武汉的感染比例,比如25号杭州那架飞机说116个武汉人有2个感染,日本撤侨206人有3人感染
所以大家说感染比例是1%以上。但有人不服,说出租车三个人有一个感染,难道就30%的感染率了。

因为潮水哥不在,我就用民科知识做一下分析,欢迎大家喷啊。
问题的数学模型:116个武汉人25号从新加坡回来,2人感染,假设感染率都独立同分布,尝试估计每个人的感染率p的概率分布

分析:如果我们已经知道感染率p,那么我们就可以算出116个人当中恰好2个人感染的概率。这个就是最基本的二项是分布问题。
然而我们现在是要估计p的概率分布,所以就需要用Bayesian的方法来解决。二项分布的共轭分布是Beta分布,所以这个问题其实就是
求p的Beta分布。
我们先假设这116个人没有任何人感染,那么先验分布可以假设为是Beta(0, 116)。 如果我们知道有2人感染,我们就需要
更新对p的分布,根据Bayesian方法,知道2人感染,p的后验分布就是Beta(2,230)。(具体推导略过哈)

然后可以求p的逆Pdf就是如下图。解释一下,比如0.003对映的点是0.85,就意味着p大于0.3%的概率是85%。
所以我们有8成把握知道感染率高于0.3% (看清楚不是等于,是大于0.3%,这个非常重要)。


非常保守就取0.3%。武汉10million,那么在25号就有3万人感染,而且这只是25号的情况,而且还只是武汉,以后的传播之类不包括。
这么看来当时省长大人准备10万病床一点不夸张。

boguagua 发表于 1/31/2020 8:26:21 AM


你这个模型有问题。样本太小。你重新抽一个样本 106里面一个都没有的,又得出什么结论。

比如非武汉籍大学生返乡的,现在🈶多少感染的。
早都有人在做统计了。

数据不足,做这种估算,有什么意义。
中国式民主


你这个模型有问题。样本太小。你重新抽一个样本 106里面一个都没有的,又得出什么结论。

比如非武汉籍大学生返乡的,现在🈶多少感染的。
早都有人在做统计了。

数据不足,做这种估算,有什么意义。

cistim 发表于 1/31/2020 10:37:15 AM

有明白人
c
cistim

有明白人
中国式民主 发表于 1/31/2020 10:43:45 AM


国内现在从社区到医院到学校到单位,都在打电话统计各家各户的情况。
大家也配合,外出的人很少了。自觉家里蹲。
开始很担心亲友。
现在看到都重视了,就看到了希望。

如果能早十天管控。下线就没有这么多。已经这样了,共度时艰吧。
b
boguagua
好👌
2
2sigma
柳叶刀有一篇新paper, 他们不仅有模型和病例数据,而且采用了大量一般人没能力分析的数据,比如腾讯的全国迁移数据和武汉航班出行数据, 这样就比只靠模型更符合实际. 其实这个模拟最重要的就是数据和输入参数,模型本身并不需要太复杂。 柳叶刀这篇paper里基本模型的估计结果是, 截至一月25日,共有75815例感染, 而且传播系数比非典大得多

https://www.thelancet.com/action/showPdf?pii=S0140-6736%2820%2930260-9
b
boguagua
看柳叶刀新paper, 他们模型里用了腾讯的迁移数据还有航班出行数据, 比只靠模型猜靠谱. 他们基本模型估计截止Jan 25, 有75815感染

https://www.thelancet.com/action/showPdf?pii=S0140-6736%2820%2930260-9
2sigma 发表于 1/31/2020 2:46:19 PM

模型简单有效最重要。越复杂估计的参数就越多。
然后就乱了。