GISAID 进化树证明新冠病毒起源

n
nile
楼主 (未名空间)


广义而言,地球上所有生命起源于共同的祖先。缩小尺度,所有国家新冠病毒都有一个共同的冠状病毒起源。但是是不是所有的新冠病毒都起源于同一个新冠病毒,就是一个等待回答的问题。问题关键在于这个新字,广义而言冠状病毒每天都是新的。因为世界上不存在不变的事物。但是,新冠病毒的新,是特别指在某个地区引发大流行的一个特定的“新冠病毒”,问题于是就变成这样:在不同国家地区导致大流行的新冠病毒是由一个国家地区发生的新冠病毒传播扩散,还是由冠状病毒在不同的地区独立发生。

作为理论假设,当然两者都有存在的可能,正是因为存在两种可能性,所以不能把其中任何一种作为不证自明的公理。尼罗河从中医理论出发,认为多起源的可能性更大。理由在《武汉病毒还能走多远》和《美国新冠病毒还能走多远》两篇文章中有具体阐述。同时指出,新冠病毒的起源最后要依靠大量的病毒序列比较才能作出结论。现在,证据正在越来越清晰地在世人面前展现。

GISAID 汇集全球各实验室1442份新冠病毒基因组测序结果,生成了新冠病毒进化树。
图中实测样本以各色圆点表示。从左向右水平方向的连线是病毒进化线。表示病毒基因组发生碱基突变。线条长度与碱基取代数量相关,并且与时间相关。垂直连线不代表碱基取代,只是为了在同一平面上显示同时发展的进化线。
https://nextstrain.org/ncov?c=country&l=unrooted

从2019年12月3日到2020年2月26日,主要样本来自以中国为主的亚洲地区(蓝紫色圆点),从2020年2月26日到三月11日。测序样本主要来自欧洲(黄绿色)和北美(红色)
。蓝紫色点形成上中下分布的三个集群。中间数量最多。黄绿色点形成右侧上下两群分布,以上部数量较多。红点集中分布于右侧上方,右侧中部和下部有少量散在分布。

水平线相连色点表明左侧病毒是右侧病毒的祖先。图中只有很少不同色点的水平直线连接。绝对多数的情况都是相同色点的水平连接。表明只有极少的红色样本来自蓝紫或者黄绿,同样也只有极少的蓝紫样本来自红色样本或者黄绿样本。

人们最关心的问题是有没有找到作为所有新冠病毒祖先的“根”。从图示可见所有连接颜色样本点的水平连线在不同位置与垂直连线相交,最后汇集到图像最左侧的一条垂线。也就是说理论上它必然来自同一个来源。而且这个来源理论上还可以通过水平线向左侧与更早的起源相连。但是,理论上假设的这个来源并没有显示任何实际样本测序证明它的物理存在。最左侧的垂直线上没有任何代表样本基因组的色点。这种情况被称为“任意根”(arbitrary root)。如果从任何一个红点出发(美国样本)向左侧寻找水平连接,最多情况下它的左侧还是红点。与最左侧的红点相连的就是所有色点的共同祖先arbitrary root。蓝紫点,黄绿点的情况同样如此。

目前生成的新冠病毒进化树表明亚洲,欧洲,美洲的新冠病毒是独立发生的。并没有发现一个可以作为美国新冠病毒祖先的中国新冠病毒,同样,也没有发现一个可以作为欧洲病毒祖先的中国新冠病毒。作为美国病毒祖先的欧洲病毒同样也不存在。

一个明显的缺陷是人们无法得到1月15日之前的美国新冠病毒和欧洲新冠病毒。所以无
法知道在这个时间点之前美国和欧洲的新冠病毒与中国新冠病毒是非存在联系。

以目前的科学证据,如果新冠病毒是自然发生的,更大可能是在多中心同时或者先后发生。任何将病毒起源政治化的做法都是没有科学依据的,对人类的和平进步没有任何正能量推动作用。

n
nile

GISAID新冠进化树

s
stemcell1

厉害,贴图看不到。能否再贴一下
n
nile

你可以通过下面这个链接访问看到所有图。有长方图圆形图发散图。
https://nextstrain.org/ncov?c=country&l=unrooted

【 在 stemcell1 (stemcell) 的大作中提到: 】
: 厉害,贴图看不到。能否再贴一下

w
wsmj2

中国一共提供了225个数据,美国数据在不断增加,现在421个。
武汉公开的病人数目是5万,才28个数据。
上海病人数目400左右,95个数据。

这里面的原因还用说吗?
w
wsmj2

你要是单看武汉和上海的数据,上海的基因型多样性要远高于武汉。
是不是说病毒发源于上海? 28比95,怎么比?
n
nile

我只能根据公开数据讨论问题。

病例多少的问题本文没有相关论据。无法作出正确判断。

【 在 wsmj2 (majia) 的大作中提到: 】
: 你要是单看武汉和上海的数据,上海的基因型多样性要远高于武汉。
: 是不是说病毒发源于上海? 28比95,怎么比?

w
wsmj2

什么叫没有相关论据? 武汉28, 全湖北除武汉外只有一个数据。中国225, 美国421
, 这些都在nextstrain上清清楚楚的写着。 上海和武汉看起来都是多中心发生的。想从28个数据里面找所谓祖先的可能性有多大?

在我看来不提武汉仅有28个数据的,所谓数据分析,都是耍流氓。

【 在 nile (nile) 的大作中提到: 】
: 我只能根据公开数据讨论问题。
: 病例多少的问题本文没有相关论据。无法作出正确判断。

T
TSG

中国注意不是武汉2月一号以后不允许随便发表有基因序列的新冠病毒序列,你去问问
复旦,华大里的人谁都知道阿

【 在 wsmj2 (majia) 的大作中提到: 】
: 什么叫没有相关论据? 武汉28, 全湖北除武汉外只有一个数据。中国225, 美国
421
: , 这些都在nextstrain上清清楚楚的写着。 上海和武汉看起来都是多中心发生的。想
: 从28个数据里面找所谓祖先的可能性有多大?
: 在我看来不提武汉仅有28个数据的,所谓数据分析,都是耍流氓。

w
wsmj2

谢谢你的信息。所以谁是流氓,谁自己是知道的。
【 在 TSG (Now we are one!) 的大作中提到: 】
: 中国注意不是武汉2月一号以后不允许随便发表有基因序列的新冠病毒序列,你去问问
: 复旦,华大里的人谁都知道阿
: 421

n
nile

本文讨论新冠病毒起源是一个还是多个的问题。不涉及谁是流氓。

【 在 wsmj2 (majia) 的大作中提到: 】
: 谢谢你的信息。所以谁是流氓,谁自己是知道的。

c
ccqtjjtds

在国内耍流氓就行了,别到这里耍了,没人能傻到信你这个。

【 在 nile (nile) 的大作中提到: 】
: 广义而言,地球上所有生命起源于共同的祖先。缩小尺度,所有国家新冠病毒都有一个
: 共同的冠状病毒起源。但是是不是所有的新冠病毒都起源于同一个新冠病毒,就是一个
: 等待回答的问题。问题关键在于这个新字,广义而言冠状病毒每天都是新的。因为世界
: 上不存在不变的事物。但是,新冠病毒的新,是特别指在某个地区引发大流行的一个特
: 定的“新冠病毒”,问题于是就变成这样:在不同国家地区导致大流行的新冠病毒是由
: 一个国家地区发生的新冠病毒传播扩散,还是由冠状病毒在不同的地区独立发生。
: 作为理论假设,当然两者都有存在的可能,正是因为存在两种可能性,所以不能把其中
: 任何一种作为不证自明的公理。尼罗河从中医理论出发,认为多起源的可能性更大。理
: 由在《武汉病毒还能走多远》和《美国新冠病毒还能走多远》两篇文章中有具体阐述。
: 同时指出,新冠病毒的起源最后要依靠大量的病毒序列比较才能作出结论。现在,证据
: ...................

w
wsmj2

你要想讨论科学,必须有全面的数据。起码比较全面。现在有人耍流氓,让人拿不到全面数据。一个科学数据分析,如果不去考虑为什么数据不全,数据不全对最后结果的影响,还有必要分析吗?
【 在 nile (nile) 的大作中提到: 】
: 本文讨论新冠病毒起源是一个还是多个的问题。不涉及谁是流氓。

t
telo

就怕有文化的流氓
科研人员听从党领导 已停止上传序列 海鲜市场已清洗干净 怎么着

m
mousemice2

睁开你那两只逼眼看看这篇nature是什么时候发的,傻逼,草拟吗

【 在 TSG (Now we are one!) 的大作中提到: 】
: 中国注意不是武汉2月一号以后不允许随便发表有基因序列的新冠病毒序列,你去问问
: 复旦,华大里的人谁都知道阿
: 421

m
mousemice2

暂时看不出你的意图,我只告诉你封城后所有样品根本运不出来,武汉当地大学的学生根本不能进校。我的实验室不在武汉,都没有学生,教育部管的非常严格。

只有极个别做疫苗、药物等新冠相关的课题组会允许两三个学生回实验室。

【 在 wsmj2 (majia) 的大作中提到: 】
: 什么叫没有相关论据? 武汉28, 全湖北除武汉外只有一个数据。中国225, 美国
421
: , 这些都在nextstrain上清清楚楚的写着。 上海和武汉看起来都是多中心发生的。想
: 从28个数据里面找所谓祖先的可能性有多大?
: 在我看来不提武汉仅有28个数据的,所谓数据分析,都是耍流氓。

n
nile

你可以抗议GISAID,不要向我要什么数据。我只解读GISAID的进化树。连数据都不看。

【 在 wsmj2 (majia) 的大作中提到: 】
: 你要想讨论科学,必须有全面的数据。起码比较全面。现在有人耍流氓,让人拿不到全
: 面数据。一个科学数据分析,如果不去考虑为什么数据不全,数据不全对最后结果的影
: 响,还有必要分析吗?

s
stemcell1

睁开你的xx,看看这篇nature是什么时候发的。其他杂志的文章也有不少,没时间给你找。有兴趣自己去看,xx,xxx。

知道x代表的意思吗?xxx

【 在 TSG (Now we are one!) 的大作中提到: 】
: 中国注意不是武汉2月一号以后不允许随便发表有基因序列的新冠病毒序列,你去问问
: 复旦,华大里的人谁都知道阿
: 421

s
stemcell1

同上回复,xxx
【 在 TSG (Now we are one!) 的大作中提到: 】
: 中国注意不是武汉2月一号以后不允许随便发表有基因序列的新冠病毒序列,你去问问
: 复旦,华大里的人谁都知道阿
: 421

n
nile

很好奇问一句。科研人员听党话。你是听到党的话还是听到科研人员转述党的话,或者是你创作的小说。不管是什么,我也想听听。

【 在 telo (telo) 的大作中提到: 】
: 就怕有文化的流氓
: 科研人员听从党领导 已停止上传序列 海鲜市场已清洗干净 怎么着

T
TSG

楼上两位是从军办流窜到生版的吧,知道投文章和发文章的区别吗,就是石老师实验室2月一号以后流感数据都是严格控制不让出来的,这片大名鼎鼎的nature几号投的你们
不知道?懒得自己动手查一下不行吗,我也是闲的

再说一遍,国内2月一号所有新冠测序数据都是严控的,就那几个实验室华大,无毒,
博奥,复旦,问下就知道了

【 在 stemcell1 (stemcell) 的大作中提到: 】
: 同上回复,xxx

s
stemcell1

你的脸我再打一次,看看这个数据库最新的测序数据是什么时候上传的,3月19号或者3月20号。

还有不少是在2月1号后上传的,你给解释一下,xxx,xx
【 在 TSG (Now we are one!) 的大作中提到: 】
: 楼上两位是从军办流窜到生版的吧,知道投文章和发文章的区别吗,就是石老师实验室
: 2月一号以后流感数据都是严格控制不让出来的,这片大名鼎鼎的nature几号投的你们
: 不知道?懒得自己动手查一下不行吗,我也是闲的
: 再说一遍,国内2月一号所有新冠测序数据都是严控的,就那几个实验室华大,无毒,
: 博奥,复旦,问下就知道了

s
stemcell1

整体上看,2月中旬后中国上传的测序数据少了,关键是因为封城封国的原因,之前的
那批数据是在封城封国之前就测出来了。

后续肯定会有数据慢慢上传的,我现在最担心的是美国或者欧洲国家不去测序(有的国家可能因为技术能力的问题测不了或者测得慢)。因为现在全世界都认为这个病毒来源于中国,中国要是不测等于默认了,如果继续测的话,国外的一起测的话,说不定能够把事情相对的解释清楚。
T
TSG


那些零星上传的都是卫建委底下省属实验室放出去的,至于为什么允许这些放我不知道,我只是说出我所知道的,2月份以后所有第三方实验室的测序数据严控,你自己想像
维尼一样捂着自high悉听尊便,没人想让你相信什么,我是说给班上一些筒子听的

【 在 stemcell1 (stemcell) 的大作中提到: 】
: 你的脸我再打一次,看看这个数据库最新的测序数据是什么时候上传的,3月19号或
者3
: 月20号。
: 还有不少是在2月1号后上传的,你给解释一下,xxx,xx

m
molen


莫明其妙,能不能不要胡说八道 ?!

【 在 wsmj2 (majia) 的大作中提到: 】
: 中国一共提供了225个数据,美国数据在不断增加,现在421个。
: 武汉公开的病人数目是5万,才28个数据。
: 上海病人数目400左右,95个数据。
: 这里面的原因还用说吗?

n
nile

本文讨论GISAID进化树,只能基于GISAID现实存在的数据。

有人指控武汉数据少是故意隐瞒,并言之凿糟地地说有上面有指示。谁谁谁都知道。请出示相关证据,否则人们就要问。上面指示你看到了?谁谁谁都知道,你怎么知道的?是他们告诉你的?

讨论学术一个基本原则是基于事实。而不是猜测。提出猜测可以,也必须有相关事实为根据。

动不动骂别人狗屎的,狗屎正是出自他自己的口中。动不动骂别人流氓的,首先自证了流氓。
d
donaghy

学过一点统计都知道,采样的数据少,在这个数据上得出的结论可信度就不高。
所以你尽扯各种结论,这是你的自由。

可惜就是你的结论可信度不高而已,在专业人士看来纯fart

【 在 nile (nile) 的大作中提到: 】
: 本文讨论GISAID进化树,只能基于GISAID现实存在的数据。
: 有人指控武汉数据少是故意隐瞒,并言之凿糟地地说有上面有指示。谁谁谁都知道。请
: 出示相关证据,否则人们就要问。上面指示你看到了?谁谁谁都知道,你怎么知道的?
: 是他们告诉你的?
: 讨论学术一个基本原则是基于事实。而不是猜测。提出猜测可以,也必须有相关事实为
: 根据。
: 动不动骂别人狗屎的,狗屎正是出自他自己的口中。动不动骂别人流氓的,首先自证了
: 流氓。

n
nile

那你就说GISAID是胡扯吧。这里面没有统计问题。

【 在 donaghy (I am an NBA referee) 的大作中提到: 】
: 学过一点统计都知道,采样的数据少,在这个数据上得出的结论可信度就不高。
: 所以你尽扯各种结论,这是你的自由。
: 可惜就是你的结论可信度不高而已,在专业人士看来纯fart

f
fxygrlongbow

数据是统计学的基础,收集的数据不够,分析出来的结论,只能呵呵....