说的很好。Well said 我个人观点你说的第二点(时间顺序)其实是最根本的,但是也是最容易被忽略的,而且也经常是故意或者确实说不清的一点。比如这个话题,应该说清楚是,无癌症诊断的人现在吸烟可能会导致未来得肺癌。或者是现在已经有肺癌诊断或者明确的风险的人但还没有开始吸烟,将来会更更喜欢吸烟。这中间还得确定一个比较的人,因为这些论断都是说更加什么的,得有比较才能这么说
统计学和计量经济学有几个办法解决reverse causality 我来列两个 一个是 吸烟at time t-1 与癌症at time t 的关系来证明吸烟导致癌症。用时间前后关系证明。 二是用exogenous shock, 比如政府出台政策(比如提高烟草税)影响吸烟率,导致肺癌症率下降或上升。提高烟草税跟癌症没有直接联系,只有通过吸烟来影响。
请问大家用什么方法进行疾病风险推导?
具体,就是,怎么知道A导致了B,A是吸烟 B是肺癌
为什么不是肺癌导致了吸烟? 而是吸烟导致了肺癌呢?
统计学上是如何推导出因果关系的?
假定给你两列数据,一列是吸烟与否,一列是肺癌与否。能仅仅用这两组数据,就说是吸烟导致了肺癌;还是肺癌导致了吸烟?
如果不能推导。那么为了得出吸烟导致肺癌,我们还需要哪些数据
以及什么统计学分析方法才是正确的?
最后问大家一个猪问题。
如果A与B有关联,B与C有关联,请问A与C有关联吗? 1)有关联 2)没关联 3)可能有关联;也可能无关联
如果A导致B,B导致C,请问A导致C? 1)导致 2)不导致 3)可能导致;也可能不导致
哈哈
不是什么大事儿。这脑子,丢不丢,估计差不多。
请赐教
能回答一下问题吗? 急等答案
多倒立, 脑子里的水出来一些就有答案了。
时间,的确是个很好的指标,来判断。
有个更tough的问题。如何判断一个疾病的症状,还是一个疾病的原因?
举个例子。肿块。
请问,是肿块导致了癌症 还是癌症产生了肿块?
多谢!
的确难点在排除C。
另外,谁先,谁后,也不好判断。 举个例子,肿块,癌症。 我们都知道癌症导致了肿块。
但是绝大多数人,是先看到了肿块,然后去医院,然后诊断出得了癌症。 所以根据时间顺序,我们得出肿块导致了癌症。
很简单的判断吧,被移植了肺癌组织的老鼠,会变得爱吸烟吗?其它器官转移至肺部的癌症,会引起病患从不爱吸烟,变得爱吸烟吗?
如果把吸烟作为输入,人作为接受输入的系统,系统输出的结果就是此人(易)得癌症;
如果把此人得癌症作为输入(移植癌细胞,或者癌细胞转移),同样是人作为系统,输出会是此人变得爱吸烟吗?答案是否定的。
这就是工程学的人的理解。
是想到这个问题后才丢了脑子,还是丢了脑子才想到这个问题?
怎样推导?
我个人认为是想到这个问题后才丢了脑子,因为发帖时间顺序关系。
肺癌和吸烟是个大家容易理解的例子。作为开胃菜。
下面,开始进入主菜单。
有一类人的基因,如果变异后,会容易导致酗酒。
请问如何证明,是酗酒基因产生变异,所以导致此人容易酗酒。
还是此人酗酒,所以导致此基因产生变异?
请设计一个实验,来证明因果关系。
有良性tumor 啊,癌症可以cause tumor, 但不是所有tumor 都是癌症
你这个例子好极了。
在复杂的医学推理中。的确存在,我们找不到“冬天”这个主因。 而错误的把“人们穿上羽绒服”,所以“黑熊要冬眠” 或者“黑熊冬眠”,所以“人们穿上羽绒服”
另外一个物理学上著名的因果问题。 F=ma 是力产生加速度,还是加速度产生力?
但是"肺癌导致吸烟",这事不合逻辑也不合常理。
我觉得你在提问题之前,应该先做点基本的研究吧
像那位层主的例子,本身其实是关于因果关系(causation)和同时发生(coincidance)的区别,是有没有因和果的问题
而你的问题,则是因和果之间的关系,孰是因和孰是果,结果你还分不清你的问题和那位层主的问题的区别。难怪楼里有些人直接嘲讽了
你说的对。我就是想在分不清的前提下,来判断两个变量A和B,到底谁是因,谁是果。
也就是说,我们蒙上眼睛。旁人给你两个变量A和B,问你,是A导致B,还是B导致A。
这个时候,你说,我不知道。旁人又问你, 你需要哪些条件,才能回答这个问题。
这个时候,你需要思考了。这就是我想得到的答案。对于任意两个变量A和B,外加什么条件, 我们就能从统计学上判断出到底A和B存在不存在因果关系,谁是因,谁是果?
“人们穿上羽绒服” , “黑熊冬眠”, 非常接近我要研究的环境。我研究的环境 就是一堆毫不相关的(或者没有前人分析过它们相关的)变量。而我是第一个人 要抓出它们谁是因,谁是果。
举个更形象的例子。你发现,地球上每天太阳日升日落。这个时候,你一定会去思考, 是地球决定太阳升落;还是反之。 如果没有任何课本告诉你地球是绕着太阳转的, 你该如何去研究这个因果问题呢?
对。现有的统计方法,t-test, ANOVA, Linear Mixed Model, 好像没法用于因果推论。 我想问问做因果推论的,你们都用什么工具和方法呢?
回到肺癌导致吸烟。一看标题,大家肯定一笑。但是,静一静,这是个重大的科研方法。
吸烟代表的是生活方式,癌症代表的是疾病。我们比较容易接受的是生活方式改变了健康状态,导致了疾病。 我们切身想一想,真的就没有人因为得了某种疾病,从此生活习惯和方式永久改变了的吗?
所以,疾病导致生活方式,并非空穴来风。
仔细寻找,我们应该也能找到,因为得了某种肺病,所以嗜好吸烟的人,一定存在。
考虑一下用转移熵 transfer entropy这类的东西看看
说的很好。Well said 我个人观点你说的第二点(时间顺序)其实是最根本的,但是也是最容易被忽略的,而且也经常是故意或者确实说不清的一点。比如这个话题,应该说清楚是,无癌症诊断的人现在吸烟可能会导致未来得肺癌。或者是现在已经有肺癌诊断或者明确的风险的人但还没有开始吸烟,将来会更更喜欢吸烟。这中间还得确定一个比较的人,因为这些论断都是说更加什么的,得有比较才能这么说
也就是说longitudinal analysis 才是因果分析的关键?
现在有一堆统计方法用来检验因果关系的,你去看看各种时序动态模型吧。
可能肺癌细胞形成过程中 特别喜欢尼古丁 所以越抽越厉害 癌细胞越多烟瘾越大 反之如果癌细胞少了 也就不想抽少抽了
一开始发现两件事相关,后面做前瞻性研究可以发现先后关系
一个是 吸烟at time t-1 与癌症at time t 的关系来证明吸烟导致癌症。用时间前后关系证明。 二是用exogenous shock, 比如政府出台政策(比如提高烟草税)影响吸烟率,导致肺癌症率下降或上升。提高烟草税跟癌症没有直接联系,只有通过吸烟来影响。
这个确实是个非常有意思的话题,虽然目前认为量子纠缠不传递能量/物质/信息等实体物质,但确实也实测到了较大颗粒尺度的纠缠现象。考虑到量子纠缠可以穿透时间光锥,隐约觉得概率论如条件概率等等会要被修正或推出新理论。。