miked 发表于 2025-05-15 10:05 人工智能异常火爆。人工智能是基于统计数据分析的。 人们常说,“拿数据说话”,仿佛,一切基于数据的统计分析结果都可信赖。 但是,统计本身却有很多局限性,甚至其结果都是错误的(我们先不讨论数据存在bias,我们假设数据都是绝对可靠的)。但是人们还是拿着错误的分析结果到处发表高水平(nature和science)的论文。 请大家举例来分析一下,为什么统计本身有局限性?为何人工智能藏着猫腻? 我先举个例子。 SNP的mediation分析。 X->M->Y 这里X是基因A的表达, M是SNP, Y是另一个基因B的表达 也就是SNP能参与基因A对基因B的表达的调控。 基因A和B的表达来自同一RNA-sequencing。 SNP来自另一个GWAS实验。GWAS实验和RNA-sequencing是同时进行的。 请问这种实验用mediation分析得出的结果可靠吗?其弊端在哪儿?
但是,统计本身却有很多局限性,甚至其结果都是错误的(我们先不讨论数据存在bias,我们假设数据都是绝对可靠的)。但是人们还是拿着错误的分析结果到处发表高水平(nature和science)的论文。
请大家举例来分析一下,为什么统计本身有局限性?为何人工智能藏着猫腻?
我先举个例子。
SNP的mediation分析。
X->M->Y
这里X是基因A的表达, M是SNP, Y是另一个基因B的表达
也就是SNP能参与基因A对基因B的表达的调控。
基因A和B的表达来自同一RNA-sequencing。 SNP来自另一个GWAS实验。GWAS实验和RNA-sequencing是同时进行的。
请问这种实验用mediation分析得出的结果可靠吗?其弊端在哪儿?
其实数据分析必须以实际应用为基础,数据前期不是考察数据的统计,而是考试数据是否可靠,是不是在所在领域有实际意义,数据测量和收集是否准确。。。。。
专家肉眼看不到的意义通常统计出意义也没用。 这就是为啥,任何数据到我手里,我都先目测。
说句不好听的,统计理论指导下的数据分析就是“算命”, 而且你想要啥结论就可以得到啥结论。
再有就是数据分析人员应该是本领域的专家或closely work with 本领域专家才行。
有些搞数据分析的人太绝对了。