求教机器学习模型：心电图预测精神状态

2 年多

楼主 (北美华人网)

今天审一篇稿子。稿子是用心电图预测精神状态。精神状态分为好和糟糕两大类。
作者是这样做的。首先用心电图来定义精神好和精神糟糕。具体用心电图如何定义，没有详写。
然后用电子仪器，自动读取心电图，然后频域，值域，各提取2个指标，然后加权后得到一个global score。总共5个scores。
最后用这5个scores来预测精神好和精神糟糕。
结论：他们研究出的这个global score和频域值域的4个指标，棒极了。能准确预测一个人的精神状态。
这里，最大的疑惑，就是第一步的精神状态居然也是根据心电图来定义的。训练和预测的时候还是用心电图里的值来做的。请问有何问题吗？
我提出疑问后。作者回复了。作者说，MRI是不是用来既定义病人的疾病，同时也预测。为何心电图不能既定义，也预测呢？我一下子蒙了。
请华人的人工智能和机器学习高手帮忙。到底这个稿子有没有问题？能不能通过？
下面还有一个例子。判断一个人大脑是否有问题。作者先用前人用的标准问卷问病人，根据答题分值，将病人分为两大类：有问题和无问题。
然后，作者用自己开发出的一套问卷。问病人。得出4个分值。
最后，用这四个分值去训练和预测病人是否有问题和无问题。
结论：他们开发出的这套问卷棒极了。准确预测率很高。
请问这个思路，对于机器学习来说，是可行的吗？作者开发的这套问卷的题目形式和标准问卷没什么大差别。

wfmlover

2 年多

究竟这个field的门槛有多低连华人网友都能审稿

Banana.Republic

2 年多

这跟人工智能机器学习有毛关系？你就问他第一步心电图定义精神状态有没有依据，没依据后面都是白扯。

novavista

2 年多

首先用心电图来定义精神好和精神糟糕。 ===== 关键在于这个通过心电图定义精神状态的方法是学界公认的吗？如果给出了合理的引用文献，那就是合理的。如果是作者自己定义的，那就是不合理的。

蓝

蓝光加湿器

2 年多

我现在准备做一个能获得诺贝尔奖的科学研究，就差idea了，请网友们积极献策，我得了奖一定回馈大家

Cumberbitch

2 年多

今天审一篇稿子。稿子是用心电图预测精神状态。精神状态分为好和糟糕两大类。
作者是这样做的。首先用心电图来定义精神好和精神糟糕。具体用心电图如何定义，没有详写。
然后用电子仪器，自动读取心电图，然后频域，值域，各提取2个指标，然后加权后得到一个global score。总共5个scores。
最后用这5个scores来预测精神好和精神糟糕。
结论：他们研究出的这个global score和频域值域的4个指标，棒极了。能准确预测一个人的精神状态。
这里，最大的疑惑，就是第一步的精神状态居然也是根据心电图来定义的。训练和预测的时候还是用心电图里的值来做的。请问有何问题吗？
我提出疑问后。作者回复了。作者说，MRI是不是用来既定义病人的疾病，同时也预测。为何心电图不能既定义，也预测呢？我一下子蒙了。
请华人的人工智能和机器学习高手帮忙。到底这个稿子有没有问题？能不能通过？

microsat 发表于 2022-10-20 11:22

MRI定义疾病是生理性的

楼主别审稿了

浮

浮云淡淡

2 年多

审稿上华人来问？也太没有职业操守了。你审不了就告诉editor你审不了.
这个原作者真倒霉，文章还没发表，idea就公布到huaren上了，idea被盗了算谁的

microsat

2 年多

首先用心电图来定义精神好和精神糟糕。 ===== 关键在于这个通过心电图定义精神状态的方法是学界公认的吗？如果给出了合理的引用文献，那就是合理的。如果是作者自己定义的，那就是不合理的。
novavista 发表于 2022-10-20 11:25

谢谢！
很难说是公认还是不公认。但是的确他们引用了几篇文章。文章说心电图可以预测一个人精神状态。
我想问下面这个例子的问题。
一个学生的数学学习好不好，先用普通数学成绩来定义成好和坏两种。
然后，我们用学生的奥数竞赛的成绩，来预测上面定义的好和坏。
如果机器学习这么做的话，是什么问题？
总觉得很奇怪，但是又说不出来一二。
请指点。

microsat

2 年多

这跟人工智能机器学习有毛关系？你就问他第一步心电图定义精神状态有没有依据，没依据后面都是白扯。
Banana.Republic 发表于 2022-10-20 11:25

很难讲有无依据。作者引用了一些前人的论文。前人的论文的结论是心电图能发现一个人的精神好快。
请问下面操作有意义吗？
先用一个数学公式来定义两种状态。
然后把上面这个数学公式，进行一下转换，比如log transformation，sin， cos 等等。然后用这个新公式去预测第一步定义的两种状态。
好多机器学习的论文，都是这么做的。这么做可行吗？

novavista

2 年多

回复 8楼microsat的帖子
原文的方法是有问题的。因为target variable不能直接由feature定义。试想，既然作者可以直接根据一些rules，由feature（心电图结果）推导target variable（精神状态），那还要机器学习做什么，直接用那些rules不就完事儿了？再用机器学习预测，岂不是脱裤子放屁多此一举吗？如果这个精神状态，来自于病人的自述或者医疗记录，那这篇文章还是有意义的。

poorms

2 年多

回复 1楼microsat的帖子
心率跟人的情感有联系。但是如果都是平静状态，心率相差不大，预测心情完全是胡扯。
用EEG，MEG，fMRI，rs-fMRI这些直接测量脑部活动的方法还差不多。

seventen

2 年多

今天审一篇稿子。稿子是用心电图预测精神状态。精神状态分为好和糟糕两大类。
作者是这样做的。首先用心电图来定义精神好和精神糟糕。具体用心电图如何定义，没有详写。
然后用电子仪器，自动读取心电图，然后频域，值域，各提取2个指标，然后加权后得到一个global score。总共5个scores。
最后用这5个scores来预测精神好和精神糟糕。
结论：他们研究出的这个global score和频域值域的4个指标，棒极了。能准确预测一个人的精神状态。
这里，最大的疑惑，就是第一步的精神状态居然也是根据心电图来定义的。训练和预测的时候还是用心电图里的值来做的。请问有何问题吗？
我提出疑问后。作者回复了。作者说，MRI是不是用来既定义病人的疾病，同时也预测。为何心电图不能既定义，也预测呢？我一下子蒙了。
请华人的人工智能和机器学习高手帮忙。到底这个稿子有没有问题？能不能通过？
下面还有一个例子。判断一个人大脑是否有问题。作者先用前人用的标准问卷问病人，根据答题分值，将病人分为两大类：有问题和无问题。
然后，作者用自己开发出的一套问卷。问病人。得出4个分值。
最后，用这四个分值去训练和预测病人是否有问题和无问题。
结论：他们开发出的这套问卷棒极了。准确预测率很高。
请问这个思路，对于机器学习来说，是可行的吗？作者开发的这套问卷的题目形式和标准问卷没什么大差别。

microsat 发表于 2022-10-20 11:22

他这个ground truth的理论依据是什么？如果不充分，后面的全部白做
MRI诊断疾病是通过图像分析，是真能看到组织结构，比如哪里有个肿瘤。心电图是怎么确诊心情的？那不就是一段波动曲线？如果他依赖统计结果，那数据足够多？有统计意义么？三五个病人肯定是不够的，怎么也得有成千上万吧。

microsat

2 年多

回复 1楼microsat的帖子
心率跟人的情感有联系。但是如果都是平静状态，心率相差不大，预测心情完全是胡扯。
用EEG，MEG，fMRI，rs-fMRI这些直接测量脑部活动的方法还差不多。
poorms 发表于 2022-10-20 11:53

是啊。但是很多这方面的已经发表的论文。
另外，还有论文讲的是电话语音预测人的情感。
就是通过分析你的电话录音，就能分析出你是不是有抑郁症。

liubebo

2 年多

这个方法有问题，作者回复有些胡搅蛮缠。应该用reference standard 或者golden standard的数据来衡量。 mri能用于预测之前，也得用其他之前的gold standard来验证。

liubebo

2 年多

回复 2楼wfmlover的帖子
华人网友不乏教授博后，为啥不能审稿？

猪

猪舌头

2 年多

你得问圈内人。好多学术东西，拿出来白话讨论都是胡扯。反正我知道一篇类似文章，发出来就出名了。学术价值一直受争议，但确实是一篇著名paper。拿到版上肯定被高楼拍砖。为什么在学术圈只是争议，拿到huaren上就直接拍呢？因为无知者无畏

果

果酱罐子

2 年多

谢谢！
很难说是公认还是不公认。但是的确他们引用了几篇文章。文章说心电图可以预测一个人精神状态。
我想问下面这个例子的问题。
一个学生的数学学习好不好，先用普通数学成绩来定义成好和坏两种。
然后，我们用学生的奥数竞赛的成绩，来预测上面定义的好和坏。
如果机器学习这么做的话，是什么问题？
总觉得很奇怪，但是又说不出来一二。
请指点。
microsat 发表于 2022-10-20 11:48

这么说吧，普通学生成绩好坏，反映的是对教学大纲内容的掌握，但竞赛内容是超纲的，用超纲的内容来评判学生对大纲的掌握，这位老师的语文一定是体育老师教的。

novavista

2 年多

你得问圈内人。好多学术东西，拿出来白话讨论都是胡扯。反正我知道一篇类似文章，发出来就出名了。学术价值一直受争议，但确实是一篇著名paper。拿到版上肯定被高楼拍砖。为什么在学术圈只是争议，拿到huaren上就直接拍呢？因为无知者无畏
猪舌头发表于 2022-10-20 11:59

华人版上卧虎藏龙，拿eb1的多了去了，政庇过来的这个帖子的内容都看不懂

浮

浮云淡淡

2 年多

回复 2楼wfmlover的帖子
华人网友不乏教授博后，为啥不能审稿？
liubebo 发表于 2022-10-20 11:59

文章发表之前内容是保密的，reviewer不能到处distribute，这是最基本的职业操守

东

东京樱花

2 年多

今天审一篇稿子。稿子是用心电图预测精神状态。精神状态分为好和糟糕两大类。
作者是这样做的。首先用心电图来定义精神好和精神糟糕。具体用心电图如何定义，没有详写。
然后用电子仪器，自动读取心电图，然后频域，值域，各提取2个指标，然后加权后得到一个global score。总共5个scores。
最后用这5个scores来预测精神好和精神糟糕。
结论：他们研究出的这个global score和频域值域的4个指标，棒极了。能准确预测一个人的精神状态。
这里，最大的疑惑，就是第一步的精神状态居然也是根据心电图来定义的。训练和预测的时候还是用心电图里的值来做的。请问有何问题吗？
我提出疑问后。作者回复了。作者说，MRI是不是用来既定义病人的疾病，同时也预测。为何心电图不能既定义，也预测呢？我一下子蒙了。
请华人的人工智能和机器学习高手帮忙。到底这个稿子有没有问题？能不能通过？
下面还有一个例子。判断一个人大脑是否有问题。作者先用前人用的标准问卷问病人，根据答题分值，将病人分为两大类：有问题和无问题。
然后，作者用自己开发出的一套问卷。问病人。得出4个分值。
最后，用这四个分值去训练和预测病人是否有问题和无问题。
结论：他们开发出的这套问卷棒极了。准确预测率很高。
请问这个思路，对于机器学习来说，是可行的吗？作者开发的这套问卷的题目形式和标准问卷没什么大差别。

microsat 发表于 2022-10-20 11:22

不懂医学，但从machine learning的角度而言有一定可行性，至于模型正确率如何看他怎么建模

poorms

2 年多

不懂医学，但从machine learning的角度而言有一定可行性，至于模型正确率如何看他怎么建模
东京樱花发表于 2022-10-20 12:03

测的数据里根本没有feature，完全是用overfitting忽悠。

ted.hanks

2 年多

causation vs correlation.
这个心电图是精神状态的信号吗？不是signal ，在这里耍流氓吗？

sonicone

2 年多

回复 1楼microsat的帖子
他这个逻辑没有问题。比如图像识别，都是基于图像，标注请人工来做，认为这是正确答案，然后训练算法来识别，达到人工的识别率。这里要解决的问题不是寻找新类型的数据，而是基于旧有类型的数据，算法取代人工，降低成本，提高效率。

东

东京樱花

2 年多

测的数据里根本没有feature，完全是用overfitting忽悠。
poorms 发表于 2022-10-20 12:06

overfitting是数据cleaning和select没做好啊，胡子眉毛一把抓了，那test的时候偏差度就会很大

microsat

2 年多

你得问圈内人。好多学术东西，拿出来白话讨论都是胡扯。反正我知道一篇类似文章，发出来就出名了。学术价值一直受争议，但确实是一篇著名paper。拿到版上肯定被高楼拍砖。为什么在学术圈只是争议，拿到huaren上就直接拍呢？因为无知者无畏
猪舌头发表于 2022-10-20 11:59

之所以拿到华人上来讨论，其实，也是因为机器学习，门槛已经非常低了。初中生都能玩人脸识别。
华人的高手的确很多，不乏李飞飞之流。
下面，我举个困惑我多年的例子。癌症病人的摘除手术术后存活多久的预测。
预测变量为高和低。高是生存大于5年，低是小于5年。
因为一个病人手术后，能否活过5年，需要至少5年的观察。而作者可能等不了5年，就需要发表这个结果。所以能否生存大于5年，这个目标变量y，有些论文里面直接是这么写的：临床医生的预估。
得到这个目标变量y，然后用输入变量x来预测。输入变量x包括mri，其他一些血值，age，gender等等常规变量。
后来，我问了一些临床医生，“你是怎么预测这个病人手术后能活5年与否的呢？” 答复是：“我也是看这些mri，血值等等。”
那么，请问，这样一个机器学习模型，有意义吗？ pubmed上几乎有成千上万的这样预测手术后存活的已经发表的论文。nature，science，cell上也有。
请高手不吝赐教。

microsat

2 年多

回复 1楼microsat的帖子
他这个逻辑没有问题。比如图像识别，都是基于图像，标注请人工来做，认为这是正确答案，然后训练算法来识别，达到人工的识别率。这里要解决的问题不是寻找新类型的数据，而是基于旧有类型的数据，算法取代人工，降低成本，提高效率。
sonicone 发表于 2022-10-20 12:13

如果请来的人工，在标注的时候，其实是用某个数学公式来标注呢？当然，这个数学公式，在论文里并不注明。只说是，人工标注。
很多医生，都这样。其实有某个数学秘密公式，比如：肿瘤面积大于某个值，就是肿瘤二级，否则是多少多少级。
这样的人工标注公式，或者秘密公式，很难被学术接受。所以干脆都雪藏起来。就说人工标注，医生预估。
比如：一个数据集，几万个病人。医生根本忙不过来。干脆就用简单数学公式进行归类。但是论文里，却不提。只说是专家确定。

mrr666

2 年多

你这supervised learning 总得有标签吧怎么收集？你问神经病 1-5 你自己的精神状态你觉得你收集过来的标签有用？

dible

2 年多

回复 1楼的帖子
没有详写的部分... 问题是数据可靠度有多高呢？人工标注可以啊，要提供标注人情况，有几个标注人，agreement怎么样等等

microsat

2 年多

翻阅旧华人贴。居然发现高手们以前讨论过类似话题。华人真是藏着很多李飞飞啊。请看 https://huaren.us/showtopic.html?forumid=373&topicid=2415463&postid=80414686#80414686
“为什么我觉得身边的data scientist，特别好混啊，面试的时候也不用做题，就说一说什么理论之前的经验，进来就很高的工资，进组这么久了我看不出那人做这么久了有什么进展，但是招他进来的经理对他好和善啊总是很宽容给很多时间给他。那人做预测模型，居然要用今天的数据，和着之前的数据生成坡度什么的参数再预测今天的值，看今天的值是不是异常。。。然后一次讨论里，还说x+y+z+.../c+d+e+... = (x/c + y/d +z/e +....)/n 算下来平均值是一样的，然后问我为什么做下来不一样呢。我都忍不住吐槽，这可是phd啊怎么这么基础的都错了。说实在我觉得这个组前景也不光明，做出的数据分析结果都不可靠，就是抄公式捣鼓捣鼓，搞些图表，特别好混。而我这种写代码的，累死累活的，经理还不满意，让写好多个test case。。。在这种数据组里真挺烦的。” by 猫鸟

microsat

2 年多

究竟这个field的门槛有多低连华人网友都能审稿
wfmlover 发表于 2022-10-20 11:23

你怎么知道张益唐、李飞飞等不上华人？
还有大家总是嘲笑的千老们。千老虽然苦逼工资低，但水平不见得低啊。

microsat

2 年多

审稿上华人来问？也太没有职业操守了。你审不了就告诉editor你审不了.
这个原作者真倒霉，文章还没发表，idea就公布到huaren上了，idea被盗了算谁的
浮云淡淡发表于 2022-10-20 11:28

为了方便华人读者理解问题的本在，所有例子都经过了较大的编改。比如精神正常与否，原论文也许是关于stroke。心电图，原论文可能是细胞流式图。
为什么改，因为方便读者更熟悉更了解，更方便的抓住问题的本在。

candy1980

2 年多

你怎么知道张益唐、李飞飞等不上华人？
还有大家总是嘲笑的千老们。千老虽然苦逼工资低，但水平不见得低啊。
microsat 发表于 2022-10-20 13:04

顶一个。这些年论坛掉进钱眼了。楼主是不是可以抛开医学内容，单就取值分析来看模型。面部识别狗狗表情，分析是它要大便小便还是想干点别的

天

天干勿早

2 年多

没问题，发吧，不就是一篇文章吗？

microsat

2 年多

顶一个。这些年论坛掉进钱眼了。楼主是不是可以抛开医学内容，单就取值分析来看模型。面部识别狗狗表情，分析是它要大便小便还是想干点别的
candy1980 发表于 2022-10-20 13:19

机器学习，通过分析老公面部表情，识别老公是不是在外面有小三？

novavista

2 年多

之所以拿到华人上来讨论，其实，也是因为机器学习，门槛已经非常低了。初中生都能玩人脸识别。
华人的高手的确很多，不乏李飞飞之流。
下面，我举个困惑我多年的例子。癌症病人的摘除手术术后存活多久的预测。
预测变量为高和低。高是生存大于5年，低是小于5年。
因为一个病人手术后，能否活过5年，需要至少5年的观察。而作者可能等不了5年，就需要发表这个结果。所以能否生存大于5年，这个目标变量y，有些论文里面直接是这么写的：临床医生的预估。
得到这个目标变量y，然后用输入变量x来预测。输入变量x包括mri，其他一些血值，age，gender等等常规变量。
后来，我问了一些临床医生，“你是怎么预测这个病人手术后能活5年与否的呢？” 答复是：“我也是看这些mri，血值等等。”
那么，请问，这样一个机器学习模型，有意义吗？ pubmed上几乎有成千上万的这样预测手术后存活的已经发表的论文。nature，science，cell上也有。
请高手不吝赐教。

microsat 发表于 2022-10-20 12:24

有种统计模型叫survival analysis

nickbear

2 年多

这位楼主老上华人问ML问题，我答了两次以后发现连基本概念都没有，于是放弃了，建议上了基础课再来问

mrr666

2 年多

回复 34楼microsat的帖子
这个可以现在已经有的微表情分析加上大数据就行了应用就是模型判定为yes直接割鸡鸡

microsat

2 年多

这位楼主老上华人问ML问题，我答了两次以后发现连基本概念都没有，于是放弃了，建议上了基础课再来问
nickbear 发表于 2022-10-20 14:06

方便把您回答我的帖子，给个links吗？我好温顾温顾。
翻遍了整个华人网，除了上面您回答我的问题之外，没有发现您的第二个回答。

nickbear

2 年多

方便把您回答我的帖子，给个links吗？我好温顾温顾。
翻遍了整个华人网，除了上面您回答我的问题之外，没有发现您的第二个回答。
microsat 发表于 2022-10-20 14:35

第一帖5楼 https://huaren.us/showtopic.html?topicid=2797805&postid=92825778#92825778 第二贴高亮答案 https://huaren.us/showtopic.html?topicid=2812457&fid=398&page=1 我这人记性还不错，而且不爱说瞎话基本概念可以上课补，爱说瞎话就不好办了