求教机器学习模型:心电图预测精神状态

m
microsat
楼主 (北美华人网)
今天审一篇稿子。稿子是用心电图预测精神状态。精神状态分为好和糟糕两大类。
作者是这样做的。 首先用心电图来定义精神好和精神糟糕。具体用心电图如何定义,没有详写。
然后用电子仪器,自动读取心电图,然后频域,值域,各提取2个指标,然后加权后得到一个global score。总共5个scores。
最后用这5个scores来预测精神好和精神糟糕。
结论:他们研究出的这个global score和频域值域的4个指标,棒极了。能准确预测一个人的精神状态。
这里,最大的疑惑,就是第一步的精神状态居然也是根据心电图来定义的。训练和预测的时候还是用心电图里的值来做的。 请问有何问题吗?
我提出疑问后。作者回复了。作者说,MRI是不是用来既定义病人的疾病,同时也预测。为何心电图不能既定义,也预测呢? 我一下子蒙了。
请华人的人工智能和机器学习高手帮忙。到底这个稿子有没有问题?能不能通过?
下面还有一个例子。 判断一个人大脑是否有问题。 作者先用前人用的标准问卷问病人,根据答题分值,将病人分为两大类:有问题和无问题。
然后,作者用自己开发出的一套问卷。问病人。得出4个分值。
最后,用这四个分值去训练和预测病人是否有问题和无问题。
结论:他们开发出的这套问卷棒极了。准确预测率很高。
请问这个思路,对于机器学习来说,是可行的吗? 作者开发的这套问卷的题目形式和标准问卷没什么大差别。




w
wfmlover
究竟这个field的门槛有多低 连华人网友都能审稿
B
Banana.Republic
这跟人工智能机器学习有毛关系?你就问他第一步心电图定义精神状态有没有依据,没依据后面都是白扯。
n
novavista
首先用心电图来定义精神好和精神糟糕。 ===== 关键在于这个通过心电图定义精神状态的方法是学界公认的吗?如果给出了合理的引用文献,那就是合理的。如果是作者自己定义的,那就是不合理的。
蓝光加湿器
我现在准备做一个能获得诺贝尔奖的科学研究,就差idea了,请网友们积极献策,我得了奖一定回馈大家
C
Cumberbitch
今天审一篇稿子。稿子是用心电图预测精神状态。精神状态分为好和糟糕两大类。
作者是这样做的。 首先用心电图来定义精神好和精神糟糕。具体用心电图如何定义,没有详写。
然后用电子仪器,自动读取心电图,然后频域,值域,各提取2个指标,然后加权后得到一个global score。总共5个scores。
最后用这5个scores来预测精神好和精神糟糕。
结论:他们研究出的这个global score和频域值域的4个指标,棒极了。能准确预测一个人的精神状态。
这里,最大的疑惑,就是第一步的精神状态居然也是根据心电图来定义的。训练和预测的时候还是用心电图里的值来做的。 请问有何问题吗?
我提出疑问后。作者回复了。作者说,MRI是不是用来既定义病人的疾病,同时也预测。为何心电图不能既定义,也预测呢? 我一下子蒙了。
请华人的人工智能和机器学习高手帮忙。到底这个稿子有没有问题?能不能通过?


microsat 发表于 2022-10-20 11:22


MRI定义疾病是生理性的

楼主别审稿了
浮云淡淡
审稿上华人来问?也太没有职业操守了。 你审不了就告诉editor你审不了.
这个原作者真倒霉,文章还没发表,idea就公布到huaren上了,idea被盗了算谁的
m
microsat
首先用心电图来定义精神好和精神糟糕。 ===== 关键在于这个通过心电图定义精神状态的方法是学界公认的吗?如果给出了合理的引用文献,那就是合理的。如果是作者自己定义的,那就是不合理的。
novavista 发表于 2022-10-20 11:25

谢谢!
很难说是公认还是不公认。但是的确他们引用了几篇文章。文章说心电图可以预测一个人精神状态。
我想问下面这个例子的问题。
一个学生的数学学习好不好,先用普通数学成绩来定义成好和坏两种。
然后,我们用学生的奥数竞赛的成绩,来预测 上面定义的好和坏。
如果机器学习这么做的话,是什么问题?
总觉得很奇怪,但是又说不出来一二。
请指点。
m
microsat
这跟人工智能机器学习有毛关系?你就问他第一步心电图定义精神状态有没有依据,没依据后面都是白扯。
Banana.Republic 发表于 2022-10-20 11:25

很难讲有无依据。作者引用了一些前人的论文。前人的论文的结论是心电图能发现一个人的精神好快。
请问下面操作有意义吗?
先用一个数学公式来定义两种状态。
然后把上面这个数学公式,进行一下转换,比如log transformation,sin, cos 等等。 然后用这个新公式去预测第一步定义的两种状态。
好多机器学习的论文,都是这么做的。这么做可行吗?
n
novavista
回复 8楼microsat的帖子
原文的方法是有问题的。因为target variable不能直接由feature定义。试想,既然作者可以直接根据一些rules,由feature(心电图结果)推导target variable(精神状态),那还要机器学习做什么,直接用那些rules不就完事儿了?再用机器学习预测,岂不是脱裤子放屁 多此一举吗?如果这个精神状态,来自于病人的自述或者医疗记录,那这篇文章还是有意义的。
p
poorms
回复 1楼microsat的帖子
心率跟人的情感有联系。但是如果都是平静状态,心率相差不大,预测心情完全是胡扯。
用EEG,MEG,fMRI,rs-fMRI这些直接测量脑部活动的方法还差不多。
s
seventen
今天审一篇稿子。稿子是用心电图预测精神状态。精神状态分为好和糟糕两大类。
作者是这样做的。 首先用心电图来定义精神好和精神糟糕。具体用心电图如何定义,没有详写。
然后用电子仪器,自动读取心电图,然后频域,值域,各提取2个指标,然后加权后得到一个global score。总共5个scores。
最后用这5个scores来预测精神好和精神糟糕。
结论:他们研究出的这个global score和频域值域的4个指标,棒极了。能准确预测一个人的精神状态。
这里,最大的疑惑,就是第一步的精神状态居然也是根据心电图来定义的。训练和预测的时候还是用心电图里的值来做的。 请问有何问题吗?
我提出疑问后。作者回复了。作者说,MRI是不是用来既定义病人的疾病,同时也预测。为何心电图不能既定义,也预测呢? 我一下子蒙了。
请华人的人工智能和机器学习高手帮忙。到底这个稿子有没有问题?能不能通过?
下面还有一个例子。 判断一个人大脑是否有问题。 作者先用前人用的标准问卷问病人,根据答题分值,将病人分为两大类:有问题和无问题。
然后,作者用自己开发出的一套问卷。问病人。得出4个分值。
最后,用这四个分值去训练和预测病人是否有问题和无问题。
结论:他们开发出的这套问卷棒极了。准确预测率很高。
请问这个思路,对于机器学习来说,是可行的吗? 作者开发的这套问卷的题目形式和标准问卷没什么大差别。





microsat 发表于 2022-10-20 11:22

他这个ground truth的理论依据是什么?如果不充分,后面的全部白做
MRI诊断疾病是通过图像分析,是真能看到组织结构,比如哪里有个肿瘤。心电图是怎么确诊心情的?那不就是一段波动曲线?如果他依赖统计结果,那数据足够多?有统计意义么?三五个病人肯定是不够的,怎么也得有成千上万吧。
m
microsat
回复 1楼microsat的帖子
心率跟人的情感有联系。但是如果都是平静状态,心率相差不大,预测心情完全是胡扯。
用EEG,MEG,fMRI,rs-fMRI这些直接测量脑部活动的方法还差不多。
poorms 发表于 2022-10-20 11:53

是啊。但是很多这方面的已经发表的论文。
另外,还有论文讲的是 电话语音预测人的情感。
就是通过分析你的电话录音,就能分析出你是不是有抑郁症。
l
liubebo
这个方法有问题,作者回复有些胡搅蛮缠。 应该用reference standard 或者golden standard的数据来衡量。 mri能用于预测之前,也得用其他之前的gold standard来验证。
l
liubebo
回复 2楼wfmlover的帖子
华人网友不乏教授博后,为啥不能审稿?
猪舌头
你得问圈内人。好多学术东西,拿出来白话讨论都是胡扯。反正我知道一篇类似文章,发出来就出名了。学术价值一直受争议,但确实是一篇著名paper。拿到版上肯定被高楼拍砖。为什么在学术圈只是争议,拿到huaren上就直接拍呢?因为无知者无畏
果酱罐子
谢谢!
很难说是公认还是不公认。但是的确他们引用了几篇文章。文章说心电图可以预测一个人精神状态。
我想问下面这个例子的问题。
一个学生的数学学习好不好,先用普通数学成绩来定义成好和坏两种。
然后,我们用学生的奥数竞赛的成绩,来预测 上面定义的好和坏。
如果机器学习这么做的话,是什么问题?
总觉得很奇怪,但是又说不出来一二。
请指点。
microsat 发表于 2022-10-20 11:48

这么说吧,普通学生成绩好坏,反映的是对教学大纲内容的掌握,但竞赛内容是超纲的,用超纲的内容来评判学生对大纲的掌握,这位老师的语文一定是体育老师教的。
n
novavista
你得问圈内人。好多学术东西,拿出来白话讨论都是胡扯。反正我知道一篇类似文章,发出来就出名了。学术价值一直受争议,但确实是一篇著名paper。拿到版上肯定被高楼拍砖。为什么在学术圈只是争议,拿到huaren上就直接拍呢?因为无知者无畏
猪舌头 发表于 2022-10-20 11:59

华人版上卧虎藏龙,拿eb1的多了去了,政庇过来的这个帖子的内容都看不懂
浮云淡淡
回复 2楼wfmlover的帖子
华人网友不乏教授博后,为啥不能审稿?
liubebo 发表于 2022-10-20 11:59

文章发表之前内容是保密的,reviewer不能到处distribute,这是最基本的职业操守
东京樱花
今天审一篇稿子。稿子是用心电图预测精神状态。精神状态分为好和糟糕两大类。
作者是这样做的。 首先用心电图来定义精神好和精神糟糕。具体用心电图如何定义,没有详写。
然后用电子仪器,自动读取心电图,然后频域,值域,各提取2个指标,然后加权后得到一个global score。总共5个scores。
最后用这5个scores来预测精神好和精神糟糕。
结论:他们研究出的这个global score和频域值域的4个指标,棒极了。能准确预测一个人的精神状态。
这里,最大的疑惑,就是第一步的精神状态居然也是根据心电图来定义的。训练和预测的时候还是用心电图里的值来做的。 请问有何问题吗?
我提出疑问后。作者回复了。作者说,MRI是不是用来既定义病人的疾病,同时也预测。为何心电图不能既定义,也预测呢? 我一下子蒙了。
请华人的人工智能和机器学习高手帮忙。到底这个稿子有没有问题?能不能通过?
下面还有一个例子。 判断一个人大脑是否有问题。 作者先用前人用的标准问卷问病人,根据答题分值,将病人分为两大类:有问题和无问题。
然后,作者用自己开发出的一套问卷。问病人。得出4个分值。
最后,用这四个分值去训练和预测病人是否有问题和无问题。
结论:他们开发出的这套问卷棒极了。准确预测率很高。
请问这个思路,对于机器学习来说,是可行的吗? 作者开发的这套问卷的题目形式和标准问卷没什么大差别。





microsat 发表于 2022-10-20 11:22

不懂医学,但从machine learning的角度而言有一定可行性,至于模型正确率如何看他怎么建模
p
poorms
不懂医学,但从machine learning的角度而言有一定可行性,至于模型正确率如何看他怎么建模
东京樱花 发表于 2022-10-20 12:03

测的数据里根本没有feature,完全是用overfitting忽悠。
t
ted.hanks
causation vs correlation.
这个心电图是精神状态的信号吗? 不是signal , 在这里耍流氓吗?
s
sonicone
回复 1楼microsat的帖子
他这个逻辑没有问题。比如图像识别,都是基于图像,标注请人工来做,认为这是正确答案,然后训练算法来识别,达到人工的识别率。这里要解决的问题不是寻找新类型的数据,而是基于旧有类型的数据,算法取代人工,降低成本,提高效率。
东京樱花
测的数据里根本没有feature,完全是用overfitting忽悠。
poorms 发表于 2022-10-20 12:06

overfitting是数据cleaning和select没做好啊,胡子眉毛一把抓了,那test的时候偏差度就会很大
m
microsat
你得问圈内人。好多学术东西,拿出来白话讨论都是胡扯。反正我知道一篇类似文章,发出来就出名了。学术价值一直受争议,但确实是一篇著名paper。拿到版上肯定被高楼拍砖。为什么在学术圈只是争议,拿到huaren上就直接拍呢?因为无知者无畏
猪舌头 发表于 2022-10-20 11:59

之所以拿到华人上来讨论,其实,也是因为机器学习,门槛已经非常低了。 初中生都能玩人脸识别。
华人的高手的确很多,不乏李飞飞之流。
下面,我举个困惑我多年的例子。癌症病人的摘除手术术后存活多久的预测。
预测变量为 高和低。高是生存大于5年,低是小于5年。
因为一个病人手术后,能否活过5年,需要至少5年的观察。而作者可能等不了5年,就需要发表这个结果。 所以能否生存大于5年,这个目标变量y,有些论文里面直接是这么写的: 临床医生的预估。
得到这个目标变量y,然后用输入变量x来预测。输入变量x包括mri,其他一些血值,age,gender等等常规变量。
后来,我问了一些临床医生,“你是怎么预测这个病人手术后能活5年与否的呢?” 答复是:“我也是看这些mri,血值等等。”
那么,请问,这样一个机器学习模型,有意义吗? pubmed上几乎有成千上万的这样预测手术后存活的已经发表的论文。nature,science,cell上也有。
请高手不吝赐教。



m
microsat
回复 1楼microsat的帖子
他这个逻辑没有问题。比如图像识别,都是基于图像,标注请人工来做,认为这是正确答案,然后训练算法来识别,达到人工的识别率。这里要解决的问题不是寻找新类型的数据,而是基于旧有类型的数据,算法取代人工,降低成本,提高效率。
sonicone 发表于 2022-10-20 12:13

如果请来的人工,在标注的时候,其实是用某个数学公式来标注呢? 当然,这个数学公式,在论文里并不注明。 只说是,人工标注。
很多医生,都这样。其实有某个数学秘密公式,比如:肿瘤面积大于某个值,就是肿瘤二级,否则是多少多少级。
这样的人工标注公式,或者秘密公式,很难被学术接受。所以干脆都雪藏起来。就说人工标注,医生预估。
比如:一个数据集,几万个病人。医生根本忙不过来。干脆就用简单数学公式进行归类。但是论文里,却不提。只说是专家确定。
m
mrr666
你这supervised learning 总得有标签吧 怎么收集? 你问神经病 1-5 你自己的精神状态 你觉得你收集过来的标签有用?
d
dible
回复 1楼的帖子
没有详写的部分... 问题是 数据可靠度有多高呢? 人工标注可以啊,要提供标注人情况,有几个标注人,agreement怎么样等等
m
microsat
翻阅旧华人贴。居然发现高手们以前讨论过类似话题。华人真是藏着很多李飞飞啊。 请看 https://huaren.us/showtopic.html?forumid=373&topicid=2415463&postid=80414686#80414686
“为什么我觉得身边的data scientist,特别好混啊,面试的时候也不用做题,就说一说什么理论之前的经验,进来就很高的工资,进组这么久了我看不出那人做这么久了有什么进展,但是招他进来的经理对他好和善啊总是很宽容给很多时间给他。那人做预测模型,居然要用今天的数据,和着之前的数据生成坡度什么的参数再预测今天的值,看今天的值是不是异常。。。然后一次讨论里,还说x+y+z+.../c+d+e+... = (x/c + y/d +z/e +....)/n 算下来平均值是一样的,然后问我为什么做下来不一样呢。我都忍不住吐槽,这可是phd啊怎么这么基础的都错了。说实在我觉得这个组前景也不光明,做出的数据分析结果都不可靠,就是抄公式捣鼓捣鼓,搞些图表,特别好混。而我这种写代码的,累死累活的,经理还不满意,让写好多个test case。。。在这种数据组里真挺烦的。” by 猫鸟
m
microsat
究竟这个field的门槛有多低 连华人网友都能审稿
wfmlover 发表于 2022-10-20 11:23

你怎么知道张益唐、李飞飞等不上华人?
还有大家总是嘲笑的千老们。千老虽然苦逼工资低,但水平不见得低啊。
m
microsat
审稿上华人来问?也太没有职业操守了。 你审不了就告诉editor你审不了.
这个原作者真倒霉,文章还没发表,idea就公布到huaren上了,idea被盗了算谁的
浮云淡淡 发表于 2022-10-20 11:28

为了方便华人读者理解问题的本在,所有例子都经过了较大的编改。比如精神正常与否,原论文也许是关于stroke。心电图,原论文可能是细胞流式图。
为什么改,因为方便读者更熟悉更了解,更方便的抓住问题的本在。
c
candy1980
你怎么知道张益唐、李飞飞等不上华人?
还有大家总是嘲笑的千老们。千老虽然苦逼工资低,但水平不见得低啊。
microsat 发表于 2022-10-20 13:04

顶一个。这些年论坛掉进钱眼了。 楼主是不是可以抛开医学内容,单就取值分析来看模型。 面部识别狗狗表情,分析是它要大便小便还是想干点别的
天干勿早
没问题,发吧,不就是一篇文章吗?
m
microsat
顶一个。这些年论坛掉进钱眼了。 楼主是不是可以抛开医学内容,单就取值分析来看模型。 面部识别狗狗表情,分析是它要大便小便还是想干点别的
candy1980 发表于 2022-10-20 13:19

机器学习,通过分析老公面部表情,识别老公是不是在外面有小三?
n
novavista
之所以拿到华人上来讨论,其实,也是因为机器学习,门槛已经非常低了。 初中生都能玩人脸识别。
华人的高手的确很多,不乏李飞飞之流。
下面,我举个困惑我多年的例子。癌症病人的摘除手术术后存活多久的预测。
预测变量为 高和低。高是生存大于5年,低是小于5年。
因为一个病人手术后,能否活过5年,需要至少5年的观察。而作者可能等不了5年,就需要发表这个结果。 所以能否生存大于5年,这个目标变量y,有些论文里面直接是这么写的: 临床医生的预估。
得到这个目标变量y,然后用输入变量x来预测。输入变量x包括mri,其他一些血值,age,gender等等常规变量。
后来,我问了一些临床医生,“你是怎么预测这个病人手术后能活5年与否的呢?” 答复是:“我也是看这些mri,血值等等。”
那么,请问,这样一个机器学习模型,有意义吗? pubmed上几乎有成千上万的这样预测手术后存活的已经发表的论文。nature,science,cell上也有。
请高手不吝赐教。




microsat 发表于 2022-10-20 12:24

有种统计模型叫survival analysis
n
nickbear
这位楼主老上华人问ML问题,我答了两次以后发现连基本概念都没有,于是放弃了,建议上了基础课再来问
m
mrr666
回复 34楼microsat的帖子
这个可以 现在已经有的微表情分析 加上大数据就行了 应用就是 模型判定为yes直接割鸡鸡
m
microsat
这位楼主老上华人问ML问题,我答了两次以后发现连基本概念都没有,于是放弃了,建议上了基础课再来问
nickbear 发表于 2022-10-20 14:06

方便把您回答我的帖子,给个links吗?我好温顾温顾。
翻遍了整个华人网,除了上面您回答我的问题之外,没有发现您的第二个回答。
n
nickbear
方便把您回答我的帖子,给个links吗?我好温顾温顾。
翻遍了整个华人网,除了上面您回答我的问题之外,没有发现您的第二个回答。
microsat 发表于 2022-10-20 14:35

第一帖5楼 https://huaren.us/showtopic.html?topicid=2797805&postid=92825778#92825778 第二贴高亮答案 https://huaren.us/showtopic.html?topicid=2812457&fid=398&page=1 我这人记性还不错,而且不爱说瞎话 基本概念可以上课补,爱说瞎话就不好办了