问题在哪儿:机器学习预测fall risk准确率100%

m
microsat
楼主 (北美华人网)
最近,做一个fall risk,结果在测试集合中总是准确率是100%。问题会出在哪儿呢?
一个临床医生根据病人的问卷调查和病人的姿态,定义了fall risk(yes, no)
然后,我用了问卷里面的几个问题 1)以前fall过没有 2)fall导致伤害没有 3)病人的姿态
在样本集合中去学习。
然后再测试集合中去检测。 结果永远都是100%的准确率。
请问如果想做一个fall risk的研究课题。这个fall risk你们怎么去确定呢?有比我更好的方法吗? 另外,我的模型的input variable,有什么问题没有? 有更好的input variables吗?
多谢!

C
Cumberbitch
又是这个楼主 你长年累月挖这种坑不累吗?
单身男
教我怎么做
g
godblessyou
教我怎么做
单身男 发表于 2022-11-07 11:16

模型的variable有 问题, 和靶变量100%相关了,寻找其它variable吧
m
microsat
模型的variable有 问题, 和靶变量100%相关了,寻找其它variable吧
godblessyou 发表于 2022-11-07 11:21

是的。肯定有问题。
但是,如果是你,你怎么做这个fall risk的机器学习呢?
这个fall risk该如何去定量和确定?
m
microsat
模型的variable有 问题, 和靶变量100%相关了,寻找其它variable吧
godblessyou 发表于 2022-11-07 11:21

再举个更好明白的例子。
预测儿童是否生长正常。 儿医用height, weight, age (months), 得出儿童生长正常和不正常。
下面的机器学习模型 也是用height,weight,age(months),来学习和预测儿童生长的正常和不正常。
请问,这样的机器学习模型有什么问题。
如果是各位高手来做这个预测儿童是否生长正常,该如何获得这个target variable(儿童正常与否)? 和确定input variables(也称predictors)
多谢!
g
godblessyou
再举个更好明白的例子。
预测儿童是否生长正常。 儿医用height, weight, age (months), 得出儿童生长正常和不正常。
下面的机器学习模型 也是用height,weight,age(months),来学习和预测儿童生长的正常和不正常。
请问,这样的机器学习模型有什么问题。
如果是各位高手来做这个预测儿童是否生长正常,该如何获得这个target variable(儿童正常与否)? 和确定input variables(也称predictors)
多谢!
microsat 发表于 2022-11-07 11:30

首先确定正常和不正常,然后用你的变量eight,weight,age(months)做预测,利用ROC曲线找到threshold,再搭建模型
m
microsat
首先确定正常和不正常,然后用你的变量eight,weight,age(months)做预测,利用ROC曲线找到threshold,再搭建模型
godblessyou 发表于 2022-11-07 11:37

如果这个正常和不正常,其实就是某个儿医 根据height,weight,age(montsh)来确定的呢?
这样的机器模型,是不是就没有任何意义?
可以估计,这个模型的准确率会相当的高。
g
godblessyou
当然是金标准,某儿医算个屁