大家机器学习中的目标变量都是如何获得的?

m
microsat
楼主 (北美华人网)
以预测学生优秀与否举个例子。 目标变量是学生优秀与否。0是不优秀,1是优秀。这个变量是老师打评的。 预测变量为1)数学期末成绩,2)语文期末成绩, 3)英语期末成绩, 4) 历史期末成绩, 5)地理期末成绩,6)生物期末成绩 这个模型建成后,预测的准确性非常高。所以投稿。 一个reviewer问,老师是如何给学生是否优秀打评的。 我们的答复是,老师主要是根据数学期末成绩,语文期末成绩,和英语期末成绩来打评的。
于是,稿子就被莫名其妙的拒了。 请问这个机器学习的建模过程错在哪儿了呢?
###### 在现实中, 用CT图片来预测病人癌症,这个病人是否是癌症,不也是由医生看CT图片后得出的吗?而反过来,不也是用CT图片来预测这个医生的诊断结论吗?
阿宇
ground truth
M
Melaniejj9991
外行纯粹觉得你这个不是预测,而是determine
H
Hesterhql
不懂。。感觉不用预测 ,期末成绩都出来了。。还用预测么
丫头片子
target能完全由features决定,还要建模做预测干嘛,直接算不就行了?是deterministic的 CT预测癌症,target要看最后是不是真的得癌了,有的时间CT诊断有癌,但其实没有得癌,就是false positive ,反之就是false negative,建模优化的目的是尽量减少false positive和false negative
l
lnghng
对啊,感觉这是判断学生优不优秀的标准。预测应该是其它一些指标,比如出席率,课堂上提问,每天花在学习上的时间,去图书馆的概率,修课数,原来的毕业学校,入学时成绩,课外打不打工,家庭经济状况,住校内还是校外,参加社团情况,等等一大堆参数,然后AI根据这些输入来预测。
d
dpgx
先学统计吧,不然没法说。
h
happymc
你想用什么feature就用什么feature, 并没有对错之分。你悲剧是因为你这模型太简单了吧?顶多就是一个线性回归,投稿毫无意义
w
wilde21
有点貌似手上拿把关刀就在客厅挥舞起来杀敌了
w
wtorchid
抬头看ID,大家不要再浪费自己的时间和善意了
f
facet
不懂。。感觉不用预测 ,期末成绩都出来了。。还用预测么
Hesterhql 发表于 2023-12-22 21:21

美国人刚刚学会“脱了裤子放屁”这个表达法 真要强上机器学习,那就是开学第一个礼拜把学生大头照输到模型里,直接给pass/fail的结果