看帖神器
北美华人网
追帖动态
头条新闻
每日新帖
最新热帖
新闻存档
热帖存档
文学城
虎扑论坛
未名空间
北美华人网
北美微论坛
看帖神器
登录
← 下载
《看帖神器》官方
iOS App
,体验轻松追帖。
机器学习的data leaking举例
查看北美华人网今日新帖
最新回复:2024年6月2日 11点1分 PT
共 (1) 楼
返回列表
订阅追帖
只看未读
更多选项
阅读全帖
只看图片
只看视频
查看原帖
m
microsat
5 个月
楼主 (北美华人网)
请大牛们举几个机器学习的data leaking例子,并说明为啥这是data leaking。
我举个例子,大牛帮忙看看是不是data leaking。
一个班级学生期末考试,语文成绩,数学成绩,英语成绩,班主任老师,根据这三个成绩给学生评定为合格不合格。班主任老师用的规则是平均成绩超过60,就合格;否则不合格。(这个规则只有班主任老师知道,研究机器学习的科研工作者不知道)
下面用机器学习老预测学生合格与否。输入变量为这3科成绩,输出结果为合格不合格。 最后发现机器学习的准确率100%。 这个是data leaking吗?这样的机器学习模型有意义吗?有错误吗?
请输入帖子链接
收藏帖子
我举个例子,大牛帮忙看看是不是data leaking。
一个班级学生期末考试,语文成绩,数学成绩,英语成绩,班主任老师,根据这三个成绩给学生评定为合格不合格。班主任老师用的规则是平均成绩超过60,就合格;否则不合格。(这个规则只有班主任老师知道,研究机器学习的科研工作者不知道)
下面用机器学习老预测学生合格与否。输入变量为这3科成绩,输出结果为合格不合格。 最后发现机器学习的准确率100%。 这个是data leaking吗?这样的机器学习模型有意义吗?有错误吗?