机器学习的data leaking举例

m
microsat
楼主 (北美华人网)
请大牛们举几个机器学习的data leaking例子,并说明为啥这是data leaking。
我举个例子,大牛帮忙看看是不是data leaking。
一个班级学生期末考试,语文成绩,数学成绩,英语成绩,班主任老师,根据这三个成绩给学生评定为合格不合格。班主任老师用的规则是平均成绩超过60,就合格;否则不合格。(这个规则只有班主任老师知道,研究机器学习的科研工作者不知道)
下面用机器学习老预测学生合格与否。输入变量为这3科成绩,输出结果为合格不合格。 最后发现机器学习的准确率100%。 这个是data leaking吗?这样的机器学习模型有意义吗?有错误吗?