看帖神器
未名空间
追帖动态
头条新闻
每日新帖
最新热帖
新闻存档
热帖存档
文学城
虎扑论坛
未名空间
北美华人网
北美微论坛
看帖神器
登录
← 下载
《看帖神器》官方
iOS App
,体验轻松追帖。
training dataset和unbalanced dataset的设计
查看未名空间今日新帖
最新回复:2019年11月22日 11点56分 PT
共 (1) 楼
返回列表
订阅追帖
只看未读
更多选项
阅读全帖
只看图片
只看视频
查看原帖
g
genetics123
接近 5 年
楼主 (未名空间)
各位大神,有没有这方面的经验:
实际项目中,数据库的postive/negative data points是极度unbalanced的。比如
crime database里面有1million individual,crime有100(positive data point),剩下的全部是negative data point。
需要用这些数据建立一个machine learning model来classify将来一些人的crime。
怎样设计training dataset呢?有什么好的统计或者ML的方法吗?
谢谢。
请输入帖子链接
收藏帖子
各位大神,有没有这方面的经验:
实际项目中,数据库的postive/negative data points是极度unbalanced的。比如
crime database里面有1million individual,crime有100(positive data point),剩下的全部是negative data point。
需要用这些数据建立一个machine learning model来classify将来一些人的crime。
怎样设计training dataset呢?有什么好的统计或者ML的方法吗?
谢谢。