3.3 fold cross-validation

g
gooog
楼主 (北美华人网)
请问大家有何高招能否实现3.3 fold cross-validation吗?
最好能遍历所有样本。保证30%是testing,70%是training。 谢谢
玉骨遥
你觉得大妈们知道啥叫 3.3 fold 吗? 你想问怎么煎个千层饼那还差不多。
玉骨遥
你的样本数足够大,随便你怎么捏都是对的
g
gooog
你觉得大妈们知道啥叫 3.3 fold 吗? 你想问怎么煎个千层饼那还差不多。
玉骨遥 发表于 2023-02-10 00:19

30%是testing,70%是training
S
Stella
你要是30/70 split 可以多run几遍取个平均值. 或者加个validation set. 跟k-fold不是一回事吧
g
gooog
你要是30/70 split 可以多run几遍取个平均值. 或者加个validation set. 跟k-fold不是一回事吧
Stella 发表于 2023-02-10 00:46

假设样本总数为100. 每次取33个。那么取3次,不能遍历。
取4次,为132个。怎么保证这132个涵盖了样本的100个呢?
c
carolena
像5楼mm说的,这样取和k-fold不是一回事。 k-fold要把dataset分成k个set,轮流做testing dataset. random取数据的话,这样跟random forest类似,每次randomly取training dataset,不能保证cover 所有。随着tree数量增加,可以看作cover entire dataset