大模型的数据如何前期处理?

m
microsat
楼主 (北美华人网)
有没有大牛说说,如何前期预处理大模型用的数据?
大模型用的数据都是什么格式的?如何预处理? predictors是什么? outcome variable又是什么?
大模型是类似deep learning那样的黑盒子吗? 大模型的输入变量,输出变量都是什么?
H
High.eee
不同模型需要的数据格式不一样啊,读模式的说明,然后自己写程序处理数据。有些模式也附带有处理数据的code。 每个专业都有大模式的,同一专业的大模式也各不相投,不能这么泛泛的问。
n
nickbear
你的问题网上相关blog和video很多,甚至如何从头开始搭建一个大模型的教程都有 你不如花点时间自己研究一下,有了基本概念以后再问问题比较好