github.xxxcom/deepseek-ai/DeepSeek-V3
Remove xxx,add https
671GB的LLM weight 只有结果,没有生成过程, 他人无法复制产生。就像Windows程序,没有源码,只给你 .exe 执行文件。
我帮好几个公司搞过fine tune LLM
一般LLM模型训练,都不会告诉别人所用训练数据是什么,从哪里来的。这包括META开源的Llama模型。
DS的问题是,有人现在怀疑,它不合法用了其它闭源LLM来训练。这个怀疑还有待证实。
如果DS是用META开源的Llama,那完全没有问题。META自己都说过,可以用它的Llama大模型,产生训练数据,训练其它模型。
github.xxxcom/deepseek-ai/DeepSeek-V3
Remove xxx,add https
671GB的LLM weight 只有结果,没有生成过程, 他人无法复制产生。就像Windows程序,没有源码,只给你 .exe 执行文件。
我帮好几个公司搞过fine tune LLM
一般LLM模型训练,都不会告诉别人所用训练数据是什么,从哪里来的。这包括META开源的Llama模型。
DS的问题是,有人现在怀疑,它不合法用了其它闭源LLM来训练。这个怀疑还有待证实。
如果DS是用META开源的Llama,那完全没有问题。META自己都说过,可以用它的Llama大模型,产生训练数据,训练其它模型。