不要吵了,看源代码吧

灵山问禅
楼主 (文学城)

github.xxxcom/deepseek-ai/DeepSeek-V3

Remove xxx,add https

 

花点牛牛
那些带涂黑任务的未必有这个文化水平
花点牛牛
最可笑的是还没有一家美国公司起诉Deepseek剽窃,更不用说证实了
花点牛牛
但是论坛上有人已经煞有介事的说确实在剽窃
花点牛牛
吃相难看
未知
你不懂LLM。开源是半开源,代码开源,但是数据库(LLM的weight)是不开源的

671GB的LLM weight 只有结果,没有生成过程, 他人无法复制产生。就像Windows程序,没有源码,只给你 .exe 执行文件。

灵山问禅
不是还有论文吗?对照看就知道7,8成了

我帮好几个公司搞过fine tune LLM

未知
论文并没有提供说明,训练所用的数据是什么,从哪里来的

一般LLM模型训练,都不会告诉别人所用训练数据是什么,从哪里来的。这包括META开源的Llama模型。

DS的问题是,有人现在怀疑,它不合法用了其它闭源LLM来训练。这个怀疑还有待证实。

如果DS是用META开源的Llama,那完全没有问题。META自己都说过,可以用它的Llama大模型,产生训练数据,训练其它模型。

灵山问禅
有差不多的open source的,你觉得为什么要费钱费力搞open AI的东西?
s
slow_quick
有点黄,都是xxx
W
Wendy666
花点牛: 你1/28号才注册, 没有带任务那么积极发言干嘛?
简单好
专业