不要吵了，看源代码吧 - 2025年1月30日文学峸存档 - 看帖神器

← 下载《看帖神器》官方 iOS App，体验轻松追帖。

5 个月

楼主 (文学峸)

github.xxxcom/deepseek-ai/DeepSeek-V3

Remove xxx,add https

5 个月

那些带涂黑任务的未必有这个文化水平

5 个月

最可笑的是还没有一家美国公司起诉Deepseek剽窃，更不用说证实了

5 个月

但是论坛上有人已经煞有介事的说确实在剽窃

5 个月

吃相难看

5 个月

你不懂LLM。开源是半开源，代码开源，但是数据库（LLM的weight）是不开源的

671GB的LLM weight 只有结果，没有生成过程，他人无法复制产生。就像Windows程序，没有源码，只给你 .exe 执行文件。

5 个月

不是还有论文吗？对照看就知道7，8成了

我帮好几个公司搞过fine tune LLM

5 个月

论文并没有提供说明，训练所用的数据是什么，从哪里来的

一般LLM模型训练，都不会告诉别人所用训练数据是什么，从哪里来的。这包括META开源的Llama模型。

DS的问题是，有人现在怀疑，它不合法用了其它闭源LLM来训练。这个怀疑还有待证实。

如果DS是用META开源的Llama，那完全没有问题。META自己都说过，可以用它的Llama大模型，产生训练数据，训练其它模型。

5 个月

有差不多的open source的，你觉得为什么要费钱费力搞open AI的东西？

5 个月

有点黄，都是xxx

5 个月

花点牛: 你1/28号才注册，没有带任务那么积极发言干嘛?

5 个月

专业