deepxxx - 2025年1月26日文学峸存档

6 个月

楼主 (文学峸)

其实就是在主流API上加一层shell，附带扩展transformers,达到一个目标，就是适应本地法规。训练方面倾斜考题权重，以期快速提高benchmark得分，好比多做模拟题博高考成绩。短期效果明显，长期效果不大。

说明一下我不是乱说。我的专业就是做算法的，也在主流期刊发表过2个算法；我也教过tofel强化班，出版过培训教材，进来400 至500分的大多人通过强化训练，一般可以提高100分左右。哈哈。

lionhill

6 个月

我咋天贴的这篇文章也不担心. DeepSeek利空算力？

longnv

6 个月

牛帅牛！

peachtree123

6 个月

难怪与党媒高度一致速度又快，原来是抄作业，不用思考。

牛

牛经沧海

6 个月

强调一下以免误会：shell 不是没有价值，强训应付考试也有价值。

灵

灵山问禅

6 个月

你对深度学习不熟悉吧，可以下载的开源如果是套壳一下子就被人发现了。你自己下载一个试试就明白了

牛

牛经沧海

6 个月

我掉队很久了，但我没有说是简单的套壳。谢谢禅师

牛

牛霸

6 个月

又来搜刮智商税？

灵

灵山问禅

6 个月

有论文发表，你可以去看一下。是把工程能力发展到了极致。可能用了别的open source 的fine tune，也不违规

牛

牛霸

6 个月

第一个做成开源的，就是开放了主框架代码，让全球开发员可以修改及添加插件来实现个性化功能定制。既然是第一个，楼上就瞎扯了。

牛

牛霸

6 个月

你再自己读一下自己的贴子多narrow-minded. 从不喜欢评论别的的贴子，实在忍不住了

parentb

6 个月

说到点子上了。大赞！

灵

灵山问禅

6 个月

model的开源一般只有可执行文件，deep seek把训练的源代码也开源了吗？在哪里可以看？

parentb

6 个月

中国肯定不缺天才，DeepSeek公布算法，发表论文，肯定也有它的独到之处。有竞争才有进步！很好啊！

dennis_sy

6 个月

DeepSeek，简称DS

DeepSeek用许多已知的开源工具，做了一个AI，各种参数都优化到最好，甚至比美国大厂的还好。让Altman等Scaling law的忠实信徒，期望靠堆积Nvidia芯片来建立moat的，彻底破防。DeepSeek R1的推出，不仅DS那些花了大价钱的AI大厂（比如Meta)，还顺便鄙视了一下美国政府的AI芯片出口管制政策。

不觉得DeepSeek只是个套壳的API，套壳套不出这么好的AI产品，也套不出这么好的用户体验。就好比说WeChat只是中国版的WhatsApp，阿里只是中国版的Amazon，这种说法，有失偏颇。中国高科技企业在内卷的同时，其创新精神，还是很值得肯定的。个人觉得近十来年做大做强的中国高科技企业，大部分有自己的绝活，并不是纯粹的copy & paste西方同类企业。比如DJI，Unitree， BYD等，就走出了属于自己的成功之路。这类中国企业，只要国际环境不出现剧烈的变化，未来会更多的涌现，因为人才，技术，资金，投资环境和国家政策等，都有利于这类高科技公司在中国的发展。

FollowNature

6 个月

客观的评价。肯定有学习和借鉴，但肯定有发展和新的功能及优化，甚至独创。

BBL123

6 个月

Deep Seek 不可能开源底层．真正开源的是Google的AI Lib

BBL123

6 个月

你不懂電腦软件shell的概念．Deep最多优化了算法不過又一个tiktok

BBL123

6 个月

說的没错

八

八飛

6 个月

赞牛帅！DS是铁掌水上漂裘千丈还是其弟裘千仞，不长时间内会见分晓。从到目前为止的历史事件的概率上讲，是大哥可能性大很多。