deepxxx

牛经沧海
楼主 (文学城)

其实就是在主流API上加一层shell,附带扩展transformers,达到一个目标,就是适应本地法规。训练方面倾斜考题权重,以期快速提高benchmark得分,好比多做模拟题博高考成绩。短期效果明显,长期效果不大。

说明一下我不是乱说。我的专业就是做算法的,也在主流期刊发表过2个算法;我也教过tofel强化班,出版过培训教材,进来400 至500分的大多人通过强化训练,一般可以提高100分左右。哈哈。

 

l
lionhill
我咋天贴的这篇文章也不担心. DeepSeek利空算力?
l
longnv
牛帅牛!
p
peachtree123
难怪与党媒高度一致速度又快,原来是抄作业,不用思考。
牛经沧海
强调一下以免误会:shell 不是没有价值,强训应付考试也有价值。
灵山问禅
你对深度学习不熟悉吧,可以下载的开源如果是套壳一下子就被人发现了。你自己下载一个试试就明白了
牛经沧海
我掉队很久了,但我没有说是简单的套壳。谢谢禅师
牛霸
又来搜刮智商税?
灵山问禅
有论文发表,你可以去看一下。是把工程能力发展到了极致。可能用了别的open source 的fine tune,也不违规
牛霸
第一个做成开源的,就是开放了主框架代码,让全球开发员可以修改及添加插件来实现个性化功能定制。既然是第一个,楼上就瞎扯了。
牛霸
你再自己读一下自己的贴子多narrow-minded. 从不喜欢评论别的的贴子,实在忍不住了
p
parentb
说到点子上了。大赞!
灵山问禅
model的开源一般只有可执行文件,deep seek把训练的源代码也开源了吗? 在哪里可以看?
p
parentb
中国肯定不缺天才,DeepSeek公布算法,发表论文,肯定也有它的独到之处。有竞争才有进步!很好啊!
d
dennis_sy
DeepSeek,简称DS

DeepSeek用许多已知的开源工具,做了一个AI,各种参数都优化到最好,甚至比美国大厂的还好。让Altman等Scaling law的忠实信徒,期望靠堆积Nvidia芯片来建立moat的,彻底破防。DeepSeek R1的推出,不仅DS那些花了大价钱的AI大厂(比如Meta),还顺便鄙视了一下美国政府的AI芯片出口管制政策。

不觉得DeepSeek只是个套壳的API,套壳套不出这么好的AI产品,也套不出这么好的用户体验。就好比说WeChat只是中国版的WhatsApp,阿里只是中国版的Amazon,这种说法,有失偏颇。中国高科技企业在内卷的同时,其创新精神,还是很值得肯定的。个人觉得近十来年做大做强的中国高科技企业,大部分有自己的绝活,并不是纯粹的copy & paste西方同类企业。比如DJI,Unitree, BYD等,就走出了属于自己的成功之路。这类中国企业,只要国际环境不出现剧烈的变化,未来会更多的涌现,因为人才,技术,资金,投资环境和国家政策等,都有利于这类高科技公司在中国的发展。

F
FollowNature
客观的评价。肯定有学习和借鉴,但肯定有发展和新的功能及优化,甚至独创。
B
BBL123
Deep Seek 不可能开源底层.真正开源的是Google的AI Lib
B
BBL123
你不懂電腦软件shell的概念.Deep最多优化了算法不過又一个tiktok
B
BBL123
說的没错
八飛
赞牛帅!DS是铁掌水上漂裘千丈还是其弟裘千仞,不长时间内会见分晓。从到目前为止的历史事件的概率上讲,是大哥可能性大很多。