大家推敲一下DEEPSEEK。 如果判断正确,将产生发财机会

朝阳如沐
楼主 (文学城)

天朝虽然有人才, 不排除有突破的可能。 但是兲朝同样以弄虚作假哗众取宠闻名世界, 所以兲朝搞得东西也要推敲一下。 如果判断正确, 将是发财的机会。

根据网上信息, 梁文辉这个人是搞QUANT 炒股的,咋突然有财力物力精力去搞大模型? 而且据我对AI 的了解, 突破性的新模型一般要有论文阐述理论背景的, 不知道这个DEEPSEEK 有没有论文?如果没有论文背景,难道只是对现有LLM的优化吗?

现在国外权威的大公司或者机构对其有独立的测试,检测并给出结论吗?

手机上下载的DEEPSEEK, 只是跟SERVER 端通讯的用户端软件还是驯化的模型本身?我认为多半是个客户软件,不是模型本身 -- 大模型很难在手机上运行吧? GIT 上的源代码应该是个未驯化的模型吧,如果是这样, 第三方也不容易独立验证啊? 驯化模型要花大量人力物力, 有多少人或者公司会花钱去验证呢?

如果这事最后成为姜萍式的HOAX, 就有意思了。

丁丁在美洲
有论文啊,而且特别详细,代码也公开了

估计一对基于Deepseek间架的模型马上就要出来了

y
youtub
涉及到真金白银,就不好忽悠啊,

去年底国内的人给的消息:没法做重复训练deepseek模型,没那么多卡,也没训练数据,但目前据小模型的训练实验结果,deepseek的办法根本不能节省算力。

A
Austin8
今天AVGO、NVDA暴跌,说明市场选择了相信,但是,令人纳闷的是,中美那么多大公司,为什么一直没有人做到这一点?

所以,这个是很矛盾的。

如果这么容易就可以做出来,中国、美国那么多大公司,花费了那么多投资,为什么一直在那条死胡同里,动不动就是几十个Billions的投资?现在一个小小的Start Up, 并且还不是做 AI 出身的,居然可以只花5-6百万就做出来了?

这种可能性存在吗?这里有没有在AI 算法的?

 

 

三心三意
不是选择相信,而是sell first, ask question later。同时今天肯定有大批马金暴仓
越王剑
有很多问题等待答案

等着看吧。故事刚刚开始。

朝阳如沐
有论文链接吗? 麻烦贴一下。
B
BrightLine
NVDA 等AI股票涨得太高,没有这个DS,也有其他事件让机构做空的,今天7亿NVDA股票换手,1个多万亿的资金炒一个股

机构盛宴啊

雨女
你上次说如果AVGO到200一定加。

我今天早上放了200。谢谢三心。我就是没明白算力再好,不也得使用芯片嘛。为什么芯片公司NVDA跌?不过我今天没买NVDA. 

https://bbs.wenxuecity.com/tzlc/1988947.html

 

雨女
谢谢你楼下回答。我看到了。
三心三意
我今天也加了一点AVGO。等它下来等了很久了。不过我看近期还会上下震荡
m
maui_2021
最新数字,八个多亿股!!
三心三意
同时新建了Oracle仓位(168,155)
三心三意
4x the average volume.
M
Maui2021
咦,这么快山寨我的ID就出现了。成为名ID的必经之路吗?永远被模仿,从未被超越。

丁丁在美洲
不让贴连接,但是搜一下Deep Seek research papaer,第一条就是

在GitHub上

丁丁在美洲
我也是刚刚仔细读了一遍,很有启发
凊荷
越来越糊涂了
三心三意
LOL, did not even notice :)
M
Maui2021
这位山寨男,我已经在意见版向网管投诉了。

M
Maui2021
Let's see what he wants.

我爱花草
华尔街利用这个锲机割韭菜
8
85858585
难怪中国人不如阿三,看看。。。
雨女
我没有。开始关注。
丁丁在美洲
没什么奇怪的,GPT也是OpenAI这种只有几十个研发人员的公司做出来的

MSFT,Google,Meta这些公司光做AI的就有百倍的人,也并没有做出来

朝阳如沐
我也刚读一遍,不知这个链接可贴否。 这个有效

https://arxiv.org/pdf/2501.12948

 

B
BrightLine
I did not realize the ID...lol
m
maniac63
连基本的搜索能力都没的话还是别试图读technical report了,你看不懂的
m
maui_2021
老ID since last July.我俩差一个underscore
M
Maui2021
LOL
C
ClearCase
代码公开也复线不了的,因为训练数据不公开。
朝阳如沐
但是META这样的大公司肯定可以用相似数据评估其训练效率和准确度。