天朝虽然有人才, 不排除有突破的可能。 但是兲朝同样以弄虚作假哗众取宠闻名世界, 所以兲朝搞得东西也要推敲一下。 如果判断正确, 将是发财的机会。
根据网上信息, 梁文辉这个人是搞QUANT 炒股的,咋突然有财力物力精力去搞大模型? 而且据我对AI 的了解, 突破性的新模型一般要有论文阐述理论背景的, 不知道这个DEEPSEEK 有没有论文?如果没有论文背景,难道只是对现有LLM的优化吗?
现在国外权威的大公司或者机构对其有独立的测试,检测并给出结论吗?
手机上下载的DEEPSEEK, 只是跟SERVER 端通讯的用户端软件还是驯化的模型本身?我认为多半是个客户软件,不是模型本身 -- 大模型很难在手机上运行吧? GIT 上的源代码应该是个未驯化的模型吧,如果是这样, 第三方也不容易独立验证啊? 驯化模型要花大量人力物力, 有多少人或者公司会花钱去验证呢?
如果这事最后成为姜萍式的HOAX, 就有意思了。
估计一对基于Deepseek间架的模型马上就要出来了
去年底国内的人给的消息:没法做重复训练deepseek模型,没那么多卡,也没训练数据,但目前据小模型的训练实验结果,deepseek的办法根本不能节省算力。
所以,这个是很矛盾的。
如果这么容易就可以做出来,中国、美国那么多大公司,花费了那么多投资,为什么一直在那条死胡同里,动不动就是几十个Billions的投资?现在一个小小的Start Up, 并且还不是做 AI 出身的,居然可以只花5-6百万就做出来了?
这种可能性存在吗?这里有没有在AI 算法的?
等着看吧。故事刚刚开始。
机构盛宴啊
我今天早上放了200。谢谢三心。我就是没明白算力再好,不也得使用芯片嘛。为什么芯片公司NVDA跌?不过我今天没买NVDA.
https://bbs.wenxuecity.com/tzlc/1988947.html
https://x.com/deepseek_ai/status/1881318142083018951
https://arxiv.org/abs/2501.12948
在GitHub上
MSFT,Google,Meta这些公司光做AI的就有百倍的人,也并没有做出来
https://arxiv.org/pdf/2501.12948
天朝虽然有人才, 不排除有突破的可能。 但是兲朝同样以弄虚作假哗众取宠闻名世界, 所以兲朝搞得东西也要推敲一下。 如果判断正确, 将是发财的机会。
根据网上信息, 梁文辉这个人是搞QUANT 炒股的,咋突然有财力物力精力去搞大模型? 而且据我对AI 的了解, 突破性的新模型一般要有论文阐述理论背景的, 不知道这个DEEPSEEK 有没有论文?如果没有论文背景,难道只是对现有LLM的优化吗?
现在国外权威的大公司或者机构对其有独立的测试,检测并给出结论吗?
手机上下载的DEEPSEEK, 只是跟SERVER 端通讯的用户端软件还是驯化的模型本身?我认为多半是个客户软件,不是模型本身 -- 大模型很难在手机上运行吧? GIT 上的源代码应该是个未驯化的模型吧,如果是这样, 第三方也不容易独立验证啊? 驯化模型要花大量人力物力, 有多少人或者公司会花钱去验证呢?
如果这事最后成为姜萍式的HOAX, 就有意思了。
估计一对基于Deepseek间架的模型马上就要出来了
去年底国内的人给的消息:没法做重复训练deepseek模型,没那么多卡,也没训练数据,但目前据小模型的训练实验结果,deepseek的办法根本不能节省算力。
所以,这个是很矛盾的。
如果这么容易就可以做出来,中国、美国那么多大公司,花费了那么多投资,为什么一直在那条死胡同里,动不动就是几十个Billions的投资?现在一个小小的Start Up, 并且还不是做 AI 出身的,居然可以只花5-6百万就做出来了?
这种可能性存在吗?这里有没有在AI 算法的?
等着看吧。故事刚刚开始。
机构盛宴啊
我今天早上放了200。谢谢三心。我就是没明白算力再好,不也得使用芯片嘛。为什么芯片公司NVDA跌?不过我今天没买NVDA.
https://bbs.wenxuecity.com/tzlc/1988947.html
https://x.com/deepseek_ai/status/1881318142083018951
https://arxiv.org/abs/2501.12948
在GitHub上
MSFT,Google,Meta这些公司光做AI的就有百倍的人,也并没有做出来
https://arxiv.org/pdf/2501.12948