我在2025展望贴里说到AI会有重大突破,成为真真的生产力,但没想到风暴来得这么快,中国杭州一家才一年的初创公司推出的deepseek 在周一如五级飓风重创全球科技股板块,有的跌幅曾高达近40%。据众多业内行家的专业测试,它的性能总体看齐chatgpt,几个领域譬如数学高于gpt,我自己试了试,速度太慢,没耐心做长的对话,以后再试,可能是服务器容量太小给挤爆了,据说还有大量网络攻击,和deepseek 大模型本身性能恐怕无关。
但技术性能还不是关键,科技进步总是后浪高过前浪,关键是deepseek取得这样傲人的性能据报只用了chatgpt几十分子一的成本,包括数量级减少的用于语言大模型学习的图像处理器数目和能耗,这是十分惊人的, 如chatgpt的早期版本,deepseek大方公开了源码,如果实力雄厚的大公司用资金,算力和人才杠杆撬动进一步开发,其成果将难以预料,其一;其二,它模型训练的廉价,极大降低了应用的门槛,譬如某家民间网调公司可以下载它的开码,适化后在一架laptop上就能训练特定领域的用户信息,而无需云计算。所以,虽然目前的deepseek 并不代表重大的生产力意义上的突破,但它打开的这扇窗,一下让人看到远得多宽得多的前景。
也有人说deepseek故意低报了图像处理器的使用数量以减少美国在这方面封锁的压力,可能(从图像处理器巨头英伟达股暴跌可见一斑),但它即使减少一半算能也是了不起的成就哦。觉得另一方面这也意味着deepseek 优化其算法的一个动因,这我得为咱中国人骄傲,精打细算苦干巧干是我们的美德哈,不是玩笑,我们看其公布的算法技术优化细节,精打细算苦干巧干还真挺好地概括了其特点,这以后再细说了。
Gpt4 是不是可以在3的基础上蒸馏呢?要花多少钱?事实上4花了多少钱?deepseek的意义是戳穿了大厂垄断和gpu垄断的作用。
https://www.worldjournal.com/wj/story/121468/8518543?from=wj_breaknews_index
除了算法优化,它在运算资源上也有革新,有些运算移到CPU 上,不用昂贵的GPU。但这些改进是否会节省这么多,以后其他公司是可以验证的。这不是开发芯片,算法优化有后发优势,东方人也有智力特长,当然不可否认,这些算法优化都有前人的基础。
AI界注入新血更具活力,更有竞争,不但是公司间的,也是不同技术间的,甚至还有方法论上的比较。
我提过好几次,中国虽然有我党的政府制度拉后腿,还有文化也是负分,但中国高科技同事智商,努力,卷,等各维度打分都比老美只高不低,创新不提,但大方向定下来后的迭代优化能力,是很令人恐怖的。
行,算不上amazing。
我试过几个复杂而且非常具体的税务问题,DS的回答是最好的,比免费版ChatGPT好
我在2025展望贴里说到AI会有重大突破,成为真真的生产力,但没想到风暴来得这么快,中国杭州一家才一年的初创公司推出的deepseek 在周一如五级飓风重创全球科技股板块,有的跌幅曾高达近40%。据众多业内行家的专业测试,它的性能总体看齐chatgpt,几个领域譬如数学高于gpt,我自己试了试,速度太慢,没耐心做长的对话,以后再试,可能是服务器容量太小给挤爆了,据说还有大量网络攻击,和deepseek 大模型本身性能恐怕无关。
但技术性能还不是关键,科技进步总是后浪高过前浪,关键是deepseek取得这样傲人的性能据报只用了chatgpt几十分子一的成本,包括数量级减少的用于语言大模型学习的图像处理器数目和能耗,这是十分惊人的, 如chatgpt的早期版本,deepseek大方公开了源码,如果实力雄厚的大公司用资金,算力和人才杠杆撬动进一步开发,其成果将难以预料,其一;其二,它模型训练的廉价,极大降低了应用的门槛,譬如某家民间网调公司可以下载它的开码,适化后在一架laptop上就能训练特定领域的用户信息,而无需云计算。所以,虽然目前的deepseek 并不代表重大的生产力意义上的突破,但它打开的这扇窗,一下让人看到远得多宽得多的前景。
也有人说deepseek故意低报了图像处理器的使用数量以减少美国在这方面封锁的压力,可能(从图像处理器巨头英伟达股暴跌可见一斑),但它即使减少一半算能也是了不起的成就哦。觉得另一方面这也意味着deepseek 优化其算法的一个动因,这我得为咱中国人骄傲,精打细算苦干巧干是我们的美德哈,不是玩笑,我们看其公布的算法技术优化细节,精打细算苦干巧干还真挺好地概括了其特点,这以后再细说了。
Gpt4 是不是可以在3的基础上蒸馏呢?要花多少钱?事实上4花了多少钱?deepseek的意义是戳穿了大厂垄断和gpu垄断的作用。
https://www.worldjournal.com/wj/story/121468/8518543?from=wj_breaknews_index
除了算法优化,它在运算资源上也有革新,有些运算移到CPU 上,不用昂贵的GPU。但这些改进是否会节省这么多,以后其他公司是可以验证的。这不是开发芯片,算法优化有后发优势,东方人也有智力特长,当然不可否认,这些算法优化都有前人的基础。
AI界注入新血更具活力,更有竞争,不但是公司间的,也是不同技术间的,甚至还有方法论上的比较。
我提过好几次,中国虽然有我党的政府制度拉后腿,还有文化也是负分,但中国高科技同事智商,努力,卷,等各维度打分都比老美只高不低,创新不提,但大方向定下来后的迭代优化能力,是很令人恐怖的。
行,算不上amazing。
我试过几个复杂而且非常具体的税务问题,DS的回答是最好的,比免费版ChatGPT好