这种由下而上的,民主的,分布式AI研究,也就是任何国家,任何地区的教授,任何公司,比如尼泊尔老挝的教授,都有可能碰巧,“碰”出一个最厉害的算法,对强国,对华尔街来说,是致命的。所以他们必须构筑护城河和门槛, open AI的语言大模型就是最典型的做法,你需要大量的最昂贵的GPU,需要大量的电力,需要亿万计的数据库。。。。
Deep seek 把这一切的护城河给彻底踏平。它是开源的。他发布了七八个不同规模的模型,可以本地安装布置,既可以在超算上使用,也可以在笔记本电脑里安装,甚至可以装载在你孩子车库造出的机器人上。它不需要联网,在非洲丛林也可以离线使用,等等意味着,从现在开始,AI又要开始战国时代了。
以为这东西非常高科技。其实不是这样的 。
AI真正突破的算法是梯度下降以及反向传播。梯度下降其实是微积分里常识性的东西,算不上什么突破。但它与反向传播结合起来,就解决了人们梦寐以求的,用机器自动运算,去近似算出任何数据,任何现象的一个方程表达式的梦想。
从此以后,机器学习或者说AI就开挂了。各种算法层穷不出,包括CNN,rnn,LSM, transformer 等等。其实人们对现在为止出现的所有这些算法的内部运行机制的原理都一无所知。这些算法完全是一种经验,试错纠错等等性质的。人们微调,各种重新组合等等,再看结果,如果结果好,人们就采用,否则就摒弃。
这种由下而上的,民主的,分布式AI研究,也就是任何国家,任何地区的教授,任何公司,比如尼泊尔老挝的教授,都有可能碰巧,“碰”出一个最厉害的算法,对强国,对华尔街来说,是致命的。所以他们必须构筑护城河和门槛, open AI的语言大模型就是最典型的做法,你需要大量的最昂贵的GPU,需要大量的电力,需要亿万计的数据库。。。。
Deep seek 把这一切的护城河给彻底踏平。它是开源的。他发布了七八个不同规模的模型,可以本地安装布置,既可以在超算上使用,也可以在笔记本电脑里安装,甚至可以装载在你孩子车库造出的机器人上。它不需要联网,在非洲丛林也可以离线使用,等等意味着,从现在开始,AI又要开始战国时代了。
这对IT从业者其实是有利的。两条枪就可以干翻七大,这个可以激励包括小中在内的,包括尼日利亚马里苏丹等等任何国家地区的大学生在内的所有有志青年去拼搏。
AI 现在要从数学里找不变的,应用到算法里
听小孩聊,前一阵在重温实分析
最近说要用到群论,微分几何
谁知道呢?