ecolock 发表于 2025-05-08 14:16 你知道deepseek比open ai 比的创新在哪里吗?有能力scale up是一种创新。算了,一看你就不懂
“DeepSeek 并没有发明模型蒸馏(Model Distillation)。模型蒸馏的概念最早由 Geoffrey Hinton、Oriol Vinyals 和 Jeff Dean 在 2015 年的论文《Distilling the Knowledge in a Neural Network》中提出(arXiv:1503.02531)。 DeepSeek 只是将蒸馏技术应用于其模型开发中(如 R1 或 V3),利用这一成熟方法从大型模型中提取知识,优化性能或效率。蒸馏是 AI 领域广泛使用的技术,许多团队(包括 DeepSeek、李飞飞的 s1 团队等)都在此基础上进行创新,但其起源归功于 Hinton 等人。”
投入的问题。有报道说今年中国的科研投入会超过美国。
以前这个说法是用在倭寇身上的
米苏二战后科技起步很大程度又是掠夺纳粹德国的科学家,所以米国也是靠的别人
太看得起美国人了 连哈佛新生都要一年intensively补中学数学了,我看美国大学生有一大批在中国初中拿不到毕业证的
美国科技满足不了中国发展需求了,中国只能自己来咯。
中国今天在各方面的爆发是经过开放40多年磨剑,加上政府各种政策到位的结果。 开放改革,全国富起来了,有了钱后,在教育,基建,技术研究等方面的投入正确,到位,就有今天的结果。
先烈欣慰个屁,当年装备那么差,先烈都敢揍美/日/苏/印/越, 现在海陆空天都遥遥领先,连台湾都不收,先烈活过来就要再气死
外来只是锦上添花实现突破,长久发展还是要靠自己培养人才。 凡是有大量海龟洄游行业,国内发展都很好。
我非常震撼,仿佛看到中国人不畏强权的具象化。中国人这种有骨气,有胆魄,永不退缩的精神,再加上能吃苦又聪明,中国怎么可能不强大。
各级领导船当政,科学家工程师就是打下手
太多时候忽悠比技术管用,爬的快,挣的多,学技术就是nerdy
还学来干啥呢
高科技产品低成本高产能,你竟然说不是创新和技术突破?逻辑在哪呢?
正解 国内科技届有能人 也有很多很多的骗子
供应链完整,原材料价格,人工不贵这些都是低成本的原因,还有国家补贴。未见得需要技术上的创造和发明
美国的钱全花到lobby 政客和大大小小几十场昂贵战争上了
接触到了"how"然后超过美国的例子很多啊。日本的半导体后来居上在消费类水平上80年代吊打美国。韩国从日本学习电子工业然后国家辅助投资,韩国现在半导体吊打日本。台积电也不是天上掉下来的,是从TI工作了很多年出来的台湾人创立的。 美国自己也是如此,二战结束大量德国科学家工程师进入美国谋生,他们都是"know how"的火种。 中国工业技术领域的从业人员在八十年代是缺乏人才,受文革断代影响。进入两千年后大批的大学生研究生供过于求,这时候只要西方转移know how的技术,大批聪明勤奋的从业人员后发至上是非常快的。所以美国挖空心思的拉盟国对中国搞集体封锁know how的技术转移。
+1
美国首创半导体行业,半路被日本在光刻机超车。 美国以国家力量,UCB担纲召集国家实验室(原曼哈顿计划单位)攻EUV光源。之后拉荷兰AMSL入伙,扶植其成为光刻界老大,在高端彻底赶走日本佳能Nikon。 当时美国政府决定不救本土光刻业,而是联合欧洲机密加工制造业,是个很有战略眼光的决定。日本到今天过不去EUV光源这个坎,据说放弃了。
你一张嘴就说不需要技术创新和发明。
用做玩具飞机的模具你能做出歼十吗?
是讲科技公司之间竞争和衰败兴起的故事,大的科技公司,譬如IBM这种,有钱,可以雇最好的员工,但是到了一定规模后,还是会被名不见经传的小公司做起来碾压。譬如当年的apple.
里头的原因有一部分也可以拿来完美解释中美科技发展的轨迹。
大的公司做起来之后,往往会集中力量发展高端产品,譬如对于IBM就是超级计算机,而放弃低端产品,譬如个人电脑。因为高端产品得到利润更加丰厚,这是资本市场自然选择的结果。
而小的公司就会捡起大公司不要的低端产品做,大公司继续做高端产品。
譬如美国放弃科技和制造业的低端市场给中国,而自己集中于高端科技市场。
但是科技的发展,从低端往上和宽继续扩展,往往是是很容易的,而到了高端再继续做,就很难往高和广发展。
所以结果大家都知道,硬件网络等等科技的发展,和cloud等软件技术的革新,使得个人计算机发展迅猛,渐渐蚕食了大型计算机的市场。 小公司可以做起来往上走,大公司被逼到绝境渐渐衰落。
AI,deepseak,六代战机开始超越美国??? LOL
美国人普遍认为,体育运动水平要提高全靠天天练
但是要提高解决数学问题的能力,不需要任何练习,只需要知道大致的定义就够了
这就好比看了几个youtube上的游泳视频,就跑去参加游泳比赛。你说滑稽不滑稽?
你着什么急啊,你有生之间肯定能看得到。当年人列强跑到你家里烧伤抢掠,现在国泰民安,没人敢挑衅,不欣慰?
几十年过去,一边兢兢业业,勤勤恳恳,孩子们一年的卷子做了一人高;一边大部分孩子都不喜欢数学,只有少数精英在学(其中还很多外国人)。我就问问,是每天舒舒服服躺平过日子easy,还是努力学习过日子easy??
凭什么一直努力的人不该出成果了呢?
这一切都太水到渠成了。
这是Google 给的答案,挺明白的哈
光投入没人行?open ai训模型的钱比deepseek多多了,结果呢。未来几十年是中国的,虽然人口红利没了,但是有人才红利。人才是关键
太酸了,还是有些人不睁眼看世界
你知道deepseek比open ai 比的创新在哪里吗?有能力scale up是一种创新。算了,一看你就不懂
没有没有,你美帝永远第一,还可以再躺躺,搞搞dei,搞搞堕胎,教育部部长搞搞a1,解释一下,美国教育部部长眼里没有ai,只有a1,以后美国学生需要a1来教育
别的不说,要大国的人写个自己操作系统就难了。
的确现在是这样. 只能骂美国夸中国
“DeepSeek 并没有发明模型蒸馏(Model Distillation)。模型蒸馏的概念最早由 Geoffrey Hinton、Oriol Vinyals 和 Jeff Dean 在 2015 年的论文《Distilling the Knowledge in a Neural Network》中提出(arXiv:1503.02531)。 DeepSeek 只是将蒸馏技术应用于其模型开发中(如 R1 或 V3),利用这一成熟方法从大型模型中提取知识,优化性能或效率。蒸馏是 AI 领域广泛使用的技术,许多团队(包括 DeepSeek、李飞飞的 s1 团队等)都在此基础上进行创新,但其起源归功于 Hinton 等人。”
有的美国人比较能睁眼看问题
有的前中国人反而因为皈依狂热,拒绝承认问题
这是昨天的wsj新闻
你应该不知道不知道几年中国超算第一的原因是什么。 算一算能耗比也就是Rmax(ptops)/power(kw),看看当年(2020年)参加排名获得第4的太湖神威之光和第一名差多少
因为从18年开始中国就不送最强的超级电脑参加top500了
神威太湖之光是16年的机器,从16年到18年蝉联4次世界第一。神威之前的天河2A蝉联6次世界第一。也就是中国在top500榜单上从2013年霸榜到2018年
你用16年的机器跟2020年的机器比能耗比?你怎么不用iphone12跟iphone16比能耗比?
美国政府拒绝了Intel浮点加速器和高性能CPU销往中国,之前中国超算没有GPU加速。 今天超算GPU集群加速是标配。这是都是出口管制产品。没法参赛。
就拿你说的2018,首先我查的2018排名第一不是国产。这不重要,你把第1,2(国外)和3,4(国产)能耗比比较一下?
iPhone16是不能和iPhone12比能效。但是如果规定iPhone16芯片只能用iPhone12的制造技术呢?因为这种限制,造不出iPhone16,这不丢人。但是一定要说,老子能造出比你快得多的,只是造出来不给你看,就有点好笑了。
你再看看你在说什么?
神威太湖之光恰恰用的是自研的众核CPU。超算最重要的是高带宽低延迟的网络,跟GPU没有一毛钱关系
更不用说现在的GPU完全为深度学习特化,追求的是BF16 FP8的性能。而超算排名看的是FP64的性能
同等成本下,专用处理器的性能比通用处理器高出100倍是rule of thumb。
神威2是16年1月到17年底的4次排名第一,我说的一点不错 https://www.top500.org/system/178764/
你这个表是18年初的排名,2年后的机器,赢了2年前的机器很光荣?
下面第四名天河2a是2013年的机器,18年的机器要是能输给13年的机器,想不到你对美国的技术这么没有信心?
https://top500.org/system/177999/
不出来溜溜还老说自己第一。
笑死我了。你要不要看看你在说什么
同等功耗同等成本,专用处理器的性能不比通用处理器高个10倍左右,属于技术不到家。
top500这种只计算一个benchmark的排名,恰恰是最不需要半导体优势的排名。top500的技术含量在哪里?在高带宽低延迟的互联网络
你要比加速器,国内随便一个加速器的性能功耗比拉出来都比你nvidia高
同样2018年发布,华为的升腾910 算力512T,功耗300瓦。NVIDIA的V100 算力120T,功耗也是300瓦
这才是华为的第一代AI芯片
继续嘴硬。我把能公开的信息都给大家了,非要继续嘴硬装疯我也没办法
友提,美国最强大的巨型机都在NSA,也从来不参加top500排名。
top500说到底只是田纳西大学的dongarra教授和ics 会议联合发布的排行榜。不是什么官方机构。
不参加比赛,没问题,也不丢人。
但是这种成果国内正规媒体不报道,就有点不符合你我都知道的国内报道习惯了。要是超算怕敌人知道了提高警惕,那么6代机不是更有理由不报道吗?
中国官方报道了6代机么?没有吧。只不过是试飞被网友拍到而已。
要不是我在这儿科普,你们能知道NSA的巨型机远超过TOP500上那些能源部的机器?
以前是因为落后所以特别注意保密。现在领先了,虽然处于传统还是继续不透明,但是管理上不再严防死守。
潘展乐的泳姿都是用超算通过流体力学模型优化出来的,居然还有人怀疑中国超算的实力。
如果你认为这种照片视频没有中国政府默许可以在网上流传,那你我对中国新闻的理解不在一个层次上。就此打住。
世人都知道NSA是马里兰州用电大户,也是美国最大的数学博士雇主,但人家没有天天挂在嘴上“我家超算世界第一”。 RSA三人获得图灵奖后多年,NSA承认它早有PKI系统。NSA另一个杰作是改原IBM的DES/DES3算法。
市场够大,不需要普通人怎么样,也有足够的outliers。而且现在资本充足,对有才能的人容忍度也高。
现在用在中国人身上,也可以。 学习人所长,不丢人。
你这真是想多了,最基本的东西都不知道。
当时中国性能最好的超算用的是国产处理器,排名第一。现在中国的芯片制造能力比那时强了好几倍,只是最好的超算都不参加排名了,怕刺激到他人。
有人会说英伟达有CUDA护城河,哈哈。
从投资角度来说,英伟达股票其实是很有风险的。英伟达的策略是不计成本,不顾能耗,提供最大的模型容量和最高的计算性能。现在这种策略大获成功,是因为高端大用户有这样的需求,并且他们也确实被捆绑在CUDA上,没有时间从CUDA转出来。但时间一长,这种策略是明显有问题的。
台湾确实是中国人心中的一根刺,不过,中国能在台海附近和美西方一较高下,也就最近10年左右吧 (2016年J-20服役,2017年055服役, 2019年山东舰服役)。只不过中国军工的发展速度太快,搞得好像中国很早以前就可以欺负美国似的。
说得太好了。一个国家还是应该走精英治国,不能搞集权也不能乱搞政治运动。人不应该把精力放在和人斗,应该多放眼未来,探索宇宙。相对于宇宙来说,人类真是太渺小了。
据说那款CPU是买断DEC Alpha 构架加自己改进,也不能说完全自主设计的CPU。
毕竟 只开源了中文版,谁让他们不学中文呢。
小孩教育洗脑,宇宙第一。
从幼儿园开始学习党史,肯定吹牛拍马厉害啊
这观点也太陈旧了……美国教育不也是一样,从娃开始洗脑民主天下第一,甚至还不如国内教育,至少对全球地理政治经济都有比较全面的介绍。美国一路快乐教育上来,很多白人连世界有几个大洲,中国在那里都不知道。
是哪个国家的中小学,每天早上必须集体背诵效忠宣誓来着?
我中国还是美国?
那肯定不一样啊。
中国人学习党史,那肯定是吹牛拍马。
美国人集体背诵效忠宣誓,那是自由的,正义的,呃,除了被私刑处死的黑人、被剥了头皮的印第安人,还有被排的华人以外。