就在本周二,苹果第一款原生AI手机,终于在千呼万唤中亮相了。
以全新的Apple Intelligence为中心,苹果为iPhone16系列打造了一整套AI能力。
然而,在看完发布会的内容后,星海老局的感受却是:就这?
一如既往的苹果,这次没有意外,没有惊喜,没有任何重大的创新。
简单总结下这次iPhone16的变化:
首先是芯片方面,这回苹果可算是下了血本,标准版直接从A16跳到A18,Pro版更是整出个A18 Pro,用了二代3纳米工艺。
拍照功能又整出幺蛾子:像素升级了下,加了个新按钮,拥有融合式镜头、视觉智能等特色功能,说是能让你拍照跟个大片儿似的。那个Pro版还能拍个电影感的超级慢动作。
手表耳机也跟着凑热闹:Apple Watch Series 10新增了睡眠呼吸暂停检测等健康功能,耳机能降噪了,airpods目标用户新增老年人群体。
总的来说,这些个更新,实在乏善可陈。
最近这两年,苹果这“科技春晚”是越来越没看头了,而目前的手机行业啊,似乎也只剩下了一个劲儿地卷硬件。 但硬件卷到了头,已成红海的手机市场,销量仍然萎靡不振。
IDC数据显示,2023年全球智能机出货量同比下降3.2%至11.7亿部,为十年来最低,而苹果虽在去年以20%的市场份额稳居第一,但新机激活量却同比出现了—10.6%的下滑。
由于同质化和性能过剩问题,很多人觉得没有必要频繁更换新机。因此,消费者平均四年零三个月才会考虑换新机。
在硬件已经卷到头的情况下,新兴的AI技术,就成了市场中最大的变量。
如果手机AI真的给人带来了颠覆性的体验,到时势必会刺激新一轮的换机潮,一潭死水的市场也将由此盘活。
但问题是,怎样的手机AI,才是人们需要的好AI ?
AI时代,我们需要什么样的手机?
虽然,这次发布会上,苹果也落实了自身手机AI的一系列功能。
可细看下来,总给人一种“锦上添花”的感觉。
AI自动删除照片?咱自己动手不就行了吗?何必多此一举?
拍照能搜索?这玩意儿谷歌多少年前就整出来了,苹果这是刚睡醒吗?
写邮件、总结文章?得了吧,这不是ChatGPT早就能干的事儿吗?
你说说,这些功能哪个能让人眼前一亮?哪个能让人掏腰包?
苹果AI功能之一:照片搜索
其实吧,这不是苹果本身的AI能力不行,而是其技术没有用在解决用户痛点的“刀刃”上。
在AI时代,“智能”真正的用武之地,绝不仅仅只是用来干些图片消除,或者生成个文章摘要这些花里胡哨的小把戏。 其最大的意义,必然是减少过多的、复杂的操作,以及更好地理解人类的意图。
那这样的智能,对于手机而言,究竟意味着什么?
意味着人们在这尺寸之间的玻璃屏幕上,能够免去各种繁琐的、复杂的操作,让自己的手和眼解放出来。
举个栗子:
就拿订酒店来说:现在你得打开APP对比好几家店的价格,还得看评价,选日期,填信息,累死个人。要是有AI,你说句
“帮我订个周末去北京的酒店”,它就能自动帮你比价、订票、安排行程,一条龙服务,多省事儿啊!
这类针对多步骤,多环节的复杂操作的技术,在AI领域有一种专门的称呼,这就是AI Agent技术。
Agent,也叫“代理”或“智能体”。是一种可以自我规划、决策的AI技术。
啥意思呢?说白了就是一个能自己做决定、自己行动的智能程序。它不光能听懂你说啥,还能自己琢磨该咋办,然后自己动手去干。
对于那些复杂的,多步骤的任务,你只需要交代个大概,剩下的它就全包了。
而这样的技术,国内的手机厂商,已经抢先做出了表率。
荣耀在2024德国柏林消费电子展上,向全球推出行业首个跨应用开放生态AI Agent,带来可以帮助用户一键关闭自动续费、一键点饮品、一键旅行规划与订票等多项AI Agent体验。
用户只需一句话说明需求,剩下的工作交给手机自动完成即可。
举个例子,咱们都知道,自动扣费是啥玩意儿吧?有些时候,明明某些APP的会员,已经很久不用了,但是由于忘了取消,这些个APP,还是会每个月冷不丁地扣你一笔钱,让人不胜其扰。
这时候,AI Agent技术就开始发威了。你跟AI Agent说:“帮我退掉所有不用的自动续费的会员”。它就打开APP,搜索相关的扣费项,自动完成整个退订流程。
这一套下来,啥事儿都给你办妥了,比自己用手指一个个点麻利多了! 而背后的思路,本质上就是让用户直接向手机口述需求,手机自行分解、完成任务,最后呈现结果。 这种AI技术,才是真正能让人省心省力的好东西啊!
开放VS封闭
其实,类似的AI Agent 技术,苹果也不是没有,例如在这次发布会上,其展示的自动搜索并发送照片,就是一种常见的,需要多步骤操作Agent技术。
只是与荣耀这类国产厂商相比,在AI时代,苹果有一个很难跨过去的槛。
这个槛,就是苹果坚持多年的封闭生态。
正如前面提到的,在AI时代,最让人省心省力,也最能解放人们时间的,就是具有自主规划、自主决策能力的AI Agent 技术。
这样便捷的好技术,人们大概率会产生将其横向扩展的念头。
换句话说,这种自动化的技术,人们肯定不希望其局限于一部手机,一个系统中,而是希望它能够在安卓、Windows和物联网系统之间,也能实现协同工作。 最理想的局面是,以后人们只需要对手机说一句话,就能将原本横跨各种系统、设备之间的复杂操作一气呵成全办了。
就像《钢铁侠》里的贾维斯一样,一个AI设备,成为实现各种操作的终端。
《钢铁侠》中的贾维斯(J.A.R.V.I.S.)可以连接到任意计算机终端
而苹果的封闭生态,则决定了,即使其AI Agent 技术再强大,用户在苹果设备上享受到的智能体验,也可能无法延续到其他平台,造成体验的割裂。
更重要的是,在AI时代,很多新的产业和商业模式。比如,自动驾驶、智能家居、AI医疗诊断等。在这些新兴产业中,能够提供全面解决方案的生态系统,将很可能占据优势。例如,一个能够连接汽车、智能家居和移动设备的AI助手可能会成为新的刚需。
由于苹果的封闭生态,意味着其可能难以快速进入这些新兴市场。毕竟,你总不能强迫所有人,都去购买一个全苹果的设备吧?
而在这方面,基于安卓,或是华为的鸿蒙这类开放系统的手机,无疑有着更大的优势。
在今年IDC给出的预估报告中,Android设备的增速明显超过iOS设备,达到7.1%,而iOS设备的增速仅为0.8%,相差接近9倍。
在今年华为 HDC2024 发布的内容中,基于全新的盘古大模型 5.0,华为的小艺助手升级成了小艺智能体。只需对着屏幕说出需求,即可轻松实现导航、日程提取、电话拨打、信息查找等多项操作。
而在目前的国产手机厂商中,OPPO和vivo也将在下半年更新自己的AI进展。此前,两家企业已相继发布了自己的AI大模型小布和蓝心小V。
对于咱消费者来说,开放的生态,多样化的品牌,就意味着更多的选择。
而只有在拥有充分选择的前提下,手机上的Agent,或者说智能代理,才能更明白我们的需求、所思所想,从而变得更“懂”我们。
说到选择,构成Agent技术的关键环节之一,语音AI技术,中国的用户,现在也有了更多选择的方案。
交互革命
就现在来看,在“人机协同”这条路上,人类与各种智能硬件之间的交互方式,大致经历了这么几次范式革命:
一是计算机从原本复杂的代码操作,进化到了后来的键盘、鼠标。
这促成了后来PC市场的兴起;
二是手机由原来的按键机,进化到了更智能的触屏机;
这造就了后来移动互联网的兴起;
同样地,在AI时代,人类与各种Agent之间的互动,也存在着一种更高效、更便捷的方式。
这样的方式,就是语音互动。
一项来自斯坦福的研究指出,人类说话的速度是在键盘上打字的三倍,甚至可能是普通人在移动设备上打字速度的五倍。
所以,成熟的语音AI技术,就成了高效的手机AI的前置条件。
今年5月14日,OpenAI发布GPT-4o和端到端实时音视频对话模式,现场演示AI对话丝滑如人类。它能感受到你的呼吸节奏,也能用比以前更丰富的语气实时回复,甚至可以做到随时打断AI,效果非常惊艳。
演示一出,众人纷纷惊呼,这不就是现实版的《Her》吗?
可万众期待中,其正式上线的日子,也一拖再拖,以至于成了行业中的“期货”。
而且,细心的网友也从演示的视频中发现了猫腻。
其实,发布会现场演示手机可是插着网线的。
这意味着,演示中展示出的实时互动效果,在真实环境中,实现起来可能没那么容易……
然而,就在OpenAI哑火的同时,国内的AI厂商,却在语音AI这条赛道上百花齐放,各种能够实时交互的国产语音AI,都已实实在在地落了地。
例如,今年8月底,讯飞版「Her」就已经开放全民体验,其拥有极速响应和自由打断的交互能力,让人机对话更加自然流畅。与GPT-4o相比毫不逊色。
同时,它还能够准确识别用户的情绪状态,并用合适的语气方式回应,在情商方面秒杀不少人类。
AI对话录音
背后的关键技术是讯飞研发的多维度语音属性解耦表征训练方法,能够更好地控制语音的各个特征。
同样是在8月底,火山引擎发布了全新的豆包大模型升级版,新版本还与RTC实时音视频技术相结合,实现了用户和AI的自然对话,用户可以随时打断、插话,整体对话质量不受影响。
而作为国内AI翘楚之一的智谱清言,也几乎在同一时期,发布了自家的实时语音AI。
在视频理解方面,其基于GLM-4V-Plus的语音AI,可以轻松理解复杂视频内容,并回答用户提出的问题。
要是在玩《黑神话:悟空》的时候,玩家遇到了一句看不懂的经文,只需要拿起手机,打个视频通话,AI就能帮玩家破译经文。
AI视频通话
可以说,这些功能实在,落地迅速的国产语音AI,为将来国产手机AI的进一步崛起,提供了充足的“弹药”。
结语
说到现在这手机AI的赛道,咱中国和美国其实都还在同一个起跑线上,谁也没甩开谁多远。
这竞争格局啊,虽说咱中国还没整出个像苹果那样,在软硬件一体化方面都十分强大的“巨无霸”,但是,在这AI的江湖里,咱们中国的企业可是在各个垂直的领域,例如AI Agent、AI语音这方面形成了局部优势。
这样的局部优势,与中国庞大的移动用户群体相结合,就成了将来国产手机品牌在AI时代逆袭的资本。
而这样的逆袭一旦完成,广泛分布的大量手机AI,就有可能对云端大模型形成一种“农村包围城市”的态势。
在这样的态势下,手机上的端侧小模型,最终将很可能将占据那些无处不在、渗透性较高的生活场景(相当于“农村”),例如拍照、打车、购物、办公等等。
而云端大模型(例如ChatGPT与Claude 3.5),则将占据那些更加集中、通用,且对算力要求更高的场景(相当于“城市”),例如对长文档,长视频的总结、分析等任务。
如此一来,在AI时代,中国企业也就取得了与美国巨头分庭抗礼的可能。
就在本周二,苹果第一款原生AI手机,终于在千呼万唤中亮相了。
以全新的Apple Intelligence为中心,苹果为iPhone16系列打造了一整套AI能力。
然而,在看完发布会的内容后,星海老局的感受却是:就这?
一如既往的苹果,这次没有意外,没有惊喜,没有任何重大的创新。
简单总结下这次iPhone16的变化:
首先是芯片方面,这回苹果可算是下了血本,标准版直接从A16跳到A18,Pro版更是整出个A18 Pro,用了二代3纳米工艺。
拍照功能又整出幺蛾子:像素升级了下,加了个新按钮,拥有融合式镜头、视觉智能等特色功能,说是能让你拍照跟个大片儿似的。那个Pro版还能拍个电影感的超级慢动作。
手表耳机也跟着凑热闹:Apple Watch Series 10新增了睡眠呼吸暂停检测等健康功能,耳机能降噪了,airpods目标用户新增老年人群体。
总的来说,这些个更新,实在乏善可陈。
最近这两年,苹果这“科技春晚”是越来越没看头了,而目前的手机行业啊,似乎也只剩下了一个劲儿地卷硬件。 但硬件卷到了头,已成红海的手机市场,销量仍然萎靡不振。
IDC数据显示,2023年全球智能机出货量同比下降3.2%至11.7亿部,为十年来最低,而苹果虽在去年以20%的市场份额稳居第一,但新机激活量却同比出现了—10.6%的下滑。
由于同质化和性能过剩问题,很多人觉得没有必要频繁更换新机。因此,消费者平均四年零三个月才会考虑换新机。
在硬件已经卷到头的情况下,新兴的AI技术,就成了市场中最大的变量。
如果手机AI真的给人带来了颠覆性的体验,到时势必会刺激新一轮的换机潮,一潭死水的市场也将由此盘活。
但问题是,怎样的手机AI,才是人们需要的好AI ?
AI时代,我们需要什么样的手机?
虽然,这次发布会上,苹果也落实了自身手机AI的一系列功能。
可细看下来,总给人一种“锦上添花”的感觉。
AI自动删除照片?咱自己动手不就行了吗?何必多此一举?
拍照能搜索?这玩意儿谷歌多少年前就整出来了,苹果这是刚睡醒吗?
写邮件、总结文章?得了吧,这不是ChatGPT早就能干的事儿吗?
你说说,这些功能哪个能让人眼前一亮?哪个能让人掏腰包?
苹果AI功能之一:照片搜索
其实吧,这不是苹果本身的AI能力不行,而是其技术没有用在解决用户痛点的“刀刃”上。
在AI时代,“智能”真正的用武之地,绝不仅仅只是用来干些图片消除,或者生成个文章摘要这些花里胡哨的小把戏。 其最大的意义,必然是减少过多的、复杂的操作,以及更好地理解人类的意图。
那这样的智能,对于手机而言,究竟意味着什么?
意味着人们在这尺寸之间的玻璃屏幕上,能够免去各种繁琐的、复杂的操作,让自己的手和眼解放出来。
举个栗子:
就拿订酒店来说:现在你得打开APP对比好几家店的价格,还得看评价,选日期,填信息,累死个人。要是有AI,你说句
“帮我订个周末去北京的酒店”,它就能自动帮你比价、订票、安排行程,一条龙服务,多省事儿啊!
这类针对多步骤,多环节的复杂操作的技术,在AI领域有一种专门的称呼,这就是AI Agent技术。
Agent,也叫“代理”或“智能体”。是一种可以自我规划、决策的AI技术。
啥意思呢?说白了就是一个能自己做决定、自己行动的智能程序。它不光能听懂你说啥,还能自己琢磨该咋办,然后自己动手去干。
对于那些复杂的,多步骤的任务,你只需要交代个大概,剩下的它就全包了。
而这样的技术,国内的手机厂商,已经抢先做出了表率。
荣耀在2024德国柏林消费电子展上,向全球推出行业首个跨应用开放生态AI Agent,带来可以帮助用户一键关闭自动续费、一键点饮品、一键旅行规划与订票等多项AI Agent体验。
用户只需一句话说明需求,剩下的工作交给手机自动完成即可。
举个例子,咱们都知道,自动扣费是啥玩意儿吧?有些时候,明明某些APP的会员,已经很久不用了,但是由于忘了取消,这些个APP,还是会每个月冷不丁地扣你一笔钱,让人不胜其扰。
这时候,AI Agent技术就开始发威了。你跟AI Agent说:“帮我退掉所有不用的自动续费的会员”。它就打开APP,搜索相关的扣费项,自动完成整个退订流程。
这一套下来,啥事儿都给你办妥了,比自己用手指一个个点麻利多了! 而背后的思路,本质上就是让用户直接向手机口述需求,手机自行分解、完成任务,最后呈现结果。 这种AI技术,才是真正能让人省心省力的好东西啊!
开放VS封闭
其实,类似的AI Agent 技术,苹果也不是没有,例如在这次发布会上,其展示的自动搜索并发送照片,就是一种常见的,需要多步骤操作Agent技术。
只是与荣耀这类国产厂商相比,在AI时代,苹果有一个很难跨过去的槛。
这个槛,就是苹果坚持多年的封闭生态。
正如前面提到的,在AI时代,最让人省心省力,也最能解放人们时间的,就是具有自主规划、自主决策能力的AI Agent 技术。
这样便捷的好技术,人们大概率会产生将其横向扩展的念头。
换句话说,这种自动化的技术,人们肯定不希望其局限于一部手机,一个系统中,而是希望它能够在安卓、Windows和物联网系统之间,也能实现协同工作。 最理想的局面是,以后人们只需要对手机说一句话,就能将原本横跨各种系统、设备之间的复杂操作一气呵成全办了。
就像《钢铁侠》里的贾维斯一样,一个AI设备,成为实现各种操作的终端。
《钢铁侠》中的贾维斯(J.A.R.V.I.S.)可以连接到任意计算机终端
而苹果的封闭生态,则决定了,即使其AI Agent 技术再强大,用户在苹果设备上享受到的智能体验,也可能无法延续到其他平台,造成体验的割裂。
更重要的是,在AI时代,很多新的产业和商业模式。比如,自动驾驶、智能家居、AI医疗诊断等。在这些新兴产业中,能够提供全面解决方案的生态系统,将很可能占据优势。例如,一个能够连接汽车、智能家居和移动设备的AI助手可能会成为新的刚需。
由于苹果的封闭生态,意味着其可能难以快速进入这些新兴市场。毕竟,你总不能强迫所有人,都去购买一个全苹果的设备吧?
而在这方面,基于安卓,或是华为的鸿蒙这类开放系统的手机,无疑有着更大的优势。
在今年IDC给出的预估报告中,Android设备的增速明显超过iOS设备,达到7.1%,而iOS设备的增速仅为0.8%,相差接近9倍。
在今年华为 HDC2024 发布的内容中,基于全新的盘古大模型 5.0,华为的小艺助手升级成了小艺智能体。只需对着屏幕说出需求,即可轻松实现导航、日程提取、电话拨打、信息查找等多项操作。
而在目前的国产手机厂商中,OPPO和vivo也将在下半年更新自己的AI进展。此前,两家企业已相继发布了自己的AI大模型小布和蓝心小V。
对于咱消费者来说,开放的生态,多样化的品牌,就意味着更多的选择。
而只有在拥有充分选择的前提下,手机上的Agent,或者说智能代理,才能更明白我们的需求、所思所想,从而变得更“懂”我们。
说到选择,构成Agent技术的关键环节之一,语音AI技术,中国的用户,现在也有了更多选择的方案。
交互革命
就现在来看,在“人机协同”这条路上,人类与各种智能硬件之间的交互方式,大致经历了这么几次范式革命:
一是计算机从原本复杂的代码操作,进化到了后来的键盘、鼠标。
这促成了后来PC市场的兴起;
二是手机由原来的按键机,进化到了更智能的触屏机;
这造就了后来移动互联网的兴起;
同样地,在AI时代,人类与各种Agent之间的互动,也存在着一种更高效、更便捷的方式。
这样的方式,就是语音互动。
一项来自斯坦福的研究指出,人类说话的速度是在键盘上打字的三倍,甚至可能是普通人在移动设备上打字速度的五倍。
所以,成熟的语音AI技术,就成了高效的手机AI的前置条件。
今年5月14日,OpenAI发布GPT-4o和端到端实时音视频对话模式,现场演示AI对话丝滑如人类。它能感受到你的呼吸节奏,也能用比以前更丰富的语气实时回复,甚至可以做到随时打断AI,效果非常惊艳。
演示一出,众人纷纷惊呼,这不就是现实版的《Her》吗?
可万众期待中,其正式上线的日子,也一拖再拖,以至于成了行业中的“期货”。
而且,细心的网友也从演示的视频中发现了猫腻。
其实,发布会现场演示手机可是插着网线的。
这意味着,演示中展示出的实时互动效果,在真实环境中,实现起来可能没那么容易……
然而,就在OpenAI哑火的同时,国内的AI厂商,却在语音AI这条赛道上百花齐放,各种能够实时交互的国产语音AI,都已实实在在地落了地。
例如,今年8月底,讯飞版「Her」就已经开放全民体验,其拥有极速响应和自由打断的交互能力,让人机对话更加自然流畅。与GPT-4o相比毫不逊色。
同时,它还能够准确识别用户的情绪状态,并用合适的语气方式回应,在情商方面秒杀不少人类。
AI对话录音
背后的关键技术是讯飞研发的多维度语音属性解耦表征训练方法,能够更好地控制语音的各个特征。
同样是在8月底,火山引擎发布了全新的豆包大模型升级版,新版本还与RTC实时音视频技术相结合,实现了用户和AI的自然对话,用户可以随时打断、插话,整体对话质量不受影响。
而作为国内AI翘楚之一的智谱清言,也几乎在同一时期,发布了自家的实时语音AI。
在视频理解方面,其基于GLM-4V-Plus的语音AI,可以轻松理解复杂视频内容,并回答用户提出的问题。
要是在玩《黑神话:悟空》的时候,玩家遇到了一句看不懂的经文,只需要拿起手机,打个视频通话,AI就能帮玩家破译经文。
AI视频通话
可以说,这些功能实在,落地迅速的国产语音AI,为将来国产手机AI的进一步崛起,提供了充足的“弹药”。
结语
说到现在这手机AI的赛道,咱中国和美国其实都还在同一个起跑线上,谁也没甩开谁多远。
这竞争格局啊,虽说咱中国还没整出个像苹果那样,在软硬件一体化方面都十分强大的“巨无霸”,但是,在这AI的江湖里,咱们中国的企业可是在各个垂直的领域,例如AI Agent、AI语音这方面形成了局部优势。
这样的局部优势,与中国庞大的移动用户群体相结合,就成了将来国产手机品牌在AI时代逆袭的资本。
而这样的逆袭一旦完成,广泛分布的大量手机AI,就有可能对云端大模型形成一种“农村包围城市”的态势。
在这样的态势下,手机上的端侧小模型,最终将很可能将占据那些无处不在、渗透性较高的生活场景(相当于“农村”),例如拍照、打车、购物、办公等等。
而云端大模型(例如ChatGPT与Claude 3.5),则将占据那些更加集中、通用,且对算力要求更高的场景(相当于“城市”),例如对长文档,长视频的总结、分析等任务。
如此一来,在AI时代,中国企业也就取得了与美国巨头分庭抗礼的可能。