出品|虎嗅科技组
美国当地时间 5 月 10 日,一年一度的谷歌 I/O 开发者大会如期举行。一直以来,谷歌在 I/O 大会上都是以先行者的姿态展示最前沿的 AI 技术。但今年这位 AI 巨头的姿态却与往昔有些不同了。
虽然本次大会谷歌发布新技术的节奏没变,推出了 PaLM 2 大模型、Bard 升级版,以及 Gemini 多模态模型。但在外人看来,这些技术似乎少了一些新奇的创意,多了几分追赶的焦虑。毕竟,在微软和 OpenAI 掀起来的这波 AI 大模型浪潮里,只要不是先行者,看起来都像是在追着微软的背影跑。
其实谷歌在 AI 赛道上跑的从来都不慢,近两年的谷歌 I/O 大会一直没有离开过 AI,今年大会的 AI 味儿还更浓了些,不仅是 Bard、Workspace 这些微软已经布局的产品赛道,谷歌还将生成式 AI 融入了安卓。
一直以来,Bing 一直被视为微软发力大模型的一个入口,是一个几乎完美的组合。但对谷歌来说,其杀手锏反而不是用户量更大的搜索,而是安卓系统。生态似乎给了谷歌一道牢固的护城河。不过在 AI 竞争中,这种逐鹿输赢如何,随着技术的迭代演变,还需要时间验证。
搜索并非大模型的唯一底牌,生态的优势又能让企业领先多久?
先发优势对谷歌搜索来说有多重要
微软把 GPT 能力赋予 Bing 的那一刻,就相当于是在对谷歌宣战。而谷歌推出 Bard,自然也就是接下了这挑战书。
本次大会上,发布了 PaLM 2 大模型,这也被业界广泛认为是对标 GPT-4 的产物。
事实上,2022 年 I/O 大会上展示过的 PaLM 模型参数量已经达到 5400 亿,单看参数量比当时 OpenAI 主打的 GPT-3 多 2 倍有余。而今年的进阶版—— PaLM 2,更是在数学能力、代码编写、逻辑推理、以及多语言能力等方面都有大幅提升。
随着基础大模型的升级,谷歌搜索引擎里用到的大型语言模型(LLM)对话机器人 Bard,也进行了一番升级,新增了引用功能,使内容更加准确。还有导出功能,可以将结果一键导出到 Gmail 或 Docs 中。
未来,Bard 还将与谷歌的其他应用(Maps、Photos、Messages、Flights、YouTube 等)集成,并开放第三方扩展,可以使用 Adobe Firefly 完成文生图功能。并结合谷歌最新宣布的 Gemini 多模态模型,提供和 GPT-4 的识图功能类似的,多模态能力。目前,开发者可以通过谷歌的 PaLM API、Firebase 以及 Colab 访问 PaLM 2。
虽然有进步,但相对于竞品,Bard 似乎还是慢了一小步。Bard 的这些功能更新在不久前,微软的 New Bing 几乎都宣布了一遍。但是,在大模型的争夺中,先发优势能够决定多少?
从微软 2023 年一季度财报来看,市调公司 Sensor Tower 的数据显示,微软宣布将把 ChatGPT 纳入搜索 6 周后,必应的流量飙升了 16%。在微软最新公布的 2023 年第一季度财报中,微软搜索和新闻广告营收同比增长 10%,均超出分析师预期。
虽然 Bing 的流量大幅上涨,但谷歌同期的财报并未显示搜索业务有明显下滑。作为已经在搜索引擎市场上占据绝对优势的谷歌来说," 打江山易,守江山难 ",谷歌搜索可能并不像 Bing 那样需要靠 AI 能力搏出位。对于搜索引擎市场的老大来说,需要的是保守和稳定,尽量少出现 Bard 首发时那样的 " 翻车 " 问题,可能才是现阶段保住市场地位的关键。
而在搜索引擎领域长久以后的 AI 之争,也并不急于一时的产品抢先,更多的还是要看 AI 大模型的底层能力,拼的就是 PaLM 和 GPT 谁进化得更快了。
从开发者的角度看,谷歌的大模型对于中小开发者,以及企业用户更为友好。PaLM 2 包含了 4 个不同参数的模型,包括壁虎(Gecko)、水獭(Otter)、野牛(Bison)和独角兽(Unicorn),并在特定领域的数据上进行了微调,为企业客户执行某些任务。
其中的壁虎模型,甚至可以在手机上直接运行。不仅降低了开发成本,还拓展了应用开发的可能性。不需要绑定云服务的 AI 应用,不仅大幅降低了 LLM 的使用成本,也可以最大限度地本地数据的安全。
当然,对于企业用户来说,PaLM 2 模型更易落地,其针对不同场景开发了不同的小模型。目前,谷歌内部已经有超过 70 个产品团队正在使用 PaLM2 构建产品。I/O 大会上展示了其中的两款行业模型:安全领域的 Sec-PaLM,聚焦于分析和解释潜在恶意脚本;医疗领域的 Med-PaLM2,可以通过美国医学执照考试,甚至还可以从医学影像中合成患者信息。很快,这两种模型都将通过谷歌云提供给特定客户。
从搜索到企业应用,综合来看,在接下来的 AI 竞逐中。谷歌和微软,孰能争先,目前还难有定论。
安卓生态能成谷歌 AI 的壁垒吗?
本次大会的亮点之一是谷歌在安卓上融入了 AI 功能。
谷歌最新公布的 Android 14 中,也融入了两项 AI 功能:Magic Compose 可以用生成式 AI 帮用户改写句子;安卓系统还将具备利用生成式 AI 制作具有 3D 效果的个性化壁纸的能力。
安卓短信功能
除应用功能以外,谷歌还推出了专为 Android 开发的 AI 编码机器人 Studio Bot。不仅可以生成代码、修复 BUG,甚至能够回答关于安卓应用开发的相关问题。同时支持 Kotlin 和 Java 编程语言,并将直接嵌入到 Android Studio 开发工具的工具栏中。
这或许才是谷歌 AI 最重要的一步棋。
目前 New Bing 和 Bard 都围绕搜索引擎开放了插件体系,两家都提到了将和 OpenTable 预订餐厅,以及 Instacart 订货配送的功能相结合,为用户提供更多可延展的服务。
然而,无论开放多少插件,这种仅可用于搜索引擎的插件功能,存在着一些局限性。
对于用户和服务商来说,插件的模式能够实现的功能有限,跨平台整合能力不足,最后可能导致增加用户的操作复杂度,或者降低服务商的跨平台服务能力。就比如说你在携程可以完成一趟旅行的全部预订,但如果把订机票、订酒店、订餐厅都拆成 3 个插件,那么操作起来势必会繁琐一些。
此外,还可能会遇到插件的开发者生态问题。一方面搜索引擎作为基础平台的开放性是否能满足开发者需求,另一方面还要基于搜索引擎的 AI 平台定义应用场景,培养开发者。这就在无形中给 AI 生态创造了一个开发门槛。
而对于谷歌来说,在这方面虽然插件生态也是刚刚起步。但谷歌毕竟拥有安卓生态的庞大开发者社群,如果将 AI 能力加成到其中,则能够更快地建立起一套繁荣的 AI 生态。基于安卓系统的 AI 应用生态体系,可能会先微软一步为谷歌构筑起生成式 AI 的护城河。
不过也有人认为,AI 大模型未必会形成操作系统级的生态。AI 行业分析师仓剑告诉虎嗅,"AI 大模型可能更像微信、支付宝这种超级 APP,它是一个应用型平台。"
诚然,在操作系统层面,谷歌具备更强的生态体系,且已经聚拢了一大批优质开发者。但如微信小程序的轻量化应用的崛起,也说明以 " 超级 App" 为入口的插件型应用自有它们的优势。
首先,插件的开发成本更低。在微信推出一款小程序的成本肯定比在应用商店上架 App 要低得多,现在有的小程序开发价格甚至比一些 H5(网页)更便宜。其次,小程序在实现单点功能方面更便捷,对于 LLM 来说,如果你不需要复杂的操作,只是用自然语言输入,即可获得结果的话,那么确实开发一款复杂应用可能没有什么必要。
而相较于 App 来说,搜索引擎作为入口的流量红利,或许也可以在一定程度上覆盖功能简单的不足。由此来看,虽然安卓生态可能为谷歌先一步聚拢 AI 开发者人气,但围绕搜索引擎的插件之争,应该也还会在两大巨头,甚至未来的更多入局者中持续发酵。
出品|虎嗅科技组
美国当地时间 5 月 10 日,一年一度的谷歌 I/O 开发者大会如期举行。一直以来,谷歌在 I/O 大会上都是以先行者的姿态展示最前沿的 AI 技术。但今年这位 AI 巨头的姿态却与往昔有些不同了。
虽然本次大会谷歌发布新技术的节奏没变,推出了 PaLM 2 大模型、Bard 升级版,以及 Gemini 多模态模型。但在外人看来,这些技术似乎少了一些新奇的创意,多了几分追赶的焦虑。毕竟,在微软和 OpenAI 掀起来的这波 AI 大模型浪潮里,只要不是先行者,看起来都像是在追着微软的背影跑。
其实谷歌在 AI 赛道上跑的从来都不慢,近两年的谷歌 I/O 大会一直没有离开过 AI,今年大会的 AI 味儿还更浓了些,不仅是 Bard、Workspace 这些微软已经布局的产品赛道,谷歌还将生成式 AI 融入了安卓。
一直以来,Bing 一直被视为微软发力大模型的一个入口,是一个几乎完美的组合。但对谷歌来说,其杀手锏反而不是用户量更大的搜索,而是安卓系统。生态似乎给了谷歌一道牢固的护城河。不过在 AI 竞争中,这种逐鹿输赢如何,随着技术的迭代演变,还需要时间验证。
搜索并非大模型的唯一底牌,生态的优势又能让企业领先多久?
先发优势对谷歌搜索来说有多重要
微软把 GPT 能力赋予 Bing 的那一刻,就相当于是在对谷歌宣战。而谷歌推出 Bard,自然也就是接下了这挑战书。
本次大会上,发布了 PaLM 2 大模型,这也被业界广泛认为是对标 GPT-4 的产物。
事实上,2022 年 I/O 大会上展示过的 PaLM 模型参数量已经达到 5400 亿,单看参数量比当时 OpenAI 主打的 GPT-3 多 2 倍有余。而今年的进阶版—— PaLM 2,更是在数学能力、代码编写、逻辑推理、以及多语言能力等方面都有大幅提升。
随着基础大模型的升级,谷歌搜索引擎里用到的大型语言模型(LLM)对话机器人 Bard,也进行了一番升级,新增了引用功能,使内容更加准确。还有导出功能,可以将结果一键导出到 Gmail 或 Docs 中。
未来,Bard 还将与谷歌的其他应用(Maps、Photos、Messages、Flights、YouTube 等)集成,并开放第三方扩展,可以使用 Adobe Firefly 完成文生图功能。并结合谷歌最新宣布的 Gemini 多模态模型,提供和 GPT-4 的识图功能类似的,多模态能力。目前,开发者可以通过谷歌的 PaLM API、Firebase 以及 Colab 访问 PaLM 2。
虽然有进步,但相对于竞品,Bard 似乎还是慢了一小步。Bard 的这些功能更新在不久前,微软的 New Bing 几乎都宣布了一遍。但是,在大模型的争夺中,先发优势能够决定多少?
从微软 2023 年一季度财报来看,市调公司 Sensor Tower 的数据显示,微软宣布将把 ChatGPT 纳入搜索 6 周后,必应的流量飙升了 16%。在微软最新公布的 2023 年第一季度财报中,微软搜索和新闻广告营收同比增长 10%,均超出分析师预期。
虽然 Bing 的流量大幅上涨,但谷歌同期的财报并未显示搜索业务有明显下滑。作为已经在搜索引擎市场上占据绝对优势的谷歌来说," 打江山易,守江山难 ",谷歌搜索可能并不像 Bing 那样需要靠 AI 能力搏出位。对于搜索引擎市场的老大来说,需要的是保守和稳定,尽量少出现 Bard 首发时那样的 " 翻车 " 问题,可能才是现阶段保住市场地位的关键。
而在搜索引擎领域长久以后的 AI 之争,也并不急于一时的产品抢先,更多的还是要看 AI 大模型的底层能力,拼的就是 PaLM 和 GPT 谁进化得更快了。
从开发者的角度看,谷歌的大模型对于中小开发者,以及企业用户更为友好。PaLM 2 包含了 4 个不同参数的模型,包括壁虎(Gecko)、水獭(Otter)、野牛(Bison)和独角兽(Unicorn),并在特定领域的数据上进行了微调,为企业客户执行某些任务。
其中的壁虎模型,甚至可以在手机上直接运行。不仅降低了开发成本,还拓展了应用开发的可能性。不需要绑定云服务的 AI 应用,不仅大幅降低了 LLM 的使用成本,也可以最大限度地本地数据的安全。
当然,对于企业用户来说,PaLM 2 模型更易落地,其针对不同场景开发了不同的小模型。目前,谷歌内部已经有超过 70 个产品团队正在使用 PaLM2 构建产品。I/O 大会上展示了其中的两款行业模型:安全领域的 Sec-PaLM,聚焦于分析和解释潜在恶意脚本;医疗领域的 Med-PaLM2,可以通过美国医学执照考试,甚至还可以从医学影像中合成患者信息。很快,这两种模型都将通过谷歌云提供给特定客户。
从搜索到企业应用,综合来看,在接下来的 AI 竞逐中。谷歌和微软,孰能争先,目前还难有定论。
安卓生态能成谷歌 AI 的壁垒吗?
本次大会的亮点之一是谷歌在安卓上融入了 AI 功能。
谷歌最新公布的 Android 14 中,也融入了两项 AI 功能:Magic Compose 可以用生成式 AI 帮用户改写句子;安卓系统还将具备利用生成式 AI 制作具有 3D 效果的个性化壁纸的能力。
安卓短信功能
除应用功能以外,谷歌还推出了专为 Android 开发的 AI 编码机器人 Studio Bot。不仅可以生成代码、修复 BUG,甚至能够回答关于安卓应用开发的相关问题。同时支持 Kotlin 和 Java 编程语言,并将直接嵌入到 Android Studio 开发工具的工具栏中。
这或许才是谷歌 AI 最重要的一步棋。
目前 New Bing 和 Bard 都围绕搜索引擎开放了插件体系,两家都提到了将和 OpenTable 预订餐厅,以及 Instacart 订货配送的功能相结合,为用户提供更多可延展的服务。
然而,无论开放多少插件,这种仅可用于搜索引擎的插件功能,存在着一些局限性。
对于用户和服务商来说,插件的模式能够实现的功能有限,跨平台整合能力不足,最后可能导致增加用户的操作复杂度,或者降低服务商的跨平台服务能力。就比如说你在携程可以完成一趟旅行的全部预订,但如果把订机票、订酒店、订餐厅都拆成 3 个插件,那么操作起来势必会繁琐一些。
此外,还可能会遇到插件的开发者生态问题。一方面搜索引擎作为基础平台的开放性是否能满足开发者需求,另一方面还要基于搜索引擎的 AI 平台定义应用场景,培养开发者。这就在无形中给 AI 生态创造了一个开发门槛。
而对于谷歌来说,在这方面虽然插件生态也是刚刚起步。但谷歌毕竟拥有安卓生态的庞大开发者社群,如果将 AI 能力加成到其中,则能够更快地建立起一套繁荣的 AI 生态。基于安卓系统的 AI 应用生态体系,可能会先微软一步为谷歌构筑起生成式 AI 的护城河。
不过也有人认为,AI 大模型未必会形成操作系统级的生态。AI 行业分析师仓剑告诉虎嗅,"AI 大模型可能更像微信、支付宝这种超级 APP,它是一个应用型平台。"
诚然,在操作系统层面,谷歌具备更强的生态体系,且已经聚拢了一大批优质开发者。但如微信小程序的轻量化应用的崛起,也说明以 " 超级 App" 为入口的插件型应用自有它们的优势。
首先,插件的开发成本更低。在微信推出一款小程序的成本肯定比在应用商店上架 App 要低得多,现在有的小程序开发价格甚至比一些 H5(网页)更便宜。其次,小程序在实现单点功能方面更便捷,对于 LLM 来说,如果你不需要复杂的操作,只是用自然语言输入,即可获得结果的话,那么确实开发一款复杂应用可能没有什么必要。
而相较于 App 来说,搜索引擎作为入口的流量红利,或许也可以在一定程度上覆盖功能简单的不足。由此来看,虽然安卓生态可能为谷歌先一步聚拢 AI 开发者人气,但围绕搜索引擎的插件之争,应该也还会在两大巨头,甚至未来的更多入局者中持续发酵。