对抗ChatGPT,谷歌Bard公测:巨头开启AI对决

今日头条
Toutiao
最新回复:2023年3月22日 7点20分 PT
  返回列表
50472 阅读
5 评论
品玩

面对 Open AI 和微软的步步紧逼,谷歌终于不再坐以待毙。

今日,谷歌宣布正式开放旗下 ChatGPT 竞争对手 Bard 的公测,首先将面向美国和英国地区启动。目前这两个国家的用户都可以在 bard.google.com 上进行排队等候,随着测试的推进 Bard 也会逐步在其他地区上线。

但相较于 Open AI 和微软踌躇满志的状态,此前在 Bard 栽了 " 翻车 " 跟头的谷歌显然更加谨慎。不同于 New Bing 的大规模开放策略,Bard 的测试名额将被逐步放出,同时初始版本将只能对文本响应。

此次,谷歌也向大家展示了更多关于 Bard 使用界面、功能等信息。下面,让我们一起看看未来我们将如何在 Google 上如何使用 Bard,以及它跟 New Bing 有什么不同。

同样的 AI 配方,更强的 " 求生欲 "

总体来看,谷歌的 Bard 跟 New Bing 的使用模式和功能基本一致。此次 Bard 也为用户提供了一个单独的聊天界面,用户可以在文本框中进行提问和搜索,比如让 Bard 帮你写一个计划、列一个食谱、帮你搜索一个冷知识等。

但在定位上,谷歌强调 Bard 并不是其搜索引擎的替代品,而是 " 搜索的补充 ", Bard 自称为 " 你具有创造力的得力协作者(Collaborator)",而 New Bing 则把 AI 助手称之为 " 副驾(Copilot)"。

当你在 Bard 上提问之后,在答案的最下方有四个按钮,分别是点赞、不喜欢、重新生成和 Google it。也就是说你在聊天界面内可以无缝连接到谷歌的主要搜索界面,二者将互为补充。

但 New Bing 目前能够给 AI 生成答案提供信息来源,以及基于生成答案自动提供拓展问题的功能目前 Bard 还并不具备。这或许也将在一定程度上影响 Bard 的信息产出的可信度,以及给搜索信息场景扩展带来局限。

New Bing 的 AI 对话机器人界面

但 Bard 也有比 New Bing 做得更多的地方。当用户提出一个问题之后,Bard 能直接帮用户生成 3 个不同版本的答案,你只需要选择 " 查看其他草稿 ",就可以在这些草稿中切换,并根据你的内容喜好进行选择。

总体来说,从 AI 功能上来看,Bard 跟 New Bing 大同小异。但在 New Bing 上线后曾出现的混乱和批评的前车之鉴之下,此次谷歌 Bard 最大的特点就是整个界面都透露出谷歌满满的 " 求生欲 "。

无论是在你 Bard 在提问的文本框下面还是答案生成框下方,时刻都写着一行小字,提醒用户 "Bard 可能生成不准确或者略带攻击性的信息,但并不代表谷歌官方观点 "。在你开始使用 Bard 之前,也会先明确提醒你 Bard 目前还只处于实验阶段,在页面 Bard logo 的旁边也有一个大大的 experiment 的标志。

在今天的官方博客中,谷歌甚至还自己先举出了一个 Bard 回答错误的例子,给用户打好 " 预防针 ",让大家做好预期管理。

承载着谷歌 " 全村的希望 ",Bard 是否能一雪前耻?

谷歌这次的谨慎完全可以理解,毕竟,一个月前 Bard 首次亮相时一个事实的错误就端掉了谷歌 1200 亿美元的市值。当时谷歌曾信誓旦旦的表示 Bard 不仅能够胜任 ChatGPT 的所有角色,还能比 ChatGPT 更负责任,但没想到立刻就在演示中翻了车,不仅 Bard 被一顿群嘲,谷歌最近也一直被微软 " 压着打 "。

而这次开启公测 Bard 谷歌明显吸取了上次的教训,态度上更加谦虚,在发布的信息准备也更加全面充足。据了解,在 Bard 翻车之后,谷歌 CEO 皮柴给公司全员发布了内部信,一方面告诉大家要稳住心态,另一方面号召谷歌全体员工积极参与 Bard 的内测,并公布了 Bard 完整训练指南。

在该指南中,谷歌强调了如何构建 " 负责任 AI",让员工向 Bard 提问并评估其回复,并标注出如不符合事实等不当回复。同时也明确了可做和不可做的事项,包括不要将 Bard 描述为一个人、不要进行情感暗示等。特别强调了当发现 AI 生成了仇恨、有害、虚假、非法或辱骂或征求敏感信息的内容的时候要进行标记并上报给团队。

谷歌此前提供给员工的 Bard 训练指南,图片来自 Business Insider

跟目前开放的公测界面类似,员工在测试期间也有 " 点赞 " 和 " 踩 " 的按钮,能够帮助快速分类信息。消息显示,在过去的几周中,已有 8 万谷歌员工参与了测试,很多员工每天都要花上 2-4 小时和 Bard 进行对话和提供测试反馈。

在内部会上皮柴曾暗示,在推出 Bard 这件事上谷歌不是一定要赶时间,而是首先要保证技术的可靠性。如今 Bard 正式开启公测,似乎也意味着在过去几周中 Bard 已经通过一些内部的审核标准。

拿到内测资格之后,硅星人今天也第一时间对 Bard 进行了测试。当被问及认为自己跟 GPT-4 有什么区别时,Bard 显现出了相当的自信,Bard 表示虽然自己跟 GPT-4 都是大型语言模型,但自己使用了 5000 亿参数进行训练,但 GPT-4 只有 1750 亿,所以自己能比 GPT-4 产出更复杂、更具相关性的内容。

图片来自硅星人对 Bard 的提问测试

乍听之下好像没问题?但仔细一品你就会发现,在这一段中也出现了一些不够准确的信息。比如没有准确描述 GPT-4 重要的多模态模型特征,同时,目前 OpenAI 官方并没有 GPT-4 公布使用了多少参数进行训练,1750 亿参数只是 GPT-3 的训练量。在这段回答中,Bard 似乎直接将 GPT-4 处理成了 GPT-3,因此也导致了 Bard 的自信结论的 " 崩塌 "。

但提供不准确的回答是不是意味着 Bard 能力不行呢?硅星人用同样的问题问了 New Bing,以下是 New Bing 给出的回答。

硅星人对 New Bing 的测试提问

虽然没有什么事实的错误,但 New Bing 给出的回答落点很偏、逻辑也比较混乱,先是说了 Bard 和 ChatGPT 训练数据集时间的不同,接着就又说专家相信 GPT-4 会让 ChatGPT 看起来像个笑话,回答内容逐步远离所提的问题。

如果就这一个问题的表现来看,Bard 的内容逻辑架构明显要比 New Bing 更好,但从信息可靠度来看,New bing 目前至少做到了不出错。

Bing 日活已突破 1 亿,谷歌试图后来居上

众所周知,谷歌在 AI 之战上是起了个大早、赶了个晚集。最近 Open AI 和微软的发起的猛烈攻势可以说是把谷歌逼到了悬崖边上。

本月初,在 New Bing 上线一个月之际,微软官方发布了最新的数据统计,表示一个月以来,New Bing 共吸引了超过百万的新用户,在此推动之下,现在 Bing 每日活跃用户已经突破了 1 亿大关。其中,大约有三分之一的用户每天在使用 Chat 的功能,平均每个会话约有 3 次聊天,总聊天次数超过 4500 万次。

除了在搜索之外,在谷歌 Chrome 统治的浏览器领域,集成了 AI 能力的 Edge 也开始发力抢夺用户,微软 " 搜索 + 答案 + 聊天 + 创造 " 生态正在逐渐形成。

微软宣布 Bing 用户突破 1 亿,图片来自微软官方

对于微软的进攻,谷歌不可能不着急。这段时间,两家公司基本都处于你来我往、见招拆招的状态,只要一家开了 AI 发布会或者宣布新产品,另外一家必定隔天就会放出新消息。如今两家的战火已经从搜索、浏览器一路烧到了办公软件领域。

对于已经落后一步的谷歌来说,想要短时间突破微软的包围并不容易。但在搜索领域,谷歌所占据的得天独厚的地理位置也让它 " 易守难攻 ",只要接下来 Bard 不频繁翻车或者出现什么大离谱事件,Bing 很难对它造成很大威胁。

同时,瞄准 ChatGPT 目前所存在的技术缺陷,着力解决信息安全和可靠的问题,也可能成为谷歌弯道超车的机会。

对于 ChatGPT 的威胁,此前皮柴就曾表示,谷歌过去一些最成功的产品也并不是第一个推向市场的。之所以能够最后取得成功是因为谷歌重视了用户的需求,并建立在深刻的技术洞察力之上,随着时间的推移才最终赢得了用户的信任。在 AI 的竞争上,谷歌将依然如此。

而随着今日 Bard 的出场,微软和谷歌的搜索之战或许才刚刚拉开帷幕。那么,你更看好谁呢?欢迎大家留言讨论。

r
roliepolieolie
1 楼
The Google empire could collapse in a few years because of ChatGPT’s brilliance, if it cannot present an alternative of its own.
H
HighEnd
2 楼
试了new bing,感觉就是一问三不知,果断卸载,用gpt基本上都能给出答案,看来微软技术还是差点
l
ljcn
3 楼
什么时候对所有人开放?
人间不值得007
4 楼
原本GPT4.没出来之前就是 Google 的几个人出来创的,核心是 Google 的人,怎么可能被bing 替代,Brad 是很快会超越的。很多人还不会用 GPT4,其实很多次插件可以打破 2021 的界限,甚至写书和查网络来源包括模拟人工合成。
n
ninja123
5 楼
Google leetcoder showing off their despair before the collapse of their queue and hive.