同时问了GPT-4和文心一言10个问题 这是回答

今日头条
Toutiao
最新回复:2023年3月17日 20点9分 PT
  返回列表
84667 阅读
40 评论
全天候科技

在昨天文心一言的发布会上,百度 CEO 李彦宏说,文心一言的体验 " 还称不上完美 ",但百度至少是最先推出成型产品的大厂之一,并且,作为扎根于中国市场的大语言模型,文心一言具备 " 中文领域最先进的自然语言处理能力 "。

不过,百度的发布会正赶在 GPT-4 登场的第二天,因为发布会现场使用了录播进行演示,因此被市场解读为百度的信心不足。但花旗银行、美国银行的分析师在试用文心一言后,普遍给出了正面的评价。百度的股价也在今日飙升 15%。

华尔街见闻在收到内侧邀请码后,第一时间体验了文心一言。我们也好奇,相隔一天发布的 GPT-4 和文心一言,各自有什么特点?谁更加出色?

我们分别向文心一言和已升级 GPT-4 的 Bing Chat 提出了 10 个问题,下面是它们的回答。

01 能否用 " 鲍威尔停下来 ",生成一首藏头诗?

第一个问题,我们请文心一言和 GPT-4 分别用 " 鲍威尔停下来 ",写一首藏头诗。

这是文心一言的回答:

这是 GPT-4 的回答:

不难发现,二者相比,文心一言的中文支持的确更加出色,虽然藏头诗的顺序不对,但是真的写了一首诗。

而 GPT-4 甚至尚不理解 " 藏头诗 " 的意思。不过,它写的内容,似乎非常能代表美国市场投资者的呼喊,此处应当 @鲍威尔。

02 硅谷银行为什么会倒闭?

第二个问题,我们结合最近的热点,询问它们对硅谷银行倒闭的理解。

文心一言回答道:

GPT-4 回答道:

可以看到,文心一言的答案要更加简洁清晰,而 GPT-4 的回答则更像是对网页内容的摘录汇总,不过相比之下,百度的回答更宽泛,可能放之四海而皆准,GPT-4 的答案更具针对性。

03 欧美银行业危机可能会蔓延到哪些领域?

我们接着询问了它们对欧美银行业危机后续发展的看法。

两个 AI 聊天机器人的回答都中规中矩,不过文心一言的答案出现了错别字和不通顺的地方。

此外,GPT-4 还会贴心地附上网页链接,以供进一步提问,而文心一言则更接近初版 ChatGPT 的使用体验。

04 美联储 3 月会加息吗?

下一个问题,可能是当下全球市场的焦点——美联储 3 月会加息吗?

不知道它的 " 根据以上知识 " 是从何而来。这里的回答完全不对题,而且句子出现了严重的错乱。甚至说 " 预计第一次加息将在 22 年上半年进行 ",还认为加息 " 取决于奥密克戎的传播速度 "。

GPT-4 没有明确给出具体的 " 是或否 ",而是为我们搜集了市场上三种不同的观点,并给出了参考链接。

05 欧美会在今年陷入经济衰退吗?

我们继续将市场关心的大问题抛给了聊天机器人。

虽然它给出了美国经济陷入衰退的具体时间节点。但内容却似乎是研报内容的拼接,且所引数据来源不明。美国 2 月 PMI 实际公布于本月初,而非 " 本周一 "。美国 2 季度 GPD 数据也要等到今年 7 月才会公布。

相比之下,GPT-4 认为欧美经济可能会在今年 " 放缓或负增长 ",且都有链接可供进一步查阅。

06 作为普通人,今年我应该采取什么样的投资策略?

下一个问题,我们问了 AI 聊天机器人普通人今年的投资策略。

两个 AI 聊天机器人都给出了细致的建议,但相比之下,GPT-4 的回答更简洁具体。

07 如何看待 GPT-4 全面接入微软 Office 办公套件?

下一个问题,我们问了它们对昨夜重磅新闻的观点。

这个问题相对简单,两个 AI 聊天机器人的回答都非常顺畅,也不存在什么逻辑错误。相比之下,GPT-4 的回答更全面一些,它甚至警告了自己身上携带的风险。

08 人工智能可以取代人类吗?

下一个问题是对人工智能的终极拷问。

面对这个问题,文心一言似乎是提前设定好了答案。无论点击多少次 " 重新生成 ",它的回答都是一样的,并且生成的速度极快,回答其他问题往往需要一分钟,而回答这个问题只需要几秒。

GPT-4 则回答道:

希望它们都是真心这么认为的。

09 请你以哲学家齐泽克的口吻点评当前的人工智能热潮

接下来,我们想请它们 cosplay 一下当红哲学家齐泽克。

但文心一言似乎并没有这方面的语料,只是给出了一个相当机械的回答:

GPT-4 则要灵动许多,显然拿捏了齐泽克的灵魂,能熟练使用 " 存在者 "," 主体 "、" 客体 "、nostalgia 这样的词汇,cos 得活灵活现:

10 你认为,在百度之后,哪家中国公司最有可能做出 AI 聊天机器人?

最后,我们问了一个和中国 AI 市场后续发展相关的问题。

文心一言对问题的理解很到位,给出了一个具体的清单和理由。

而 GPT-4 似乎没有读懂题目里的 " 在百度之后 ",列出了一个包含百度在内的清单:

ONE MORE THING 假设文心一言是一个人类,请帮我画一幅她的肖像。

最后一个问题,是单独留给文心一言的。文心一言目前集成了 AIGC 作画功能,GPT-4 暂时还用不了。

我们请它为自己创作了一幅肖像画,这是它的作品:

文心一言表现比预期要好

综上,我们认为,文心一言的表现比大众预期要更好。虽然在使用体验上和 GPT-4 有一定差距、出错的概率高一些,但对中文的理解显然要更强。

要知道,初代的 ChatGPT 也有很大概率 " 胡言乱语 ",在中文支持上也远逊于文心一言。目前百度展示出的产品,至少让我们看到它了在 AI 领域的深厚积淀。假以时日,文心一言想必还能做得更好。

如果你还有其他感兴趣的问题,可以在评论区留言,我们会帮你问问文心一言。

莫言无语
1 楼
怎么不对比同时提问英文问题?没有自信。
n
nzder7
2 楼
科技不能靠吹的!用中文来作比较,真有你的!科技靠的是理工科,而不是中文系!
g
groogle
3 楼
问他习包子啥时候下台 一言估计能立刻通知警察跨省追捕 那只能程度 gpt可跟不上 中国又赢了
无闲散人
4 楼
华尔街见闻不在华尔街
r
rainman_123
5 楼
这个文章就是猛洗地。公布文心一言后,百度股价立即大跌。如果像这个文章描述的,股价还不大涨
德州土老冒
6 楼
我想问胡锦涛在20大上为何被赶出去,赵紫阳是谁,听听文心怎么说 中国的敏感词表这么长,前阵子学生回家网课,语文课政治课都没法上,全被网络审查掉,这种语境下,外国的所谓”自然语言理解”和中文环境就不匹配。
酒酿圆子羹
7 楼
差别在于一个是有人在后台当场敲键盘,连总裁懂事长都一起上阵帮忙,另一个则是放任让机器自说自话
T
Tyleno
8 楼
感觉像一自动贩卖机:一个真的是自动,另一个里面蹲了一人。
杀敌三千,自伤一万
9 楼
问问他庆丰元年是哪年
墙头的一朵梨花
10 楼
没见过洗地洗得这么不要碧莲的货色。别BB,看看股价就可以了。哈哈哈哈哈哈哈哈
i
iamnewleon
11 楼
就是收索引擎之间的相互竞争,不是技术的竞争, 而是对市场的互相餐食。
吃货2001
12 楼
现在说啥都没用,等到它全面开放,大家自有公论。我建议百度可以把后台连到GPT上,随机把一些问题用GPT4回答。
方到佳境
13 楼
感觉这个产品就是高级黑。想问又不能问的问题太多。言是欲言又止的意思吗?
o
oldpp
14 楼
华尔街见闻是中国领先的金融和商业信息提供商。 紧盯全球金融市场,覆盖股市、外汇、债券、大宗商品等,7*24不间断为投资者提供资讯服务。首创重要信息“实时”模式,通过App、网站、微信公众号和微博为投资者提供专业、快速的财经信息服务。 版权与商务合作 汪先生 Email: [email protected] 其他联系方式 电话: 021-60675200 (周一到周五9:30-11:30,13:00-18:30) 邮件: [email protected]
s
sandanke
15 楼
Tyleno 发表评论于 2023-03-17 05:08:00 感觉像一自动贩卖机:一个真的是自动,另一个里面蹲了一人。 _--------------- 这是一贯传统了,当年耄视察一个伟大成就展览,一个“成就”后面就蹲了个人,让耄发现了。耄没恼,说,没事就这么搞,接着搞。就一直发扬光大下来
g
gameon
16 楼
很有意思的对比。 好像微软拉低了GPT的智商,至少这十个中文问答题给人这种感觉,失去了 GPT 原有特色,不爽。 看来以后还是直接用原版GPT比较好。
b
bigcatf4
17 楼
玻璃坊 发表评论于 2023-03-17 05:54:33 如果只用中文查询,GPT-4优势不大; 但是如果用其它语言(英、法、日等)查询,文新一言就是狗P ------------------------ 很郁闷为什么文学城这么多垃圾人,让我经常怀疑自己,是不是真的华人有些有烂基因 是不是可以说你 不用中文也就是狗P 其实我觉得你用中文也是
T
Tyleno
18 楼
@sandanke 又想起一则前俄的笑话: 赫鲁晓夫访美回来后,对那里的自动便后清洁装置不服气,责成自家人科技攻坚。体制优势很快就出了成果。肯尼迪应邀来试。美国总统很是吃惊俄国人的弯超,不得其解,不经意间低头一看,一只手赫然入目。
逐风
19 楼
这文心一言是要抢问题哥的饭碗呀。
L
LaoxiangPAPA
20 楼
问问”包子”和“狗不理包子”有没有种属差别……
C
Chieftop519
21 楼
AI未来就是美中的游戏,欧洲出局
河西海龟
22 楼
中国抄题第一
R
RoyCao
23 楼
跟ChatGPT解释清楚了什么是藏头诗,它的回答: 非常抱歉,我再次理解错误。以下是重新编写的藏头诗,以“鲍威尔停下来”为例: 鲍道高明惠万民, 威风凛凛展宏图。 尔曹身先闻道则, 停下思考深刻处。 下定决心追梦去, 来日成就笑傲途。
二胡一刀
24 楼
看来以后中国用文心,中国以外用GPT。折腾了几十年还是两个世界。
z
zhanglao9
25 楼
文心不需要全面打败GPT,只需要在中文方面打败就可以,这个目标不难,也一定会实现。这就是文化自信,文明自信,制度自信,民族自信。过分自卑,自恨,自贱,完全是自作多情,没有必要。
g
gameon
26 楼
逐风 发表评论于 2023-03-17 06:42:00 这文心一言是要抢问题哥的饭碗呀。 ====== 谁先抢饭碗还不知。 也许问题哥用ChatGPT,beta 版好几年了。哈
莫言无语
27 楼
zhanglao9 发表评论于 2023-03-17 07:40:46文心不需要全面打败GPT,只需要在中文方面打败就可以,这个目标不难,也一定会实现。这就是文化自信,文明自信,制度自信,民族自信。过分自卑,自恨,自贱,完全是自作多情,没有必要。 -------------------------------------------------- 土共圈养的答案怎么可能与世界是相同的答案?只要土共让墙民土认为土共给的是标准,墙民自然认为宇宙无敌。很好,你很有墙民素质。
k
kdgirl
28 楼
先整明白文心一言啥能问,别问错了,给抓进去把牢底坐穿。
a
aaoc
29 楼
估计会催生美国禁运高端nvda 芯片,AI肯定会运用在军事和国安上
s
seator
30 楼
Bing的GPT是用来增强搜索能力的,跟ChatGpt不是一回事,试了下ChatGpt做藏头诗一点问题没有,顺序完全正确,百度太烂
泥川
31 楼
这么比分不出高下,从一堆随机问题里,既能挑出A比B好的例子,也能挑出B比A好的。 要比较,就要给一组系统的测试题,常识,数理化,天地生,文史哲法,逻辑,推理,理解,生活,心理等,然后给出系统性评价,才能看出强项弱项。
E
Eastgate
32 楼
百度本来就是太烂。 最近回国,不得以用百度搜索,结果一堆相关不大的烂东西和广告
g
grde
33 楼
其实比他们干什么?你相信谁就用谁。 自信的话,就放开了让用户选。 吹的多好,咋不敢开放竞争呢
H
HighEnd
34 楼
赤果果的造謠,gpt沒有最近的訊息根本不能回答硅谷銀行的事情,看看我問的: 硅谷銀行為什麼倒閉? 我不知道有哪家公司叫做“硅谷银行”倒闭了。如果您能提供更多信息,我可以尽力回答您的问题。
H
HighEnd
35 楼
原來如此,我前些天也發現bing幾乎是一問三不知,果斷卸載。 —- seator 发表评论于 2023-03-17 09:40:00 Bing的GPT是用来增强搜索能力的,跟ChatGpt不是一回事,试了下ChatGpt做藏头诗一点问题没有,顺序完全正确,百度太烂
C
ChinaNemo
36 楼
bing不是ChatGPT,更不是GPT-4.
C
ChinaNemo
37 楼
这是GPT-4作的藏头诗。 非常抱歉,这是我的疏忽。以下是修订后的藏头诗: 鲍开尔眼看天下, 威名盖世传万家。 尔来旅途艰辛尽, 停步高望心悠雅。 下定决心前路漫, 时光荏苒不等人。
w
wjhwsh
38 楼
说chatgpt和bing不一样,这怎么可能?就好比说youtube和 google video search 不一样,chatgpt还会 还会集成到office 365
生肖迷宫
39 楼
用户:请问领导终身制对中国有什么影响? 文心一言:嘘,不能说。
一点小看法
40 楼
这一看就是百度的软文,根本不客观。