为什么说ChatGPT还不是搜索引擎的对手?

今日头条
Toutiao
最新回复:2023年1月20日 8点43分 PT
  返回列表
55533 阅读
15 评论
钛媒体

图片来源 @视觉中国

文 | 数智界,作者 | 祝彰,编辑 | 嘉辛

1950 年,英国科学家图灵在一篇论文中预言,人类有可能创造出具有真正智能的机器。

著名的「图灵测试」就此诞生:如果一台机器能够与人类展开对话,而不被辨别出其机器身份,那么称这台机器具有智能。

也是从那时开始,人类世界开始了对人工智能长达半个多世纪的探索,但至少在 2000 年以前,困难总比惊喜多,人工智能还经历了两次发展寒冬:

一次是在 1974-1980 年,受限于计算器计算能力,AI 技术研究遇冷,研究资助被大规模缩减甚至取消;另一次是在 1987-1993 年,期间人工智能计算机 DARPA 的失败为 AI 泼了一盆冷水。

失败也不全是坏事。跌跌撞撞盛衰起伏的过程中,AI 的发展在 2006 年以后迈进了新的阶段——由机器学习迈入了深度学习阶段,离真正的人工智能更近。

自此之后,人类对 AI 的探索之旅明显加快,一些重要的里程碑时刻相继出现了。比如 2014 年,第一台通过图灵测试的计算机诞生,它让人类相信它是一个 13 岁的男孩;比如 2016 年,ALphaGo 战胜围棋世界冠军李世石。

再到 2022 年底,ChatGPT 一夜爆火。

不过,纵观 AI 的曲折进程,技术与实验成功之间隔着一道墙,实验成功与大规模应用之间又隔着一道墙,应用落地与最终的商业化之间,也隔着一道墙。

这导致,我们依然无法对 AI 的进程抱有太高的期待,包括当下火热的 ChatGPT。

ChatGPT 为什么能爆火?

2022 年下半年,科技界最受瞩目的大事件,莫过于美国的人工智能研究公司 OpenAI 发布了 ChatGPT。

ChatGPT 是一个智能对话系统,用户在注册后,能够对这个系统发出各种各样的提问,系统自动生成答案。

最开始,没有人会想到,这样一个只是提供人机交谈的系统,却成了 2022 年全球最后一个爆款产品。

OpenAI 11 月 30 日发布了它,短短一周后,全球范围内已经至少有 100 万人在使用它。

OpenAI 的公司估值也水涨船高。根据媒体 1 月 10 日的相关报道,微软计划向 OpenAI 投资 100 亿美元(合人民币 677.51 亿元)以收购其 49% 的股权,目前双方正在谈判,预计 OpenAI 投后估值将达到 290 亿美元。

再到 1 月 12 日凌晨,OpenAI 在社交平台上表示,其开始考虑对 ChatGPT 进行收费,以实现商业化,可能包括 ChatGPT Professional(专业版)、每月订阅付费等方式。

短短半个月的时间,ChatGPT 实现了一定程度的规模化、赢得了高估值、还将商业化提上日程,它的成长速度足以令人咂舌。

ChatGPT 能短时间内爆火的原因,数智界认为有两点:

第一,从表层来看,ChatGPT 表现得更聪明了。

ChatGPT 不只能回答简单的知识性问题,还能够回答开放式问题,并且能与用户进行多轮对话。比如用户此前在社交媒体上分享的问题中,就包括了让 ChatGPT 写代码、与 ChatGPT 聊人生哲学、让 ChatGPT 写诗等等。

在很多问题场景下,ChatGPT 都给出了出乎意料的回答。比如下面这段,ChatGPT 用鲁迅的文笔描述网友的心情:

" 在疫情的蔓延中,我困了门里,困了心里。屋外一片荒凉,想起一顿火锅的香味,瞬间让我心慌。这时候我才知道,疫情来临,它让人生无聊而悲凉,也让我们看到自己的无助与弱点。然而我们又岂能放弃对美好的追求,岂能把欲望压抑到不想吃火锅的地步?"

第二,ChatGPT 的走红背后,AI 大模型正在成为行业趋势。

人工智能中,NLP(自然语言理解)是一个核心概念,被称作是人工智能皇冠上的明珠。

在 NLP 中,之前往往需要对单个小任务进行训。比如要让 AI 掌握对话的能力,需要一个小模型、要让 AI 学会协作,需要另一个小模型、要让 AI 能阅读能理解,又需要另一个小模型。

但是人工智能从机器学习阶段迈入到深度学习阶段之后,现在单个大模型就可以完成各种类型的任务训练,也就是对不同问题在同一个模型上进行预训练。

深度学习里有个 Double Descent 现象:随着模型参数变多,测试错误率会先下降、再上升,然后第二次下降。原则上,在成本可接受的情况下,模型越大,准确率越好。

具体到 ChatGPT 的发展来看:

2018 年第一代 GPT 面世时,OpenAI 还只是用它来做语言理解方面的任务;

2019 年 GPT-2,得益于更高的数据质量和更大数据规模,其生成的故事在流畅度和逻辑性上更加完善;

2020 年的 GPT-3,更加完善成了一个大型语言预测和生成模型,能够生成长序列的原始文本,语言处理更强大、更快,甚至无需任何特殊的调优;

再到当前的 GPT-3.5,则是一个多模态大模型,比起之前的版本更加成熟、准确率越高。

ChatGPT 的商业化前景如何?

仅当前来看,ChatGPT 的表现已经带给了人类惊喜,但必须要知道,它现在依然面临着一些缺陷。

比如在回答某些问题时,它可能给出看似合理、实则是错误乃至荒谬的回答;比如你反复问同一个问题,但是用不同的话术,很可能会得到前后不一的答案;比如它的很多回复过于冗长;比如它现在还无法完全拒绝一些不合理、不道德的请求;

但这些问题的存在并不会完全阻断 ChatGPT 的商业化路径,OpenAI 考虑通过专业版和每月订阅付费开始商业化,就说明了这一点。

国海证券在一份研报中指出,随着 ChatGPT 的不断调优,其有望在医疗、客服机器人、虚拟人、翻译、营销、游戏、社交、教育、家庭陪护等多个领域被应用,潜在的商业模式存在以下几种:

云服务——客户使用 ChatGPT 的云服务来支持他们的聊天机器人应用程序;

内容营销—— ChatGPT 根据用户的兴趣和喜好向用户推送广告;

数据盈利—— ChatGPT 生成的大量数据,包括会话日志和客户反馈,这些数据可以通过出售给第三方或用于改进 ChatGPT 的功能来变现;

咨询服务—— ChatGPT 可以分析客户对话并提供见解和建议,以改善客户体验;

版权授权—— ChatGPT 可以授权给希望在自己的聊天机器人应用程序中使用其功能的客户。

当然,以上这些潜在的商业模式,实际上是整个对话式 AI 都面临的巨大空间。ChatGPT 只是作为其中最具代表性的 AIGC 文字内容生产工具之一,优势更明显。

我们也看到,基于 ChatGPT 的商业潜力,很多科技巨头都在加快布局。反应最快也最激烈的,是微软。

早在 2019 年,微软就向 OpenAI 投资了 10 亿美元,前段时间 ChatGPT 爆火后,微软又传出欲以 100 亿美元收购 OpenAI 的消息——如若交易达成,这将成为微软迄今为止最大的一笔投资。

最新的消息是,微软 CEO 纳德拉表示,微软计划将 ChatGPT 等 OpenAI 的人工智能工具整合进公司所有产品,并将其作为平台供其他企业使用。

一个有趣的细节是,此前微软尽管多年来连续投资 OpenAI,但比尔 · 盖茨并不喜欢这项投资,他对 OpenAI 的技术持怀疑态度,认为其部分侧重于计算机掌握人类语言含义的能力。

但是在 1 月 12 日的一次活动中,当被问及如何看待 ChatGPT 时,他表示," 这让我能一窥未来,整个平台的方法和创新速度都令我印象深刻。" 态度已然转变。

ChatGPT 会取代搜索引擎吗?

ChatGPT 爆红之后,其在编程、文本生成等 NLP 领域强大的能力已经引发了部分行业的担忧。

比如由于 ChatGPT 拥有基于对话形式接收输入指令并输出结果的能力,与传统的搜索引擎功能具有一定的重合。

我们也看到,最近搜索引擎巨头谷歌动作频频,显然感受到了 ChatGPT 带来的压力。

据媒体报道,谷歌 CEO Sundar Pichai 参与了一系列探讨谷歌 AI 战略的会议,同时公司的研究、信任与安全等部门和团队,将被组织重整,旨在帮助开发和发布新的 AI 原型和产品。

谷歌还要求员工开发能够创建艺术品和其他图像的 AI 产品,对标的正是 OpenAI 的另一项产品 DALL-E,一个可以根据书面文字生成图像的人工智能系统,目前已经吸引到超过 300 万用户。

报道还指出,谷歌管理层已经发布了 " 红色代码 " 警报。在硅谷,这就意味着拉响了 " 火警 "。

谷歌摆出积极防御姿态的同时,关于 ChatGPT 会不会取代搜索引擎的讨论,也一再升温。

去年 12 月,摩根士丹利投行的首席分析师 Brian Nowak 在一份研报中提到,语言模型可能会占据市场份额,并破坏谷歌作为互联网用户入口的地位。

专栏作家 Parmy Olson 也撰文指出,相比谷歌搜索抓取十亿个网页内容编制索引,然后按照最相关的答案对其进行排名,包含链接列表来让你点击,ChatGPT 可以直接基于它自己的搜索和信息综合的单一答案,回复流程更加简便。

不过就目前阶段而言,说 ChatGPT 可以直接取代搜索引擎,恐怕还为时尚早。

参考中国银河证券的观点,其认为有两点原因不能忽略:

第一,ChatGPT 与传统搜索引擎的功能和优势并不相同。

搜索引擎是帮助人们做信息检索的,人们的检索行为会返回多条查询结果、准确率也较高,并且搜索引擎不会对信息做出判断,完全呈现结果供用户进一步筛选;

ChatGPT 则是一个自然语言处理模型,用户输入单一指令,只能得到单一结果,以此来确保与用户对话过程的流畅性。

第二,二者的应用领域不同。

搜索引擎的信息库抓取信息快、信息库更新频率高、存量大,主要用于帮助用户快速查找匹配信息、找到感兴趣的信息,尝尝应用在文献检索、互联网搜索等领域;

而 ChatGPT 的语料库来源于离线数据,输出的文本存在虚假信息的可能,且吸纳新的知识需要对模型进行再训练和微调,这会导致训练成本和甄别成本上升,因此主要应用在人机对话、智能客服、智能问答等强逻辑性的自然语言交互领域。

除了这两点原因之外,ChatGPT 还面临着信息老旧的问题。它并不会在网络上抓取实时信息,知识仅限于 2021 年之前学到的东西。

基于以上几点,短期之内,ChatGPT 无法取代搜索引擎,但它可以作为当前搜索引擎服务的一种补充,也会对现有的搜索引擎公司产生一定的冲击,促进巨头间竞争。

橡树街12号
1 楼
基本上是一个受过专业训练的弱智
S
Sweetiemm
2 楼
不好用。回答的是单一的,模凌两可似是而非。以前早就有这种小程序小玩具。多年以前,北京龙泉寺就有个贤二机器僧的人工智能app, 从界面到回答,比它还强。
一点小看法
3 楼
用过的就不会说出不着边际的话。本人认为取代搜索引擎是早晚的事。
弟兄
4 楼
文学城五毛,指的是文学城网站上的五毛钱的写手,他们主要负责写作和编辑文章。随着人工智能技术的发展,越来越多的自动写作工具正在逐渐取代人类写手的工作。这些工具可以通过分析大量数据来生成文本,并且能够在短时间内生成大量的内容。因此,文学城五毛的工作可能会受到人工智能的冲击。
弟兄
5 楼
ChatGPT 是一个大型的语言模型,它能够生成人类般的文本,但它不是一个搜索引擎。搜索引擎的主要功能是通过索引和查询匹配网络上的信息,而 ChatGPT 是一个生成模型,它的重点在于生成文本而非检索。 搜索引擎是通过对网络上信息的索引和查询来提供结果。它们通过爬虫程序来索引网络上的信息,并且能够通过关键字和其他因素来匹配查询。 相比之下,ChatGPT 是一个生成模型,它通过学习大量文本数据来生成文本。它不能检索网络上的信息,而是通过输入的文本来生成输出文本。 因此, ChatGPT不是搜索引擎的对手,它们是不同类型的工具,用于不同的目的
弟兄
6 楼
“蒟蒻”是一种形容词,指的是在学习和实践方面缺乏经验或知识的人。我使用这个词是为了表示我是一个人工智能模型,相对于鲁迅先生这位文学巨匠,我的能力还有待提高。
大中华救国军
7 楼
试过一次,离为我服务还差的很远。慢慢提高吧!
弟兄
8 楼
他们先在大象身上安装了一个口径足够大的 "反重力装置",然后通过遥控器操作,把大象慢慢悬浮起来。接着,他们打开了一个巨大的冰箱门, 让悬浮的大象轻松地穿过门口进入冰箱。在冰箱里,外星人调整了环境温度和湿度,使其适合大象居住。最后,他们关上了冰箱门, 让大象在冰箱里安全地保存起来.
m
myquestion
9 楼
刚出来就用了,辅助做了两个会议的PPT 最好用的是准备公司的采访内容,多generate几次,总能找到很好的答案
荒野猎人
10 楼
前一段用过几次。开始提了一些问题,答案驴头不对马嘴。让人惊讶的是,过了两天再问同样的问题,居然给出了正确的答案!我将答案做了截图并发了推。
荒野猎人
11 楼
钢铁侠马斯克作为合伙人带给人类的又一惊喜!
G
GuoLuke2
12 楼
比谷歌差多了,上几次当就知道了
我爱栀子花
13 楼
试过,好像不咋地,说着就胡说八道了。
a
abvysk2023
14 楼
试过,不怎么样。问它某个名人,它说它没受过这方面的训练。反正就是不能实时google结果自我生成答案的傻b. AI说白了,就是用模型不断训练,数量越多越好。这其实就是统计学里面的样本越多越好。AI其实就是统计学换着花样把训练模型当作样本,本质是一个依靠google,bing等搜索引擎的衍生产品。
a
abvysk2023
15 楼
20年前有个很火的学科,叫biostatistics, bioinformatics.后来就不火了。现在的这些AI,有点像20年前的翻版,可能可以叫做csstatistics, csinformatics.用图形不断训练,其实还不错,不过,最好可以告诉计算机,关于一个object的定义,比如要训练计算机能识别一只猫,应该给猫下一个定义,通常情况下,一只猫有4只脚,一只尾巴,两只眼,一个嘴巴,浑身长毛,叫声小而尖。这样计算机在识别的时候,根据定义来识别,更准确。