国产 AI 距离 ChatGPT 有多久?李彦宏曾给出的答案是两个月。
有趣的是,3 月 16 日百度正式发布文心一言,而前一天,OpenAI 发布了 GPT-4,后一天,微软宣布将 OpenAI 的技术引入办公套件。
如今一个半月的时间即将过去,但文心一言似乎还没达到媲美 GPT-4 的水平。昨天,李彦宏在青年节的内部讲话中,为之前的说法 " 打了补丁 ":" 前一段时间我接受采访时说,我们跟 ChatGPT 的差距大约是两个月,但说实话这有点断章取义,我后面紧接着还说,这不是重点,重点是这两个月的差距我们要用多长时间才能赶上,也许很快,也许永远也赶不上。"
巧合的是,就在同一天,在百度最擅长的领域——搜索,微软宣布了一系列的升级,并宣布新 Bing(必应)现在处于开放预览阶段并且不再有候补名单,这意味着现在每个人都可以比以往更轻松地试用新 Bing 和 Edge,只需使用微软账号登录即可。新 Bing 将给用户带来更好的搜索结果、问题的答案、创建和撰写的能力,并将易用性提升到新的水平。
图片来源:Microsoft Bing
目前,国内确实在努力赶超国外的步伐,但即使是进展最快的百度,可能差距也不止两个月了。
01.
搜索结果更直观,但准确性有待加强
"Bing 将强大的大型语言模型(如 OpenAI 的 GPT-4)与我们庞大的搜索索引相结合,以获取最新、引用和对话的结果——这是你在 Bing 以外的任何地方都无法获得的。这从根本上改变了人们查找信息的方式。" 微软在官网中表示,在短短 90 天内,Bing 的每日活跃用户已超过 1 亿,Bing 移动应用的每日安装量自推出以来增长了 4 倍。
微软正在转向下一代 AI 驱动的 Bing 和 Edge,通过极大地扩展视野和功能来改变世界上最大的软件类别——搜索,微软将其视为客户的 Web 副驾驶。下一代的定义是:
通过从有限预览转变为开放预览并消除试用候补名单,向更多人开放 Bing。
从纯文本搜索和聊天转变为具有丰富图像 / 视频答案的更加直观的搜索和聊天,并且即将推出新的多模式支持。
从单一使用的聊天 / 搜索会话转变为具有聊天历史记录和 Edge 中持久聊天的多会话生产力体验。
开放平台功能,以便开发人员和第三方可以在 Bing 之上构建,帮助人们对他们的查询采取行动并完成任务。
据微软的研究,人类大脑处理视觉信息的速度比文本快 60000 倍,这使得视觉工具成为人们搜索、创造和获得理解的重要方式。微软正在引入更丰富、更直观的答案,包括图表和图形以及更新的答案格式,帮助用户更轻松地找到所需的信息。
视觉改进 图片来源:YouTube
微软将 Bing Image Creator 集成到新的 Bing 聊天体验中,使 Bing 成为唯一能够在一个地方从聊天中生成书面和视觉内容的搜索体验。微软正在将Image Creator 扩展到 Bing 中的所有语言——超过 100 种语言,这代表着现在用户可以用母语创建图像。
图片来源:YouTube
Edge 是第一个使用 AI 的浏览器,也是唯一一个内置 Bing 的浏览器,重新设计的 Microsoft Edge 使四分之一的 Bing 聊天来自该浏览器。随着这些更改开始推出,用户将开始看到更时尚和增强的用户界面,包括流线型外观、圆角、有序的容器和半透明的视觉元素。微软还在扩展多模式功能的可能性,并开始着手将视觉搜索整合到聊天中,这样用户可以上传图片并在网络上搜索相关内容。
DoNews 尝试让新 Bing 画一幅后羿射日,它还是知道这是个神话故事的,但是画出来的图片与故事内容相差甚远,顶多可以看出来有 " 人 " 和 " 日 ",甚至有的图片画的是女性人物。
Bing 貌似并不能理解 " 蚂蚁上树 " 和美食挂钩,画出的图片跟肉末粉条毫无关系," 夫妻肺片 " 就更离谱了,甚至有点恐怖。
但多次尝试后,Bing 还是能够画的出来,而且还推荐了 " 加点花生 "、" 换成鸡肉 " 等词条。
再次尝试画人物时,笔者根据新 Bing 画出图后自动推送的词条选择了 " 画出他的心理状态 ",但 Bing 显示 " 阻止了一些字词 ",相当于 Bing 对于自己生成的步骤没办法满足。
02.
搜索效率提高,聊天更加个性化
用户目前最大的需求点,是能看聊天记录以及分享和导出,微软表示不久后用户可以从上次中断的地方继续,并返回之前的聊天记录。而使用户更方便的是在浏览网页或者搜索信息时,Bing 可以保持打开状态移到屏幕侧边栏,类似手机上的分屏。通过将以前聊天上下文带入新对话中来使聊天更加个性化的形式也正在探索中。
不久后聊天中还会添加导出和共享功能。用户可以在格式保持不变的情况下直接将其导出,以便轻松过渡到 Microsoft Word 等协作工具。
Microsoft Edge 中的聊天也将改进长文档(包括 PDF 和更长格式的网站)的摘要功能,从而使在线内容更精简,未来用户能够依靠 AI 以更少的步骤完成更多的任务。
例如你想看某部电影,Edge 中的操作会在边栏的聊天中找到并显示选项,然后从可用的地方播放你想要的电影。Edge Mobile 也会包含页面上下文,你可以在 Bing 聊天中提出与正在查看的网页相关的问题。侧边栏中的撰写功能现在还可以根据用户提供的反馈(例如语气、长度、措辞等)来写草稿。
边缘操作 图片来源:YouTube
微软还准备在 Bing 聊天体验中构建第三方插件,为开发人员创建一个平台。例如你正在 Bing 聊天中研究最新的餐厅,它将利用 OpenTable 查找和预订。或者借助 Wolfram|Alpha,创建强大的可视化效果,并在聊天中获得复杂科学、数学和人工策划的数据。
虽说还算不上非常精准和完善,新 Bing 确实能帮助用户在聊天中得到图像或资料,未来还会变得更加便捷和高效。
而人工智能和搜索引擎,以及浏览器,乃至更多应用的有机结合,也的确给我们 " 打了样 ",也希望百度等最近发力大模型的国内企业,能早日追上和做出更好的产品组合。就像李彦宏所说的:" 这取决于我们自身的努力,取决于我们把握机会的能力,取决于我们的执行力。我们的战略、人才、组织机制和文化能不能适应新的形势,我们在新的环境下能不能持续创新,生死攸关。"
国产 AI 距离 ChatGPT 有多久?李彦宏曾给出的答案是两个月。
有趣的是,3 月 16 日百度正式发布文心一言,而前一天,OpenAI 发布了 GPT-4,后一天,微软宣布将 OpenAI 的技术引入办公套件。
如今一个半月的时间即将过去,但文心一言似乎还没达到媲美 GPT-4 的水平。昨天,李彦宏在青年节的内部讲话中,为之前的说法 " 打了补丁 ":" 前一段时间我接受采访时说,我们跟 ChatGPT 的差距大约是两个月,但说实话这有点断章取义,我后面紧接着还说,这不是重点,重点是这两个月的差距我们要用多长时间才能赶上,也许很快,也许永远也赶不上。"
巧合的是,就在同一天,在百度最擅长的领域——搜索,微软宣布了一系列的升级,并宣布新 Bing(必应)现在处于开放预览阶段并且不再有候补名单,这意味着现在每个人都可以比以往更轻松地试用新 Bing 和 Edge,只需使用微软账号登录即可。新 Bing 将给用户带来更好的搜索结果、问题的答案、创建和撰写的能力,并将易用性提升到新的水平。
图片来源:Microsoft Bing
目前,国内确实在努力赶超国外的步伐,但即使是进展最快的百度,可能差距也不止两个月了。
01.
搜索结果更直观,但准确性有待加强
"Bing 将强大的大型语言模型(如 OpenAI 的 GPT-4)与我们庞大的搜索索引相结合,以获取最新、引用和对话的结果——这是你在 Bing 以外的任何地方都无法获得的。这从根本上改变了人们查找信息的方式。" 微软在官网中表示,在短短 90 天内,Bing 的每日活跃用户已超过 1 亿,Bing 移动应用的每日安装量自推出以来增长了 4 倍。
微软正在转向下一代 AI 驱动的 Bing 和 Edge,通过极大地扩展视野和功能来改变世界上最大的软件类别——搜索,微软将其视为客户的 Web 副驾驶。下一代的定义是:
通过从有限预览转变为开放预览并消除试用候补名单,向更多人开放 Bing。
从纯文本搜索和聊天转变为具有丰富图像 / 视频答案的更加直观的搜索和聊天,并且即将推出新的多模式支持。
从单一使用的聊天 / 搜索会话转变为具有聊天历史记录和 Edge 中持久聊天的多会话生产力体验。
开放平台功能,以便开发人员和第三方可以在 Bing 之上构建,帮助人们对他们的查询采取行动并完成任务。
据微软的研究,人类大脑处理视觉信息的速度比文本快 60000 倍,这使得视觉工具成为人们搜索、创造和获得理解的重要方式。微软正在引入更丰富、更直观的答案,包括图表和图形以及更新的答案格式,帮助用户更轻松地找到所需的信息。
视觉改进 图片来源:YouTube
微软将 Bing Image Creator 集成到新的 Bing 聊天体验中,使 Bing 成为唯一能够在一个地方从聊天中生成书面和视觉内容的搜索体验。微软正在将Image Creator 扩展到 Bing 中的所有语言——超过 100 种语言,这代表着现在用户可以用母语创建图像。
图片来源:YouTube
Edge 是第一个使用 AI 的浏览器,也是唯一一个内置 Bing 的浏览器,重新设计的 Microsoft Edge 使四分之一的 Bing 聊天来自该浏览器。随着这些更改开始推出,用户将开始看到更时尚和增强的用户界面,包括流线型外观、圆角、有序的容器和半透明的视觉元素。微软还在扩展多模式功能的可能性,并开始着手将视觉搜索整合到聊天中,这样用户可以上传图片并在网络上搜索相关内容。
图片来源:Microsoft Bing
DoNews 尝试让新 Bing 画一幅后羿射日,它还是知道这是个神话故事的,但是画出来的图片与故事内容相差甚远,顶多可以看出来有 " 人 " 和 " 日 ",甚至有的图片画的是女性人物。
图片来源:Microsoft Bing
Bing 貌似并不能理解 " 蚂蚁上树 " 和美食挂钩,画出的图片跟肉末粉条毫无关系," 夫妻肺片 " 就更离谱了,甚至有点恐怖。
图片来源:Microsoft Bing
但多次尝试后,Bing 还是能够画的出来,而且还推荐了 " 加点花生 "、" 换成鸡肉 " 等词条。
图片来源:Microsoft Bing
再次尝试画人物时,笔者根据新 Bing 画出图后自动推送的词条选择了 " 画出他的心理状态 ",但 Bing 显示 " 阻止了一些字词 ",相当于 Bing 对于自己生成的步骤没办法满足。
图片来源:Microsoft Bing
02.
搜索效率提高,聊天更加个性化
用户目前最大的需求点,是能看聊天记录以及分享和导出,微软表示不久后用户可以从上次中断的地方继续,并返回之前的聊天记录。而使用户更方便的是在浏览网页或者搜索信息时,Bing 可以保持打开状态移到屏幕侧边栏,类似手机上的分屏。通过将以前聊天上下文带入新对话中来使聊天更加个性化的形式也正在探索中。
图片来源:YouTube
不久后聊天中还会添加导出和共享功能。用户可以在格式保持不变的情况下直接将其导出,以便轻松过渡到 Microsoft Word 等协作工具。
Microsoft Edge 中的聊天也将改进长文档(包括 PDF 和更长格式的网站)的摘要功能,从而使在线内容更精简,未来用户能够依靠 AI 以更少的步骤完成更多的任务。
例如你想看某部电影,Edge 中的操作会在边栏的聊天中找到并显示选项,然后从可用的地方播放你想要的电影。Edge Mobile 也会包含页面上下文,你可以在 Bing 聊天中提出与正在查看的网页相关的问题。侧边栏中的撰写功能现在还可以根据用户提供的反馈(例如语气、长度、措辞等)来写草稿。
边缘操作 图片来源:YouTube
微软还准备在 Bing 聊天体验中构建第三方插件,为开发人员创建一个平台。例如你正在 Bing 聊天中研究最新的餐厅,它将利用 OpenTable 查找和预订。或者借助 Wolfram|Alpha,创建强大的可视化效果,并在聊天中获得复杂科学、数学和人工策划的数据。
虽说还算不上非常精准和完善,新 Bing 确实能帮助用户在聊天中得到图像或资料,未来还会变得更加便捷和高效。
而人工智能和搜索引擎,以及浏览器,乃至更多应用的有机结合,也的确给我们 " 打了样 ",也希望百度等最近发力大模型的国内企业,能早日追上和做出更好的产品组合。就像李彦宏所说的:" 这取决于我们自身的努力,取决于我们把握机会的能力,取决于我们的执行力。我们的战略、人才、组织机制和文化能不能适应新的形势,我们在新的环境下能不能持续创新,生死攸关。"