继昨日 ChatGPT 全面登陆苹果全家桶之后,OpenAI 又带来了重磅更新。
今天,ChatGPT 推出了视频通话和屏幕共享功能以及一款圣诞老人限定语音「Santa Mode」。
也就是说,现在 ChatGPT 不仅伶牙俐齿,还能「睁眼看世界」。遇事不决,直接给 ChatGPT 打「视频通话」,或许它能够更好地帮助你解决问题。
这些功能将在未来一周内推送给所有 Team 用户和大部分 Plus 和 Pro 订阅用户。欧盟地区的付费用户还需要再等等。
支持 50 多种语言的 ChatGPT 将能够实时理解视觉场景,帮助你解决问题,甚至化身 AI 导师教你掌握新事物。
在这场同样不到 20 分钟的发布会上,由 OpenAI 首席产品官 Kevin Weil、Jackie Shannon、Michelle Qin 和 Rowan Zellers 等人向我们展示长了「眼睛」的 ChatGPT 究竟能干些什么?
比如说,当你入手了一套手冲咖啡设备却不知从何入门时,不妨给 ChatGPT 打一通「视频通话」。
它就能根据你面前的器具,手把手教你完成每一个步骤,从放置滤纸、倒热水、将磨好的咖啡粉放入滤纸中等等,包教包会。
卡壳了?随时提问 GPT 老师。这位 AI 老师不仅有问必答,偶尔还会人性化地给予鼓励,情绪价值拉满。
除了实时视频指导,ChatGPT 还支持屏幕共享功能。用户只需点击右下角的高级语音模式图标,在下拉菜单中选择分享屏幕,就能获得针对性的帮助。
当「看」到朋友穿着圣诞老人的装扮,调侃是否有资格应聘购物中心的圣诞老人岗位时,GPT 老师会给出得体的措辞建议以及高情商的鼓励。
嘿,Kevin,你的圣诞老人服装很有节日气氛。或许继续练习你的「Ho Ho Ho」,很快就能成为购物中心的圣诞老人了。
实际上,OpenAI 总裁 Greg Brockman 前不久也与安德森·库珀(Anderson Cooper)利用带视觉功能的 ChatGPT 进行了关于人体解剖学的知识小测验。
当库珀在黑板上画出身体部位时,ChatGPT 能够瞬间「理解」他所画的内容。
「位置非常到位,大脑就在头部那里。至于形状,这是一个不错的开始,但大脑更像是一个椭圆形。」甚至,ChatGPT 还能用英式口音演唱三角形面积公式。
但后续 ChatGPT 处理几何问题时却出现明显的纰漏,没能发现一个简单的标注错误,在理解平面几何的能力上仍有许多提升空间。
为了迎接圣诞的到来,OpenAI 还特别推出了「圣诞老人」预设语音,用户只需点击主屏幕上的雪花图标,就能和 ChatGPT 圣诞老人聊天。
比如让圣诞老人讲个故事。
不得不说,每次「圣诞老人」开口的「Ho Ho Ho~」相当魔性,听着就很有节日气氛。
在直播活动过程中,主持人也向这位「圣诞老人」询问几个问题,包括但不限于最喜欢的圣诞传统、最喜欢的驯鹿等等。
有趣的是,当 Kevin Weil 戴上圣诞老人的假胡子询问如何保养时,给出建议的 ChatGPT 还会用圣诞老人的口吻回应道:
「朋友,这是我见过的最威武的胡子。」
这款语音将在今天推出,而为了让每个用户都能充分体验这个节日彩蛋,首次体验时 OpenAI 会重置用户的高级语音使用次数,即使用完额度,用户也能继续通过标准语音模式与「圣诞老人」互动。
或许是因为发布会战线拉得太长,网友的吐槽声也聚焦到了这款圣诞老人语音上。最典型的例子当属 X 网友@khoomeik。
Google Deepmind 研究科学家 Jonas Adler 更是直接呛声 OpenAI:
OpenAI 总能迅速对我们发布的产品做出回应,而且似乎总能在同一时间发布,这令人感到神奇。然而,我对他们将 Santa 模式作为对 Gemini 2.0 的回应并不太感冒,因为它似乎缺乏与 Gemini 2.0 相匹配的重要性和严肃性。
值得一提的是,昨天,Google 抢先一步推出了具备视觉理解能力的 AI 产品,能够理解并解析用户所处的实际场景,且收获网友的一众好评。
到了今天,OpenAI 也紧随其后,为 ChatGPT 装上了「眼睛」,这也意味着 ChatGPT 从相对单一的模态,进一步拓展至「视觉—语言多模态理解」。
换言之,ChatGPT 将不再局限于用户输入的文字指令与信息,而是能够通过视觉来理解用户所处的上下文环境,包括电脑屏幕上的页面、手机摄像头所捕捉的影像、甚至其他外设的实时画面。
如果说半个世纪前,施乐 PARC 实验室的科学家们幻想过一台能看懂人类行为的计算机。今天 AI 的发展,正在把这个梦想变成了显示器之外的现实。
从纸到键盘,从二进制到自然语言,人类一直在简化与机器的沟通方式。而 ChatGPT 的视觉能力也让我们看到了终极答案,那就是让机器像人一样「看」这个世界。
考虑到 Altman 和前苹果首席设计官 Jony Ive 一直在开发智能 AI 硬件设备,我更期待看到这项功能出现在这款新硬件上。
继昨日 ChatGPT 全面登陆苹果全家桶之后,OpenAI 又带来了重磅更新。
今天,ChatGPT 推出了视频通话和屏幕共享功能以及一款圣诞老人限定语音「Santa Mode」。
也就是说,现在 ChatGPT 不仅伶牙俐齿,还能「睁眼看世界」。遇事不决,直接给 ChatGPT 打「视频通话」,或许它能够更好地帮助你解决问题。
这些功能将在未来一周内推送给所有 Team 用户和大部分 Plus 和 Pro 订阅用户。欧盟地区的付费用户还需要再等等。
支持 50 多种语言的 ChatGPT 将能够实时理解视觉场景,帮助你解决问题,甚至化身 AI 导师教你掌握新事物。
在这场同样不到 20 分钟的发布会上,由 OpenAI 首席产品官 Kevin Weil、Jackie Shannon、Michelle Qin 和 Rowan Zellers 等人向我们展示长了「眼睛」的 ChatGPT 究竟能干些什么?
比如说,当你入手了一套手冲咖啡设备却不知从何入门时,不妨给 ChatGPT 打一通「视频通话」。
它就能根据你面前的器具,手把手教你完成每一个步骤,从放置滤纸、倒热水、将磨好的咖啡粉放入滤纸中等等,包教包会。
卡壳了?随时提问 GPT 老师。这位 AI 老师不仅有问必答,偶尔还会人性化地给予鼓励,情绪价值拉满。
除了实时视频指导,ChatGPT 还支持屏幕共享功能。用户只需点击右下角的高级语音模式图标,在下拉菜单中选择分享屏幕,就能获得针对性的帮助。
当「看」到朋友穿着圣诞老人的装扮,调侃是否有资格应聘购物中心的圣诞老人岗位时,GPT 老师会给出得体的措辞建议以及高情商的鼓励。
嘿,Kevin,你的圣诞老人服装很有节日气氛。或许继续练习你的「Ho Ho Ho」,很快就能成为购物中心的圣诞老人了。
实际上,OpenAI 总裁 Greg Brockman 前不久也与安德森·库珀(Anderson Cooper)利用带视觉功能的 ChatGPT 进行了关于人体解剖学的知识小测验。
当库珀在黑板上画出身体部位时,ChatGPT 能够瞬间「理解」他所画的内容。
「位置非常到位,大脑就在头部那里。至于形状,这是一个不错的开始,但大脑更像是一个椭圆形。」甚至,ChatGPT 还能用英式口音演唱三角形面积公式。
但后续 ChatGPT 处理几何问题时却出现明显的纰漏,没能发现一个简单的标注错误,在理解平面几何的能力上仍有许多提升空间。
为了迎接圣诞的到来,OpenAI 还特别推出了「圣诞老人」预设语音,用户只需点击主屏幕上的雪花图标,就能和 ChatGPT 圣诞老人聊天。
比如让圣诞老人讲个故事。
不得不说,每次「圣诞老人」开口的「Ho Ho Ho~」相当魔性,听着就很有节日气氛。
在直播活动过程中,主持人也向这位「圣诞老人」询问几个问题,包括但不限于最喜欢的圣诞传统、最喜欢的驯鹿等等。
有趣的是,当 Kevin Weil 戴上圣诞老人的假胡子询问如何保养时,给出建议的 ChatGPT 还会用圣诞老人的口吻回应道:
「朋友,这是我见过的最威武的胡子。」
这款语音将在今天推出,而为了让每个用户都能充分体验这个节日彩蛋,首次体验时 OpenAI 会重置用户的高级语音使用次数,即使用完额度,用户也能继续通过标准语音模式与「圣诞老人」互动。
或许是因为发布会战线拉得太长,网友的吐槽声也聚焦到了这款圣诞老人语音上。最典型的例子当属 X 网友@khoomeik。
Google Deepmind 研究科学家 Jonas Adler 更是直接呛声 OpenAI:
OpenAI 总能迅速对我们发布的产品做出回应,而且似乎总能在同一时间发布,这令人感到神奇。然而,我对他们将 Santa 模式作为对 Gemini 2.0 的回应并不太感冒,因为它似乎缺乏与 Gemini 2.0 相匹配的重要性和严肃性。
值得一提的是,昨天,Google 抢先一步推出了具备视觉理解能力的 AI 产品,能够理解并解析用户所处的实际场景,且收获网友的一众好评。
到了今天,OpenAI 也紧随其后,为 ChatGPT 装上了「眼睛」,这也意味着 ChatGPT 从相对单一的模态,进一步拓展至「视觉—语言多模态理解」。
换言之,ChatGPT 将不再局限于用户输入的文字指令与信息,而是能够通过视觉来理解用户所处的上下文环境,包括电脑屏幕上的页面、手机摄像头所捕捉的影像、甚至其他外设的实时画面。
如果说半个世纪前,施乐 PARC 实验室的科学家们幻想过一台能看懂人类行为的计算机。今天 AI 的发展,正在把这个梦想变成了显示器之外的现实。
从纸到键盘,从二进制到自然语言,人类一直在简化与机器的沟通方式。而 ChatGPT 的视觉能力也让我们看到了终极答案,那就是让机器像人一样「看」这个世界。
考虑到 Altman 和前苹果首席设计官 Jony Ive 一直在开发智能 AI 硬件设备,我更期待看到这项功能出现在这款新硬件上。