谷歌黑科技:用眼镜告别学外语,在家能沉浸式旅游

今日头条
Toutiao
最新回复:2022年5月13日 6点40分 PT
  返回列表
67144 阅读
13 评论
量子位

谷歌又用AI来炸场子了,还是直接塞到手机App里的那种。

现在,在地图软件里,你不仅能3D看街景,连餐馆内部都能无缝“进入”。

地图还会将实时交通、天气等信息叠加到你想去的地方,属实是一把子沉浸式体验了。

而这,还只是今年谷歌I/O大会的冰山一角。

谷歌CEO皮猜还在现场祭出了这样一个“法宝”:

不错,时隔10年,谷歌再战AR眼镜。

这次的概念产品外观上不像上次那样前卫,但功能上依旧未来感拉满。

带上它就能把听到的外语翻译出来,以文字的形式融合到现实场景中,也难怪这位试戴者一脸不可思议状。

戴上眼镜后的第一视角看起来是这样的:

两个说着不同语言的人无障碍聊天,同时还不耽误眼神交流。

谷歌AI掌门人Jeff Dean把这个功能形容为:给世界加上字幕。

有网友认为,像这样把人与人连接在一起是科技最好的一面。

有听力障碍的网友则表示,我现在立刻马上就要这个。

像这样用AI技术推动一个个产品脱胎换骨,正是这次I/O大会的主线。

包括但不限于:

给真实世界加上“Ctrl + F”的多模态搜索;

谷歌翻译新增支持24种语言,并且采用新的单语机器学习方法,可以在没有现成翻译参考的情况下,直接去学习翻译新语言且质量达标;

更加强大的AI聊天机器人;

具体详情,我们一起来看。

更多AI应用炸场

搜索这个老牌业务,如今在图文多模态技术加持下焕然一新。

如果偶然看到让你流口水的美食,现在不光可以用图片搜出菜名,只需再加上“在我附近”的提示词就能一键直达相关餐厅。

如果在超市货架上挑巧克力挑花眼,现在掏出手机就能让商品评分一览无余,还能按关键词筛选出“黑巧克力”以及“不含坚果成分”。

给现实世界加上“Ctrl+F”。

来自谷歌旗下Deepmind的文字+音频+视频的多模态理解和生成技术,也落地到了全球最大视频网站Youtube。

用AI给视频自动分出章节和生成描述,让观看者可以一键直达感兴趣的部分,也为内容创作者节省大量时间。

聊天机器人也靠不断进步的AI大模型能力得到新的突破。

如去年首发的对话模型LaMDA,今年已升级到2代,并且开放了Demo体验。

首批开放的三个功能中第一个是“想象”,可以要求AI设想一个不存在的场景,并在互动中不断深入下去,帮人类在创意活动中获得更多灵感。

此外还有“计划清单”,和“随便聊聊”。

前者可以告诉你要完成一个目标需要哪些步骤。后者则是看看AI到底脑洞有多大。

用新一代AI架构Pathway训练出来的5400亿参数大模型PaLM通过“思考过程提示”获得更准确的逻辑推理能力,减少AI生成内容中的错误和胡言乱语。

远程办公大趋势下,谷歌Workspace也上新了AI能力帮人类提高工作效率。

对一篇文档自动生成摘要已是“基操勿6”,对一段聊天记录生产总结减少“爬楼”则更让人眼前一亮。

最后,支撑上面这些AI能力落地的是大型AI计算中心。

谷歌这次宣布,美国俄克拉何马州的全球最大开放机器学习中心正式对外开放。

搭载8个Cloud TPU v4 Pods集群,提供每秒900亿亿次浮点运算的峰值算力,并且所用的90%能源都是无碳绿色能源。

谷歌新品很苹果

讲完酷炫的AI,本次I/O大会重磅发布的还有一系列硬件产品。

刚才说到,谷歌的数据中心拥有高度定制化的TPU芯片,而在移动端,其智能手机新品Pixel 6a也搭载了谷歌自家的Tensor芯片。

去年,Pixel 6和Pixel 6 Pro已经搭载了该款SoC。谷歌表示,这将让手机更直接地发挥出谷歌语音识别等AI技术的能力。

根据Anandtech的测试,从跑分上来看,初代Tensor性能接近骁龙888。

△图源:AnandTech

而此前备受关注的第二代Tensor芯片的消息,也在I/O大会上有所透露:将配备到今年秋天推出的Pixel 7系列上。

至于具体性能,就只能拭目以待了。

另外,谷歌还发布了首款智能手表Pixel Watch。

此设备主要由去年谷歌花21亿美元收购的Fitbit开发。

以及首款主动降噪蓝牙耳机Pixel Buds Pro。

再加上同样搭载Tensor芯片的平板电脑产品消息的释出,以及安卓13设备“手机复制、平板粘贴”的新功能,谷歌这一波全家桶更新,多少是有点苹果内味儿了(手动狗头)。

当然,这样的变化也是不少网友喜闻乐见的:

谷歌生态终于好起来了。

受疫情影响,经历一年停办、一年全程线上举办之后,谷歌I/O大会终于再次回归线下。

简单总结一下,这一次的谷歌I/O大会,看似乱花迷人眼,但核心的主旨也很明确了。

用谷歌自己的话说,就是基于知识和计算,来让产品变得更有用。

那么,作为世界上最受关注的开发者大会之一,今年的谷歌I/O大会你觉得够分量吗?

1-5分,评论区打分走起~

[1]https://mp.weixin.qq.com/s/LROdPhenTe_AIsU88FEXZw

[2]https://blog.google/products/maps/three-maps-updates-io-2022/

[3]https://www.theverge.com/2022/5/11/23066813/google-io-2022-live-blog-keynote-announcements-android-pixel-watch?scrolla=5eb6d68b7fedc32c19ef33b4

d
diao4
1 楼
上次那个可以帮你约appointment的智能语音弄出来没有啊,在这吹啥牛逼啊,之前的那个Google glasses还没死心啊,又搞一个
滤霸
2 楼
功能是不错,问题是没有强大的网络网速支持是否能用.
敞开裤裆任风吹
3 楼
上次可以说 理念有点超前。 现在天时是有了,不过无论如何穿戴设备的 电源始终还是个问题, 大量的信息捕捉与交互(假设不涉及过多的本本地计算)。 电源方面目前说还是有点勉强。 这个趋势总是会越来越大,现在各个手机厂商都有 现实增强的外设了
j
jeffg
4 楼
回复[[1]] 人类社会的进步就是基于不断的试错和失败,也就是短短几年前SpaceX的猎鹰还不断的爆炸,今天人们对火箭垂直回收已经习以为常了。谷歌这次展示的技术绝对代表了科技最美好的一面。
意见没
5 楼
先别瞎吹了!先把google translate做好再说吧?为了省事儿,俺经常使用google translate翻译一些东西,结果很多比较常见的说法就tnnd翻译的惨不忍睹!🤣
z
zzmmaall
6 楼
讲真的,啥时候有个100%精准的翻译AI,那才叫绝杀。比啥装逼骗钱的眼镜APP手机要好一万倍。
城市沉睡
7 楼
这玩意费眼睛。
n
novice
8 楼
告别学外语……?!靠胡说八道的机械翻译交流吗?
风清杨
9 楼
谷歌的东西都是吹半天,拿来一用,发现就是个渣
k
killer2013
10 楼
语言里本来就很多一词多意,语带双关,你让翻译软件给你翻翻什么是73 ,什么是姓赵的。哈哈
h
hnhzb
11 楼
思路是不错的,这些做法也给元宇宙出了点主意。虚拟和现实的结合,最终服务于大众才是出路。 比谈谈叫喊meta 整不出产品的小渣强多了。不过谷歌能做成啥样还有待观察。他的产品创意很多,一次成型的很少,都是长时间市场磨合才能出菜。
随意岁月
12 楼
智障AI,什么都要掌握的谷歌,连个自驾到现在都搞不定,还想要干掉翻译官
d
diao4
13 楼
可以尝试失败,但是请不要拿还没有试过错的产品出来吹牛逼,不要跟我提特斯拉,自动驾驶年年都是明年才实现,第一批特斯拉买了自动驾驶基本上车也快报废了,还没开上自动驾驶