谷歌黑科技:用眼镜告别学外语,在家能沉浸式旅游 - 2022年5月13日 / 头条新闻

量子位

大约 3 年前

谷歌又用AI来炸场子了，还是直接塞到手机App里的那种。

现在，在地图软件里，你不仅能3D看街景，连餐馆内部都能无缝“进入”。

地图还会将实时交通、天气等信息叠加到你想去的地方，属实是一把子沉浸式体验了。

而这，还只是今年谷歌I/O大会的冰山一角。

谷歌CEO皮猜还在现场祭出了这样一个“法宝”：

不错，时隔10年，谷歌再战AR眼镜。

这次的概念产品外观上不像上次那样前卫，但功能上依旧未来感拉满。

带上它就能把听到的外语翻译出来，以文字的形式融合到现实场景中，也难怪这位试戴者一脸不可思议状。

戴上眼镜后的第一视角看起来是这样的：

两个说着不同语言的人无障碍聊天，同时还不耽误眼神交流。

谷歌AI掌门人Jeff Dean把这个功能形容为：给世界加上字幕。

有网友认为，像这样把人与人连接在一起是科技最好的一面。

有听力障碍的网友则表示，我现在立刻马上就要这个。

像这样用AI技术推动一个个产品脱胎换骨，正是这次I/O大会的主线。

包括但不限于：

给真实世界加上“Ctrl + F”的多模态搜索；

谷歌翻译新增支持24种语言，并且采用新的单语机器学习方法，可以在没有现成翻译参考的情况下，直接去学习翻译新语言且质量达标；

更加强大的AI聊天机器人；

具体详情，我们一起来看。

更多AI应用炸场

搜索这个老牌业务，如今在图文多模态技术加持下焕然一新。

如果偶然看到让你流口水的美食，现在不光可以用图片搜出菜名，只需再加上“在我附近”的提示词就能一键直达相关餐厅。

如果在超市货架上挑巧克力挑花眼，现在掏出手机就能让商品评分一览无余，还能按关键词筛选出“黑巧克力”以及“不含坚果成分”。

给现实世界加上“Ctrl+F”。

来自谷歌旗下Deepmind的文字+音频+视频的多模态理解和生成技术，也落地到了全球最大视频网站Youtube。

用AI给视频自动分出章节和生成描述，让观看者可以一键直达感兴趣的部分，也为内容创作者节省大量时间。

聊天机器人也靠不断进步的AI大模型能力得到新的突破。

如去年首发的对话模型LaMDA，今年已升级到2代，并且开放了Demo体验。

首批开放的三个功能中第一个是“想象”，可以要求AI设想一个不存在的场景，并在互动中不断深入下去，帮人类在创意活动中获得更多灵感。

此外还有“计划清单”，和“随便聊聊”。

前者可以告诉你要完成一个目标需要哪些步骤。后者则是看看AI到底脑洞有多大。

用新一代AI架构Pathway训练出来的5400亿参数大模型PaLM通过“思考过程提示”获得更准确的逻辑推理能力，减少AI生成内容中的错误和胡言乱语。

远程办公大趋势下，谷歌Workspace也上新了AI能力帮人类提高工作效率。

对一篇文档自动生成摘要已是“基操勿6”，对一段聊天记录生产总结减少“爬楼”则更让人眼前一亮。

最后，支撑上面这些AI能力落地的是大型AI计算中心。

谷歌这次宣布，美国俄克拉何马州的全球最大开放机器学习中心正式对外开放。

搭载8个Cloud TPU v4 Pods集群，提供每秒900亿亿次浮点运算的峰值算力，并且所用的90%能源都是无碳绿色能源。

谷歌新品很苹果

讲完酷炫的AI，本次I/O大会重磅发布的还有一系列硬件产品。

刚才说到，谷歌的数据中心拥有高度定制化的TPU芯片，而在移动端，其智能手机新品Pixel 6a也搭载了谷歌自家的Tensor芯片。

去年，Pixel 6和Pixel 6 Pro已经搭载了该款SoC。谷歌表示，这将让手机更直接地发挥出谷歌语音识别等AI技术的能力。

根据Anandtech的测试，从跑分上来看，初代Tensor性能接近骁龙888。

△图源：AnandTech

而此前备受关注的第二代Tensor芯片的消息，也在I/O大会上有所透露：将配备到今年秋天推出的Pixel 7系列上。

至于具体性能，就只能拭目以待了。

另外，谷歌还发布了首款智能手表Pixel Watch。

此设备主要由去年谷歌花21亿美元收购的Fitbit开发。

以及首款主动降噪蓝牙耳机Pixel Buds Pro。

再加上同样搭载Tensor芯片的平板电脑产品消息的释出，以及安卓13设备“手机复制、平板粘贴”的新功能，谷歌这一波全家桶更新，多少是有点苹果内味儿了（手动狗头）。

当然，这样的变化也是不少网友喜闻乐见的：

谷歌生态终于好起来了。

受疫情影响，经历一年停办、一年全程线上举办之后，谷歌I/O大会终于再次回归线下。

简单总结一下，这一次的谷歌I/O大会，看似乱花迷人眼，但核心的主旨也很明确了。

用谷歌自己的话说，就是基于知识和计算，来让产品变得更有用。

那么，作为世界上最受关注的开发者大会之一，今年的谷歌I/O大会你觉得够分量吗？

1-5分，评论区打分走起~

[1]https://mp.weixin.qq.com/s/LROdPhenTe_AIsU88FEXZw

[2]https://blog.google/products/maps/three-maps-updates-io-2022/

[3]https://www.theverge.com/2022/5/11/23066813/google-io-2022-live-blog-keynote-announcements-android-pixel-watch?scrolla=5eb6d68b7fedc32c19ef33b4

diao4

大约 3 年

1 楼

上次那个可以帮你约appointment的智能语音弄出来没有啊，在这吹啥牛逼啊，之前的那个Google glasses还没死心啊，又搞一个

滤

滤霸

2 楼

功能是不错,问题是没有强大的网络网速支持是否能用.

敞

敞开裤裆任风吹

3 楼

上次可以说理念有点超前。现在天时是有了，不过无论如何穿戴设备的电源始终还是个问题，大量的信息捕捉与交互（假设不涉及过多的本本地计算）。电源方面目前说还是有点勉强。这个趋势总是会越来越大，现在各个手机厂商都有现实增强的外设了

jeffg

4 楼

回复[[1]] 人类社会的进步就是基于不断的试错和失败，也就是短短几年前SpaceX的猎鹰还不断的爆炸，今天人们对火箭垂直回收已经习以为常了。谷歌这次展示的技术绝对代表了科技最美好的一面。

意

意见没

5 楼

先别瞎吹了！先把google translate做好再说吧？为了省事儿，俺经常使用google translate翻译一些东西，结果很多比较常见的说法就tnnd翻译的惨不忍睹！🤣

zzmmaall

6 楼

讲真的，啥时候有个100%精准的翻译AI，那才叫绝杀。比啥装逼骗钱的眼镜APP手机要好一万倍。

城

城市沉睡

7 楼

这玩意费眼睛。

novice

8 楼

告别学外语……？！靠胡说八道的机械翻译交流吗？

风

风清杨

9 楼

谷歌的东西都是吹半天，拿来一用，发现就是个渣

killer2013

10 楼

语言里本来就很多一词多意，语带双关，你让翻译软件给你翻翻什么是73 ，什么是姓赵的。哈哈

hnhzb

11 楼

思路是不错的，这些做法也给元宇宙出了点主意。虚拟和现实的结合，最终服务于大众才是出路。比谈谈叫喊meta 整不出产品的小渣强多了。不过谷歌能做成啥样还有待观察。他的产品创意很多，一次成型的很少，都是长时间市场磨合才能出菜。

随

随意岁月

12 楼

智障AI，什么都要掌握的谷歌，连个自驾到现在都搞不定，还想要干掉翻译官

13 楼

可以尝试失败，但是请不要拿还没有试过错的产品出来吹牛逼，不要跟我提特斯拉，自动驾驶年年都是明年才实现，第一批特斯拉买了自动驾驶基本上车也快报废了，还没开上自动驾驶