微软吹响 AI 集结号:全面打通 ChatGPT 携手冲击谷歌

A
Adalalala
楼主 (北美华人网)
回来了,都回来了。疫情一页已经翻过,科技大厂的年度大会今年全面回归线下。继两周之前谷歌总部举办 I / O 开发者大会之后,微软 Build 开发者大会今天也在总部西雅图开幕。两周之后,苹果 WWDC 开发者大会也将在硅谷总部召开。


(与OpenAI全面合作是今年Build大会的主题)
实际上,去年苹果 WWDC 就已经部分恢复线下举办,但今年的 Build 大会则是自 2019 年之后首次回归线下举办。此前两年在线收看主题演讲之后,今年微软生态平台的开发者可以再次回到西雅图,近距离聆听微软高管,并与技术专家交流。当然,门票价格也高达 1525 美元。
两周前的谷歌 I / O 大会,生成式 AI 成为了绝对主题。而以往的主角 Android 直到 80 分钟之后才姗姗来迟,而且是简要带过。两个小时的主题演讲,谷歌高管一共说了 140 多次 AI。虽然谷歌只提到一次 OpenAI,但所有人都清楚,今年 I / O 大会的最大目的就是证明谷歌依然拥有强大竞争力,可以应对 ChatGPT 和微软带来的冲击力。
今年的 I / O 已经成为了谷歌的 AI 汇报展示。谷歌连续发布了 15 款功能覆盖诸多领域的 AI 产品,其中最为重要的就是新的语言训练模型 PaLM 2 以及基于新模型提升功能的生成式 AI Bard。谷歌以此对旗下几乎所有产品进行了 AI 体验改造:从搜索到地图到邮件到办公组件,诸如此类不胜枚举。
而今天的微软 Build 大会,AI 同样也成为唯一焦点。微软 CEO 纳德拉一登台就高度聚焦 AI,宣布为开发者带来 50 多项更新。今天发布的所有新品,都贯穿着明白无误的战略:微软正全力以赴推进自家 AI,并将 ChatGPT 与自家产品全面打通,强化自己在生产力领域的优势,并在搜索领域对谷歌施加更大的压力。
今天微软 Build 大会宣布了哪些重大产品和更新?
打通 ChatGPT 插件
今天最重要的消息是微软宣布采用与 OpenAI 相同的开放插件 Plugin 标准,打通了 ChatGPT 和微软两个平台之间的互通与相互操作,实现了产品与服务的互通。未来开发者的插件都可以同时支持 ChatGPT 和微软的产品与服务。
这意味着微软庞大的开发者群体在 Azure OpenAI 企业服务上开发的 AI 程序,也支持同样的开发插件标准。开发者可以选择人类自然语言交互,作为其软件的互动方式。换句话说,他们的软件和应用都能得到生成式 AI 的体验。
而插件则是 AI 应用开发的关键一环,开发者需要通过 API 接口接入其他软件服务的实时信息与业务数据。插件能给 AI 带来新的计算能力。
在微软与 OpenAI 打通标准之后,开发者可通过“插件”将应用和服务接入 Microsoft 365 Copilot。首批支持的插件包括 ChatGPT、Teams 信息扩展、Power Platform 连接器等,开发者可以直接接入现有服务,也可使用 Visual Studio Code 和 Visual Studio 上的 Microsoft Teams Toolkit 开发工具,轻松开发新的 Microsoft 365 Copilot 插件。
开发者还可以将数据导入 Microsoft Graph,通过近期发布的 Semantic Index for Copilot 语义索引功能构建关联性与行动信息,从而进一步拓展 Microsoft 365 Copilot 的功能。公测期间将首先提供超过 50 个来自 Atlassian、Adobe、ServiceNow、Thomson Reuters、Moveworks、Mural 等合作伙伴的插件,在 Microsoft 365 Copilot 正式发布时,将有数千个插件可供选择。

Windows 11 加入 AI 助手
对消费用户来说,今天 Build 发布的最重要产品则是 Windows 11 引入生成式 AI 助手 Windows Copilot。与此前的智能语音助手 Cortana 相比,Copilot 不仅智能程度高出了一个级别,系统权限也得到了显著提升。
Copilot 是微软今年发布的战略产品,又被翻译为“智能副驾”。微软和 OpenAI 深入合作,在 Microsoft 365、Dynamics 365 以及 Power Platform 等产品上推出了 AI 助手 Copilot,这是基于大语言模型进行训练的,基于自然语言理解和生成的人机交互体验。
Windows 11 的任务栏将接入 Copliot 图标。用户点击图标就会在屏幕右侧出现 Copilot 对话框,对当前正在使用的应用和网页内容进行分析解释归纳。当然,这个助手也可以完成用户的诸多指令,包括网络搜索订票等服务。
Windows Copilot 目前还在测试阶段。微软计划 6 月开始正式公测,逐步推广给所有的 Windows 11 用户。目前 Windows 10 和 11 的全球月活设备超过了 14 亿部。
除了 Copilot 这一重大更新之外,Windows 11 还加入 10 种新语言与方言的实时字幕支持,并且可以实时进行音频听抄处理。自然语言处理本身就是微软的技术强项。此外,Windows 11 还支持了低功耗蓝牙技术 Bluetooth lE,享受高品质音频的同时降低功耗。


首个 AI 支持浏览器
除了在 Windows 11 加入 Copilot 之外,微软还在 Edge 浏览器引入了 365 Copilot 功能。这是首个原生支持 AI 的浏览器。Edge 浏览器的侧边栏会出现 Copilot 工具图标,对用户正在浏览的网页内容进行分析,帮助用户生成 Word、Excel 等 Windows 365 文档,或用于撰写 Outlook 邮件。
Edge for Business 商用浏览器支持更多企业管理、安全、隐私和生产力功能,以更好地满足混合办公的需求,面向托管设备的版本现已开启预览,非托管版本将在未来几个月内推出。此外,支持多用户协同工作的 Edge Workspaces 也将在几个月内结束预览,推出正式商用版本。
Statcounter 的统计数据显示,今年 4 月 Chrome 浏览器的市场份额高达 66%,而苹果 Safari 和微软 Edge 浏览器则以 11% 的市场份额并列二三位。微软希望与 ChatGpt 携手,将生成式 AI 带入 Edge 浏览器可以帮助 Edge 缩小与 Chrome 的差距,给谷歌带来真正的冲击。

Windows 应用商店也迎来了 AI 体验升级,加入 AI 生成的用户评价总结。除了传统的用户评分之外,应用展示拦还会出现 AI 根据用户评价生成的概要。不过,微软并没有透露 AI 是否会过滤一些人为差评。
  终端应用程序 Windows Terminal 也加入生成式 AI 功能,这是通过 GitHub Copilot 实现的。开发者使用 GitHub Copilot 就可以在 Terminal 上使用聊天机器人,要求 AI 推荐代码或者解释错误。微软还表示,WinDBG 等其他开发工具也会通过 GitHub Copilot 加入 AI 聊天机器人。Windows Terminal 是微软在 2019 年发布的虚拟终端应用程序,用户可以在 Windows 应用商店下载安装,或者通过 Github 下载代码自行安装。这一工具实现了 PowerShell、CMD 以及 WSL 三大环境的统一。


必应为 ChatGPT 联网
这是所有人意料之中的事情,微软今天正式宣布必应成为 ChatGPT 的默认搜索引擎。原本 ChatGPT 的训练数据就是由微软支持并在 Azure 云平台上进行的,但此前的训练数据只截止到 2021 年 9 月,这也是此前谷歌 Bard 相对于 ChatGPt 的最大优势。
从今天开始,ChatGPT Plus 的用户会在生成式 AI 的回复过程中看到标明来自必应搜索引擎提供的内容。换句话说,ChatGPT 已经实现了联网,可以提供实时和最新的内容。这是 ChatGPT 产品的一重大里程碑。

此外,必应还向更多的企业合作伙伴推出了插件支持。除了此前宣布的订餐平台 OpenTable 和专业搜索引擎 WolframAlpha,今天新宣布的合作企业还有出行服务平台 Expedia 和 TripAdvisor、外卖平台 Instacart、地产交易平台 Redfin 和 Zillow、信息提供商汤森路透等等。
在体验展示过程中,用户在必应中可以使用 OpenTable 的插件询问周边的餐馆信息,并让 AI 机器人为自己订桌。值得一提的是,必应移动端也会加入此类功能,这意味着 iOS 和 Android 用户也可以在必应应用体验到插件支持。
显然,微软正试图将越来越多的网络用户拉入自己的 AI 支持搜索阵营,以此与谷歌展开竞争。与服务无所不包的谷歌相比,微软最大的竞争优势是他们和这些垂直服务平台并没有直接竞争关系,因此这些商家也不需要担心微软偏向自己的服务。

更多 AI 开发工具
基于微软与 OpenAI 的深入合作,Azure OpenAI 企业服务将 ChatGPT、GPT-4 等大模型以及 Azure 的企业服务整合在一起。目前已经有 4500 多家企业用户采用 Azure OpenAI 企业服务。微软今天也在 Build 大会上宣布了诸多新的 AI 开发工具,帮助开发者基于微软和 OpenAI 的服务开发自己的 AI 加持应用。
全新发布的 Azure AI Studio,其能帮助开发者更便捷地将外部数据源整合到 Azure OpenAI 服务中,从而训练出基于自有数据的对话模型。新发布预览的 Azure AI Content Safety 能帮助开发者构建更安全的线上环境和社区,其内置模型能检测出文本或者图片中的不当内容,并通知人工监督员采取行动。这项原本用于 GitHub Copilot 等微软服务的功能,将内置于 Azure OpenAI 企业版服务开放给第三方开发者,从而以负责任的方式生成智能内容。
微软还发布了全新 Azure Machine Learning 工具,其中包括 Responsible AI dashboard support for text and image data。在公众预览版中,该功能能够让开发者在构建、训练或评估模型阶段,评估使用非结构化数据来构建的大模型。这将有助于开发者在部署模型之前发现模型错误、公平性问题以及模型解释,从而实现更具公平性的高性能计算机视觉和自然语言处理 (NLP) 模型。
Azure Machine Learning prompt flow,让开发者可以借助如 Semantic Kernel 这样热门的开源提示词编排解决方案,高效构建提示词。在即将推出的预览版中,prompt flow 为开发者提供了更加简便易用的提示、评估和调整大模型的方式。开发者能够快速创建连接到各种语言模型和数据源的提示工作流,并通过真实性等方式评估工作流质量,从而根据实际情况为其选择最佳的提示。
Prompt flow 同时还集成了 Azure AI Content Safety,帮助开发者检测并删除其工作流中有害的内容。此外,微软还宣布将在未来几个月内,在 Microsoft Designer 和 Bing Image Creator 中增加全新媒体来源功能。该技术使用加密方法对 AI 生成的内容进行标记和签名,其中包含有关其来源的元数据,从而帮助开发者验证图像或视频是否由 AI 生成。

微软 OpenAI 双赢组合
毫无疑问,与 OpenAI 深入合作是微软 AI 战略的核心,也是今天 Build 大会的主题。无论是打通与 OpenAI 的补丁边界,引入更多开发者开发拥有生成式 AI 体验加持的产品,还是将基于 ChatGPT 的 Copilot AI 助手引入自己旗下的诸多产品,都体现着两家公司密切不可分的战略合作。
投资 OpenAI 是微软 CEO 纳德拉最成功的投资,没有之一。微软不仅牢牢地将 OpenAI 绑定在自己的云服务平台,而且将 ChatGPT 与自己的 AI 产品结合,对旗下几乎所有产品进行 AI 体验改造,还迎来了弯道赶超谷歌的希望。
微软是 OpenAI 的最重要的战略股东。没有微软投资的几十亿美元和计算资源支持,OpenAI 就不可能在过去几年加速 AI 落地商用,比谷歌更快推出更为智能的生成式 AI 产品,成长为一家估值 300 亿美元的 AI 新贵。ChatGPT 去年年底的公测不仅改变了 AI 行业格局,也给原先的行业领先者谷歌施加了巨大的压力。
尽管马斯克在 OpenAI 创办过程中起到了关键的牵头作用,为这个开源非盈利研究机构吸引了足够的曝光度和人才吸引力,甚至 OpenAI 的名字也是他取的,但他对 OpenAI 的影响力也只限于前两年。从 2018 年开始,OpenAI 的研发进展就和马斯克没有任何关系,马斯克以利益冲突为由彻底退出了 OpenAI 董事会。
当时的 OpenAI 只是一个非盈利开源技术组织,资金依赖诸多超级富豪和企业巨头的捐助,而 AI 领域的研发训练和人才招聘都需要巨额资金投入。如果不进行商业化重组引入战略投资,OpenAI 根本无力和谷歌、Meta 这样的企业巨头竞争。
2019 年初,OpenAI 重组成为有限盈利机构,开始引入战略投资。微软几乎是第一时间进入,宣布投资 10 亿美元,并且将 OpenAI 的 AI 训练引入自己的云服务平台。此后四年时间,微软累计三次向 OpenAI 投入数十亿美元。过去几年,OpenAI 几乎所有的产品训练研发都是在微软的云平台上实现。
看到 OpenAI 与微软密不可分之后,马斯克成为了 OpenAI 最主要的批评者,连续抨击 OpenAI 已经被微软掌控,从一个开源非盈利机构沦为追逐利润的企业。但他的说法也遭到 OpenAI CEO 艾特曼和微软 CEO 纳德拉的公开反驳。
OpenAI 在重组过程中设置了复杂的混合结构,包括非盈利的母公司 OpenAI Inch 和有限盈利子公司 OpenAI LP。尽管微软向有限盈利子公司投资了几十亿美元,但他们并没有母公司 OpenAI Inc 的董事会席位,无法控制 OpenAI 的决策。而且 ChatGPT 并不是微软独享,也向其他诸多企业开放。
来源:新浪科技