撰文 | 李信马
题图 | 通义千问官网
昨天下午,阿里巴巴宣布开启语言大模型 " 通义千问 " 的企业邀测,正式加入大模型的竞赛中。不过对于这款产品,官方的介绍却很少,好在,DoNews 第一时间拿到了内测邀请码,让 " 通义千问 " 亲自来解答了关于它的许多问题。
通义千问是来自阿里巴巴达摩院的大规模语言模型,主要功能是生成与给定词语相关的高质量文本,以帮助用户提高创造力和创新能力。名字的意思,是可以广泛回答不同领域复杂和独特的问题。
而在开始界面中,可以看到 " 写封邮件 "" 撰写短文 "" 电影脚本 "" 职场助理 " 四个选项。
我们挨个测验了下这四个功能,首先是写邮件,我们提出需求 " 帮我向部门主管发一封邮件,因为身体不适,下周一要请病假 "。
作为对比,我们也让 chatGPT 回答了同一问题,不难看出,通义千问的回答更符合中国人的语言风格。
在职场助理选项中,我们询问 " 作为科技记者,我该如何报道人工智能的最新进展 ",有趣的是,通义千问和 chatGPT 的回答出现了明显的差异。
通义千问的回答更倾向于去 " 具体做什么 ",而 chatGPT 的回答则倾向于 " 先学习后工作 ",也算是些许的思维差异了。
除了上述的四项功能外,通义千问还有 " 百宝箱 ",里面有效率类、生活类和娱乐类的九个不同选项,可以在更细分的领域帮助使用者。
比如商品描述生成,这就很明显是针对电商卖家,以下是它对 " 天猫精灵 " 生成的描述:
生活类中,菜谱的选项比较实用,但小学生作文却有点让人摸不着头脑,难道是为了给小学生减负?
还有一个常见的选项,就是续写(然后呢),我们尝试让它续写了《了不起的盖茨比》的经典开头。
在我年纪还轻 , 阅历不深的时候,父亲曾给我一个忠告 , 我至今还念念不忘。 " 每当你想要批评任何人的时候," 他告诉我:" 要记住,世上不是每个人都有你这么好的条件。"
从结果来看,通义千问对原文的理解比较勉强,续写更是差强人意," 文学性 " 还有待进步。不过,娱乐类的三个选项,就显得人性化了许多。
我们尝试让它夸赞下 " 马云的长相 ",以下是生成的结果,似乎……也不无道理?
在最后,我们询问了通义千问对其他大规模语言模型的了解,它知道 BERT 和 GPT,但对自己却颇具信心,认为具有更优秀的性能和更丰富的应用场景。
也希望通义千问的信心,能在未来成为现实。
撰文 | 李信马
题图 | 通义千问官网
昨天下午,阿里巴巴宣布开启语言大模型 " 通义千问 " 的企业邀测,正式加入大模型的竞赛中。不过对于这款产品,官方的介绍却很少,好在,DoNews 第一时间拿到了内测邀请码,让 " 通义千问 " 亲自来解答了关于它的许多问题。
通义千问是来自阿里巴巴达摩院的大规模语言模型,主要功能是生成与给定词语相关的高质量文本,以帮助用户提高创造力和创新能力。名字的意思,是可以广泛回答不同领域复杂和独特的问题。
而在开始界面中,可以看到 " 写封邮件 "" 撰写短文 "" 电影脚本 "" 职场助理 " 四个选项。
我们挨个测验了下这四个功能,首先是写邮件,我们提出需求 " 帮我向部门主管发一封邮件,因为身体不适,下周一要请病假 "。
作为对比,我们也让 chatGPT 回答了同一问题,不难看出,通义千问的回答更符合中国人的语言风格。
在职场助理选项中,我们询问 " 作为科技记者,我该如何报道人工智能的最新进展 ",有趣的是,通义千问和 chatGPT 的回答出现了明显的差异。
通义千问的回答更倾向于去 " 具体做什么 ",而 chatGPT 的回答则倾向于 " 先学习后工作 ",也算是些许的思维差异了。
除了上述的四项功能外,通义千问还有 " 百宝箱 ",里面有效率类、生活类和娱乐类的九个不同选项,可以在更细分的领域帮助使用者。
比如商品描述生成,这就很明显是针对电商卖家,以下是它对 " 天猫精灵 " 生成的描述:
生活类中,菜谱的选项比较实用,但小学生作文却有点让人摸不着头脑,难道是为了给小学生减负?
还有一个常见的选项,就是续写(然后呢),我们尝试让它续写了《了不起的盖茨比》的经典开头。
在我年纪还轻 , 阅历不深的时候,父亲曾给我一个忠告 , 我至今还念念不忘。 " 每当你想要批评任何人的时候," 他告诉我:" 要记住,世上不是每个人都有你这么好的条件。"
从结果来看,通义千问对原文的理解比较勉强,续写更是差强人意," 文学性 " 还有待进步。不过,娱乐类的三个选项,就显得人性化了许多。
我们尝试让它夸赞下 " 马云的长相 ",以下是生成的结果,似乎……也不无道理?
在最后,我们询问了通义千问对其他大规模语言模型的了解,它知道 BERT 和 GPT,但对自己却颇具信心,认为具有更优秀的性能和更丰富的应用场景。
也希望通义千问的信心,能在未来成为现实。