这就是谷歌翻译对一份英文的患者指导进行翻译后的结果,着实让人摸不着头脑。 最近,有人发布了谷歌翻译在急诊指导中应用效果的评估报告。 结果显示,对于不同语言,谷歌翻译的准确率存在差距,最高可以达到94%,而最低只有55%,并且还存在一些潜在的风险。 研究背景和方法 由于很多患者看不懂英文的指导说明,而许多医院无法提供口译或笔译服务,医护人员通常会使用机器翻译为患者进行翻译。 然而,在医疗服务中,不准确的翻译可能会造成严重后果。 因此,来自UCLA Health(加州大学洛杉矶分校医学中心)的研究人员,对谷歌翻译的书面翻译效果进行了评估。 报告中评估了400份由谷歌翻译译成七种不同语言的急诊科出院须知。包括:西班牙语、中文、越南语、他加禄语、韩语、亚美尼亚语和波斯语。 选择非语言专家、非医疗工作者,并且能够流利阅读母语和英语的志愿者,阅读译文并评估其准确性。 中文翻译准确率81.7% 总体来说,翻译的准确率超过80%,与2014年60%的准确率相比,有所提高。 具体而言,不同语言的翻译准确率有所不同: 中文翻译的准确率为81.7%;西班牙语的准确率最高,达到94%;而亚美尼亚语仅仅只有55%的准确率。 在文章一开始提到的示例中,使用谷歌翻译将“You can take over the counter ibuprofen as needed for pain”(您可以根据疼痛程度服用处方药布洛芬)译为亚美尼亚语。 结果语义变得风马牛不相及: “您可以根据疼痛程度使用尽可能多的反坦克导弹。” 就连准确率较高的西班牙语和中文,也可能出现错误。比如,对服用降血脂香豆素的患者的指导说明: “Your Coumadin level was too high today. Do not take any more Coumadin until your doctor reviews the results.”(您今天的香豆素水平太高了。在医生查看结果之前,不要再服用香豆素。) 在谷歌翻译把它译成中文之后,变成了: “您今天的大豆水平太高了。在医生查看结果之前,不要再摄取大豆。”(P.S.香豆素和大豆并没有什么直接联系) 研究人员表示,机器翻译的主要问题之一是不能考虑上下文。例如,可能无法识别药物的名称。因此也就“失去了你想表达的意思”。 此外,报告中还指出了谷歌翻译使用中存在的其他问题: 对于从右往左书写和阅读的波斯语, 谷歌翻译从左向右进行翻译,以至于难以辨认。 而在传统和现代的中文书写系统,以及波斯语与其分支的阿富汗语、塔吉克语中的应用,也存在着潜在的问题。 逐渐完善的谷歌翻译 经过尝试后,我们发现报告中那句“大豆”中文翻译,在谷歌上已经得到了修正: 2006年,谷歌推出基于短语的机器翻译。 之后,谷歌开始使用递归神经网络(RNN)直接学习两种语言的句子之间的映射。基于短语的机器翻译(PBMT)将输入句子分解为单词和短语,可以在很大程度上独立进行翻译。 2016年,谷歌启用了Google神经机器翻译系统(GNMT),采用最新的训练技术改进翻译质量。 通过将人工神经网络(模拟神经元在大脑中连接的方式的计算单元层)与庞大的数据集相结合,提高了准确率。 NMT将整个输入句子视为翻译单元,首次发布时,NMT在中等规模的公共基准数据集上显示出与现有系统相同的准确性。 不过,谷歌也表示,GNMT仍然无法与人工翻译相比,例如:丢弃单词、误译专有名称或稀有术语,以及孤立地翻译句子、无法考虑上下文的情况。 研究报告指出,医护工作者出于善意而使用机器翻译,却没有意识到这些潜在问题可能造成危害。 尽管准确性在不断提高,但是在应用于医疗环境时,机器翻译并不可靠,仍然无法代替口译和笔译。
这就是谷歌翻译对一份英文的患者指导进行翻译后的结果,着实让人摸不着头脑。 最近,有人发布了谷歌翻译在急诊指导中应用效果的评估报告。 结果显示,对于不同语言,谷歌翻译的准确率存在差距,最高可以达到94%,而最低只有55%,并且还存在一些潜在的风险。
研究背景和方法 由于很多患者看不懂英文的指导说明,而许多医院无法提供口译或笔译服务,医护人员通常会使用机器翻译为患者进行翻译。 然而,在医疗服务中,不准确的翻译可能会造成严重后果。 因此,来自UCLA Health(加州大学洛杉矶分校医学中心)的研究人员,对谷歌翻译的书面翻译效果进行了评估。
报告中评估了400份由谷歌翻译译成七种不同语言的急诊科出院须知。包括:西班牙语、中文、越南语、他加禄语、韩语、亚美尼亚语和波斯语。 选择非语言专家、非医疗工作者,并且能够流利阅读母语和英语的志愿者,阅读译文并评估其准确性。
中文翻译准确率81.7% 总体来说,翻译的准确率超过80%,与2014年60%的准确率相比,有所提高。 具体而言,不同语言的翻译准确率有所不同:
中文翻译的准确率为81.7%;西班牙语的准确率最高,达到94%;而亚美尼亚语仅仅只有55%的准确率。
在文章一开始提到的示例中,使用谷歌翻译将“You can take over the counter ibuprofen as needed for pain”(您可以根据疼痛程度服用处方药布洛芬)译为亚美尼亚语。 结果语义变得风马牛不相及: “您可以根据疼痛程度使用尽可能多的反坦克导弹。” 就连准确率较高的西班牙语和中文,也可能出现错误。比如,对服用降血脂香豆素的患者的指导说明: “Your Coumadin level was too high today. Do not take any more Coumadin until your doctor reviews the results.”(您今天的香豆素水平太高了。在医生查看结果之前,不要再服用香豆素。) 在谷歌翻译把它译成中文之后,变成了: “您今天的大豆水平太高了。在医生查看结果之前,不要再摄取大豆。”(P.S.香豆素和大豆并没有什么直接联系) 研究人员表示,机器翻译的主要问题之一是不能考虑上下文。例如,可能无法识别药物的名称。因此也就“失去了你想表达的意思”。 此外,报告中还指出了谷歌翻译使用中存在的其他问题: 对于从右往左书写和阅读的波斯语, 谷歌翻译从左向右进行翻译,以至于难以辨认。 而在传统和现代的中文书写系统,以及波斯语与其分支的阿富汗语、塔吉克语中的应用,也存在着潜在的问题。
逐渐完善的谷歌翻译 经过尝试后,我们发现报告中那句“大豆”中文翻译,在谷歌上已经得到了修正:
2006年,谷歌推出基于短语的机器翻译。 之后,谷歌开始使用递归神经网络(RNN)直接学习两种语言的句子之间的映射。基于短语的机器翻译(PBMT)将输入句子分解为单词和短语,可以在很大程度上独立进行翻译。 2016年,谷歌启用了Google神经机器翻译系统(GNMT),采用最新的训练技术改进翻译质量。 通过将人工神经网络(模拟神经元在大脑中连接的方式的计算单元层)与庞大的数据集相结合,提高了准确率。 NMT将整个输入句子视为翻译单元,首次发布时,NMT在中等规模的公共基准数据集上显示出与现有系统相同的准确性。 不过,谷歌也表示,GNMT仍然无法与人工翻译相比,例如:丢弃单词、误译专有名称或稀有术语,以及孤立地翻译句子、无法考虑上下文的情况。
研究报告指出,医护工作者出于善意而使用机器翻译,却没有意识到这些潜在问题可能造成危害。 尽管准确性在不断提高,但是在应用于医疗环境时,机器翻译并不可靠,仍然无法代替口译和笔译。
我日语小白,连输入日语都不会,只会用手机镜头照着看翻译。实在没动力学。