百度这个是直接用了英文开源的库,先机器翻译成英语,再画出来的 结果就是四不像 只能说根本没做好中文AI,不是中文不适合AI ricepudding 发表于 2023-03-27 16:48
这个说法有些不通。难道百度的中译英连水龙头都不会翻译吗? luoyuwei 发表于 2023-03-27 17:00
不是不会翻译,是理解就有问题。他的语言模型不会理解水龙头,只会拆成水 + 龙头,再翻译成英文,所以才画出这种四不像。 hxx093020 发表于 2023-03-27 19:28
其它的还好说,但你要说百度的语言/翻译模型会把“水龙头”理解成“水龙”的头,我真不太相信。 ljmdtc 发表于 2023-03-27 19:34
感觉可能唉,不然为啥画的是西方娃娃 yimiyangguang 发表于 2023-03-27 19:51
是的, 因为时间紧, 套个壳子都来不及 之前已经有人拆穿了: 画个 prompt = 爱国的什么什么, 结果出来 星条旗装束; 画个 土耳其感恩节 , 结果一遍又一遍出来 火鸡 凡是中英文有歧义的, 一定判断不对, 就是英文的prompt 套了一个壳 avo 发表于 2023-03-27 19:56
水龙头的确很奇怪,在百度翻译里出来的是 stopcock, 和龙没有什么关系。脸盆也比较奇怪,翻成 washbasin,没有脸。难道中翻英不是用百度翻译,而是真的一个字一个字翻的,翻成了 water dragon head. 娃娃菜翻成了 baby vegetable,可以说的通。鼠标也说的通。 应该让AI 直接用英文描述一下什么是水龙头,看它是怎么理解的。 dcgreen 发表于 2023-03-27 22:04
结果就是四不像
只能说根本没做好中文AI,不是中文不适合AI
没错,当初不是很多人吹百度比Google更懂中文吗?在Google退出中国市场之前。百度如果真的ready了,它的AI不至于犯这种低级错误。
这个说法有些不通。难道百度的中译英连水龙头都不会翻译吗?
不是不会翻译,是理解就有问题。他的语言模型不会理解水龙头,只会拆成水 + 龙头,再翻译成英文,所以才画出这种四不像。
其它的还好说,但你要说百度的语言/翻译模型会把“水龙头”理解成“水龙”的头,我真不太相信。
你信不信不重要,重要的是他就给你输出这么个结果。你可以让文心一言给你个合理的解释。 而且他不是理解成“水龙的头”,你把它想的太智能了。他就是按字面意思把“水龙头”拆分成 水 + 龙头。这一步叫tokenizer,NLP模型训练的第一步。“脸盆”“娃娃菜”都是同理,都是语言理解模型的问题。真正暴露出套壳的是“起重机”和“总线”这种错误。
不是吧。要是先翻译成英文肯定不会出现水龙头这样的输出。这个显然是先做了中文的分词
感觉可能唉,不然为啥画的是西方娃娃
这个翻译是按字逐个翻的? 这有点太低级了吧,一般翻译软件都不这样啊。
是的, 因为时间紧, 套个壳子都来不及
之前已经有人拆穿了: 画个 prompt = 爱国的什么什么, 结果出来 星条旗装束; 画个 土耳其感恩节 , 结果一遍又一遍出来 火鸡
凡是中英文有歧义的, 一定判断不对, 就是英文的prompt 套了一个壳
李彦宏这个浓眉大眼的也叛变革命了!
前几天看到这个, 还以为是笑话。 觉得百度还不至于 Low 到这样。
据说是不愿意自己花钱去label图片,所以都是中翻英然后用英文label的图片来训练。 但是这个翻译也很糟糕,水龙头这样常用的词都没法翻对
应该是先做的语义理解,然后把关键词进行翻译。理解那一步就错了,它就理解成水+龙头了,然后就按这个理解翻了。这说明百度的中文语言模型真的很烂。