中文确实有些不适合AI,大家觉得呢?

P
Peekaboott
楼主 (北美华人网)





r
ricepudding
百度这个是直接用了英文开源的库,先机器翻译成英语,再画出来的
结果就是四不像
只能说根本没做好中文AI,不是中文不适合AI
t
tonker
百度这个是直接用了英文开源的库,先机器翻译成英语,再画出来的
结果就是四不像
只能说根本没做好中文AI,不是中文不适合AI
ricepudding 发表于 2023-03-27 16:48

没错,当初不是很多人吹百度比Google更懂中文吗?在Google退出中国市场之前。百度如果真的ready了,它的AI不至于犯这种低级错误。
l
luoyuwei
百度这个是直接用了英文开源的库,先机器翻译成英语,再画出来的
结果就是四不像
只能说根本没做好中文AI,不是中文不适合AI
ricepudding 发表于 2023-03-27 16:48

这个说法有些不通。难道百度的中译英连水龙头都不会翻译吗?
M
Mollyss
娃娃菜第一眼看画得还挺可爱的。 看久了有点惊悚。。。
e
elevenoclock
前几天让它画起重机(crane),他还会画个鹤(crane)呢。让它画满满一冰箱可以(can),它就画一冰箱的罐头。你要说它不是套了个壳,我还真不信。
h
hxx093020
这个说法有些不通。难道百度的中译英连水龙头都不会翻译吗?
luoyuwei 发表于 2023-03-27 17:00

不是不会翻译,是理解就有问题。他的语言模型不会理解水龙头,只会拆成水 + 龙头,再翻译成英文,所以才画出这种四不像。
s
shuiyaa
你敢开源 我就敢自主创新 开源的是英语的,你让百度怎么办?
l
ljmdtc
不是不会翻译,是理解就有问题。他的语言模型不会理解水龙头,只会拆成水 + 龙头,再翻译成英文,所以才画出这种四不像。
hxx093020 发表于 2023-03-27 19:28

其它的还好说,但你要说百度的语言/翻译模型会把“水龙头”理解成“水龙”的头,我真不太相信。
h
hxx093020
其它的还好说,但你要说百度的语言/翻译模型会把“水龙头”理解成“水龙”的头,我真不太相信。
ljmdtc 发表于 2023-03-27 19:34

你信不信不重要,重要的是他就给你输出这么个结果。你可以让文心一言给你个合理的解释。 而且他不是理解成“水龙的头”,你把它想的太智能了。他就是按字面意思把“水龙头”拆分成 水 + 龙头。这一步叫tokenizer,NLP模型训练的第一步。“脸盆”“娃娃菜”都是同理,都是语言理解模型的问题。真正暴露出套壳的是“起重机”和“总线”这种错误。
c
crazyHat
回复 2楼ricepudding的帖子
不是吧。要是先翻译成英文肯定不会出现水龙头这样的输出。这个显然是先做了中文的分词
y
yimiyangguang
这个说法有些不通。难道百度的中译英连水龙头都不会翻译吗?
luoyuwei 发表于 2023-03-27 17:00

感觉可能唉,不然为啥画的是西方娃娃
f
fitwoman
百度这个是直接用了英文开源的库,先机器翻译成英语,再画出来的
结果就是四不像
只能说根本没做好中文AI,不是中文不适合AI
ricepudding 发表于 2023-03-27 16:48

这个翻译是按字逐个翻的? 这有点太低级了吧,一般翻译软件都不这样啊。
a
avo
感觉可能唉,不然为啥画的是西方娃娃
yimiyangguang 发表于 2023-03-27 19:51

是的, 因为时间紧, 套个壳子都来不及
之前已经有人拆穿了: 画个 prompt = 爱国的什么什么, 结果出来 星条旗装束; 画个 土耳其感恩节 , 结果一遍又一遍出来 火鸡
凡是中英文有歧义的, 一定判断不对, 就是英文的prompt 套了一个壳
辣手摧花
只不过中文的AI没做好而已 现在做的好的AI都不是国外的吗
B
Banana.Republic
是的, 因为时间紧, 套个壳子都来不及
之前已经有人拆穿了: 画个 prompt = 爱国的什么什么, 结果出来 星条旗装束; 画个 土耳其感恩节 , 结果一遍又一遍出来 火鸡
凡是中英文有歧义的, 一定判断不对, 就是英文的prompt 套了一个壳

avo 发表于 2023-03-27 19:56

李彦宏这个浓眉大眼的也叛变革命了!
s
shanggj
是的, 因为时间紧, 套个壳子都来不及
之前已经有人拆穿了: 画个 prompt = 爱国的什么什么, 结果出来 星条旗装束; 画个 土耳其感恩节 , 结果一遍又一遍出来 火鸡
凡是中英文有歧义的, 一定判断不对, 就是英文的prompt 套了一个壳

avo 发表于 2023-03-27 19:56

前几天看到这个, 还以为是笑话。 觉得百度还不至于 Low 到这样。
p
pxs06
是的, 因为时间紧, 套个壳子都来不及
之前已经有人拆穿了: 画个 prompt = 爱国的什么什么, 结果出来 星条旗装束; 画个 土耳其感恩节 , 结果一遍又一遍出来 火鸡
凡是中英文有歧义的, 一定判断不对, 就是英文的prompt 套了一个壳

avo 发表于 2023-03-27 19:56

据说是不愿意自己花钱去label图片,所以都是中翻英然后用英文label的图片来训练。 但是这个翻译也很糟糕,水龙头这样常用的词都没法翻对
d
dcgreen
水龙头的确很奇怪,在百度翻译里出来的是 stopcock, 和龙没有什么关系。脸盆也比较奇怪,翻成 washbasin,没有脸。难道中翻英不是用百度翻译,而是真的一个字一个字翻的,翻成了 water dragon head. 娃娃菜翻成了 baby vegetable,可以说的通。鼠标也说的通。 应该让AI 直接用英文描述一下什么是水龙头,看它是怎么理解的。
E
EbbieV
这属于抄作业的时候连人家的名字都一字不错的抄过去。
浮云散
好像目前主要基于英文,其他语种还没太开发,翻译过去和原语种的差距。
h
hxx093020
水龙头的确很奇怪,在百度翻译里出来的是 stopcock, 和龙没有什么关系。脸盆也比较奇怪,翻成 washbasin,没有脸。难道中翻英不是用百度翻译,而是真的一个字一个字翻的,翻成了 water dragon head. 娃娃菜翻成了 baby vegetable,可以说的通。鼠标也说的通。 应该让AI 直接用英文描述一下什么是水龙头,看它是怎么理解的。
dcgreen 发表于 2023-03-27 22:04

应该是先做的语义理解,然后把关键词进行翻译。理解那一步就错了,它就理解成水+龙头了,然后就按这个理解翻了。这说明百度的中文语言模型真的很烂。