十具兄,请教一个问题; 计算语言学怎么处理汉语了字句?

s
stonebench
楼主 (文学城)

V了O

VO了

V了O了

基本原理是什么,能准确区分吗?

 

Q
QualityWithoutName
把了字作为一个特殊符号就可以了吧。
老生常谈12
有很多方法啊

1. 五笔字型

2. 四角(四角词典)

3. 电报编码

4. 拼音

5 .

6.

7.

晚春123
主谓宾语法分析,跟英文一样。Word很早就有语法检查
Q
QualityWithoutName
不懂计算语言学的不要瞎参合。Lol
s
stonebench
我没有说清楚。说的不是怎么对应汉字,而是怎么区分意思上的不同。

中间小谢
I bet it is heavily and fundamentally statistical

and with no mysteries involved. Same with English, only relatively "easier".

J
JSL2023
在与非门这一物理层面,中英文和任何语言的文字辩识应该没有区别

它们都会成为一长串与非门 类似卜卦的硬币:)

处理这些硬币的过程 就像通过硬币卜卦。

只是这"八卦"图无比丰富多彩,路径更曲折多变。

能不能判断各种语言的"八卦"高低,就希望有专家解答了。

 

十具
你这里“准确区分”是什么意思?如果语义一样,区分干嘛?如果应用是汉译英,3个输入对应1个输出就是了。
十具
简单的SVO句子,传统rule-based算法就好使。首先分词,定词性,匹配SVO结构后就有了基本语义。助词“了”表示完

助词“了”表示完成,至于是过去,现在,还是将来完成式,希望上下文(比如表达时间的词)可以确定。

十具
吃饭了,吃了饭,吃了饭了,这点口语的变形,自然语言理解算法能对付。“吃食堂”就麻烦多了。我的领域不是自然语言处理,只是知

传统基于规则的算法的原理。

十具
当然“吃饭了”的“了”可能不是完成的意思,而是个语气词。这种歧义只能求助上下文。这种情况,基于统计推断的方法就有优势了。
s
snowandlotus
好问题:)
s
snowandlotus
这个例子举得妙。你给网管说个情,把唐静安放出来跟你辩:)
j
jinjiaodw
唐小七早就做了面膜,拜访过茶坛了.....
s
stonebench
谢谢!