为什么汉语的信息熵最高,却表达的歧义最大?

beijingren
楼主 (未名空间)
法文 3.98 比特;
西班牙文 4.01 比特;
英文 4.03 比特;
俄文 4.35 比特;
德文 4.10 比特;
羅馬尼亞文 4.12 比特;
漢語9.65 比特。
c
chefscut
因为所谓汉语其实融合了各种语言,相当于把整个诺曼语族丢一起算一个语言

【 在 beijingren (to thine own self be true) 的大作中提到: 】
: 法文 3.98 比特;
: 西班牙文 4.01 比特;
: 英文 4.03 比特;
: 俄文 4.35 比特;
: 德文 4.10 比特;
: 羅馬尼亞文 4.12 比特;
: 漢語9.65 比特。
dnls
文言文熵更高歧义更大因此更加高级
beijingren
可是底熵语言失真很大

【 在 dnls (都督中外诸军事) 的大作中提到: 】
: 文言文熵更高歧义更大因此更加高级
beijingren
Entropy越高,表达一跳信息,所用的平均符号数就越少,整个句子越言简意赅

【 在 dnls (都督中外诸军事) 的大作中提到: 】
: 文言文熵更高歧义更大因此更加高级
w
wwwhu
汉语的来源比整个罗曼语族还宽多了。随便举个例子,最最最基础的底层词,汉语属格助词的发音(常见的如de, di, le, lei, la, ge, gei, nge, ne, 反倒是古文献常见
的“之”罕见),各个方言千差万别,连现代汉语第一频度字“的”,是后世借用字(说错别字也不为过。汉字发明两三千年文献千千万,那么长时间竟然没发明中古后期以后迄今汉语第一常见的字?)。
【 在 chefscut (jerk) 的大作中提到: 】
: 因为所谓汉语其实融合了各种语言,相当于把整个诺曼语族丢一起算一个语言
F
FoodGod
熵值越高不就是歧义越大。
tend
你关于“的”的论述是错误的。

“的”在白话文里早就有。看水浒里“的”字到处都是。

文言文跟白话文根本不是一回事。文言文跟汉语白话不必要是一种语言。过去朝鲜日本越南都用文言文。文言文类似电脑语言,是一种格式化了的记事文书。

【 在 wwwhu (fc) 的大作中提到: 】
: 汉语的来源比整个罗曼语族还宽多了。随便举个例子,最最最基础的底层词,汉语属格
: 助词的发音(常见的如de, di, le, lei, la, ge, gei, nge, ne, 反倒是古文献常见
: 的“之”罕见),各个方言千差万别,连现代汉语第一频度字“的”,是后世借用字(
: 说错别字也不为过。汉字发明两三千年文献千千万,那么长时间竟然没发明中古后期以
: 后迄今汉语第一常见的字?)。
StMicheal
现在经常发现读汉语说明之类的特别简短的特别头疼,读了几遍读不懂。当年读中文教科书经常有类似的感觉。后来读英文教材明白多了。
StMicheal
文言文要断句,断的不一样,表达意思就不一样。原来论语之类的后世各种释义版本。
w
wwwhu
这正是我要说的,属格助词在汉语各来源中一直存在多种发音,但“的”字借字在宋元话本中才开始借用,唐人传奇还不见,更别说乐府和诗经这些从民间来的了。
【 在 tend (tend) 的大作中提到: 】
: 你关于“的”的论述是错误的。
: “的”在白话文里早就有。看水浒里“的”字到处都是。
: 文言文跟白话文根本不是一回事。文言文跟汉语白话不必要是一种语言。过去朝鲜日本
: 越南都用文言文。文言文类似电脑语言,是一种格式化了的记事文书。
tend
你把白话文跟文言文搞混了。的字是白话文常用字,文言文不用。

你说的唐人传奇可有白话文的?

【 在 wwwhu (fc) 的大作中提到: 】
: 这正是我要说的,属格助词在汉语各来源中一直存在多种发音,但“的”字借字在宋元
: 话本中才开始借用,唐人传奇还不见,更别说乐府和诗经这些从民间来的了。
daigaku
白话文反映的是北方口语(官话)。
南方口语很不一样。连人称代词这种底层词汇都有差异。
南方也不用“的”

【 在 tend (tend) 的大作中提到: 】
: 你关于“的”的论述是错误的。
: “的”在白话文里早就有。看水浒里“的”字到处都是。
: 文言文跟白话文根本不是一回事。文言文跟汉语白话不必要是一种语言。过去朝鲜日本
: 越南都用文言文。文言文类似电脑语言,是一种格式化了的记事文书。
s
srx
包含信息密度越高,当然歧义就越大。
daigaku
文言文用“之”,有种观点是“的”和"之"只是不同写法,可能古代之的声母接近d,
或者后来这个语素塞音化。
但这个语素本身在文言文里有。吴语粤语的助词跟文言文完全对不上,跟泰语壮语对得上

【 在 tend (tend) 的大作中提到: 】
: 你把白话文跟文言文搞混了。的字是白话文常用字,文言文不用。
: 你说的唐人传奇可有白话文的?
b
btphy
“之”就是ge(或者更接近ke或he),汉子的发音变化了而已。

【 在 wwwhu (fc) 的大作中提到: 】
: 汉语的来源比整个罗曼语族还宽多了。随便举个例子,最最最基础的底层词,汉语属格
: 助词的发音(常见的如de, di, le, lei, la, ge, gei, nge, ne, 反倒是古文献常见
: 的“之”罕见),各个方言千差万别,连现代汉语第一频度字“的”,是后世借用字(
: 说错别字也不为过。汉字发明两三千年文献千千万,那么长时间竟然没发明中古后期以
: 后迄今汉语第一常见的字?)。
b
btphy
早期文言文就是古代白话文,只不过很多字的发音改变了导致书面语和口语的脱节。

比如“尔”古代本来就念“你”,“之”古代就是“的”,或者更接近广东话的“ge"。

“无”就是“没”或者“mou”。参看南“无”阿弥陀佛,明明念mo,为何偏要写成无
?因为古代“无”本来就年成mo。

再比如“弗”就是“不”,写成“弗去”就是文言文,但写成“不去”就变成白话文了。但是古代“弗”字本来也念“bu",所以才会用它做声旁,创造了“佛”这个字,“
佛陀”其实就是buda。但是奇怪的是弗字后来发音转化,导致凡是用它做声旁的字也跟着一起转变,结果“佛”字的发音变成和原先梵文的发音完全不搭了。

【 在 tend (tend) 的大作中提到: 】
: 你关于“的”的论述是错误的。
: “的”在白话文里早就有。看水浒里“的”字到处都是。
: 文言文跟白话文根本不是一回事。文言文跟汉语白话不必要是一种语言。过去朝鲜日本
: 越南都用文言文。文言文类似电脑语言,是一种格式化了的记事文书。
daigaku
之是章母字,ge对应的是见组,不可能同源

【 在 btphy (btphy) 的大作中提到: 】
: 早期文言文就是古代白话文,只不过很多字的发音改变了导致书面语和口语的脱节。: 比如“尔”古代本来就念“你”,“之”古代就是“的”,或者更接近广东话的“ge"。
: “无”就是“没”或者“mou”。参看南“无”阿弥陀佛,明明念mo,为何偏要写成无
: ?因为古代“无”本来就年成mo。
: 再比如“弗”就是“不”,写成“弗去”就是文言文,但写成“不去”就变成白话文了
: 。但是古代“弗”字本来也念“bu",所以才会用它做声旁,创造了“佛”这个字,“
: 佛陀”其实就是buda。但是奇怪的是弗字后来发音转化,导致凡是用它做声旁的字也跟
: 着一起转变,结果“佛”字的发音变成和原先梵文的发音完全不搭了。
b
btphy
“之”本来是会意字,其实就是“去”字,“之”本义就是“去”或“到”的意思。故有“送孟浩然之广临”,“之国”等说法。因为古代“去”和“可"ke"的发音接近,所以借用来表示属格。

今天广东话属格说“gar",“去”说成“kui",两者的发音仍然接近。

【 在 daigaku (๑۩۞۩๑) 的大作中提到: 】
: 文言文用“之”,有种观点是“的”和"之"只是不同写法,可能古代之的声母接近d,
: 或者后来这个语素塞音化。
: 但这个语素本身在文言文里有。吴语粤语的助词跟文言文完全对不上,跟泰语壮语对得上
daigaku
之作动词和作助词完全是两回事,语义毫无关联。
助词是假借用法,借那个读音。
现代汉语“目的”也跟助词用法毫无关系。

去在古代是相距的意思,也不作go讲

【 在 btphy (btphy) 的大作中提到: 】
: “之”本来是会意字,其实就是“去”字,“之”本义就是“去”或“到”的意思。故
: 有“送孟浩然之广临”,“之国”等说法。因为古代“去”和“可"ke"的发音接近,所
: 以借用来表示属格。
: 今天广东话属格说“gar",“去”说成“kui",两者的发音仍然接近。
: 得上
b
btphy
你没看明白我说什么。

“去”古代当然不是go,古代go这个意思本来就是写成“之”字。“之”就是画的一只脚在向前走的样子。之所以会用“之”这个字来表示属格,必然是因为古汉语里属格和"go"的发音接近的缘故,其实说白了就是写白字,当然和语义毫无关联。

古代汉语的“之”,也就是go,到底是念哪个音不能完全确定,但肯定是不念“zhi”
,一定是和de, ge, ke, khe这一些中的某一个最接近,不然古人不会用它来代表属格
的助词,考虑到它本义是go,再参考现在各地方言go的说法,大致可以猜出点端倪。

【 在 daigaku (๑۩۞۩๑) 的大作中提到: 】
: 之作动词和作助词完全是两回事,语义毫无关联。
: 助词是假借用法,借那个读音。
: 现代汉语“目的”也跟助词用法毫无关系。
: 去在古代是相距的意思,也不作go讲
daigaku
你的原意是去之通用
我就是要说明助词之跟去没关系,所以去的读音不说明问题。

缅甸语里这个语素是/te/(表限定的助词)

比如 池塘里的鱼说成 jeka te kaqnga
(网上抄的)

不过大部分语言领属关系和修饰关系用词不同。

【 在 btphy (btphy) 的大作中提到: 】
: 你没看明白我说什么。
: “去”古代当然不是go,古代go这个意思本来就是写成“之”字。“之”就是画的一只
: 脚在向前走的样子。之所以会用“之”这个字来表示属格,必然是因为古汉语里属格和
: "go"的发音接近的缘故,其实说白了就是写白字,当然和语义毫无关联。
: 古代汉语的“之”,也就是go,到底是念哪个音不能完全确定,但肯定是不念“zhi”
: ,一定是和de, ge, ke, khe这一些中的某一个最接近,不然古人不会用它来代表属格
: 的助词,考虑到它本义是go,再参考现在各地方言go的说法,大致可以猜出点端倪。
molen
汉语歧义不大,除非是特意制造歧义。

否则,任何歧义都可以通过正确使用语言来消除
tend
你对文言文的理解是错的。

文言文不是语言,是文书。白话文才是语言的记录。

【 在 daigaku (๑۩۞۩๑) 的大作中提到: 】
: 文言文用“之”,有种观点是“的”和"之"只是不同写法,可能古代之的声母接近d,
: 或者后来这个语素塞音化。
: 但这个语素本身在文言文里有。吴语粤语的助词跟文言文完全对不上,跟泰语壮语对得上
daigaku
任何文字都是以当时口语为基础
【 在 tend (tend) 的大作中提到: 】
: 你对文言文的理解是错的。
: 文言文不是语言,是文书。白话文才是语言的记录。
: 得上
w
wwwhu
去和的在大部分方言里都走不同的路吧,去的声母一般都是从k'音变过去。的基本上从语言底层继承过来。
dnls
后世用的文言文体实际上是从先秦诸子散文那里来的,诸子散文就是先秦口语,当代中国人基本能读,先秦书面语的代表则是尚书,或者更早的甲骨卜辞和青铜器金文,阅读难度比先秦诸子散文大很多。
【 在 daigaku (๑۩۞۩๑) 的大作中提到: 】
: 任何文字都是以当时口语为基础
w
wwwhu
一直都有另类的人,除了先秦问题外,各个时代的流行文体都不是先秦文章的体例,比如歌词类的国风乐府唐诗宋词元曲,和话本小说,都和作者口语接近。还有王充这样故意用口语写几篇文章的。世说新语颜氏家训这些也比较随当时语言走。敦煌又挖掘出一些口语文章。汉唐之间也不是想象地那么缺资料。
【 在 dnls (都督中外诸军事) 的大作中提到: 】
: 后世用的文言文体实际上是从先秦诸子散文那里来的,诸子散文就是先秦口语,当代中
: 国人基本能读,先秦书面语的代表则是尚书,或者更早的甲骨卜辞和青铜器金文,阅读
: 难度比先秦诸子散文大很多。
F
FlyingFreely
啥是信息熵呢?弄明白了就知道你两句话一个意思。
【 在 beijingren (to thine own self be true) 的大作中提到: 】
: 法文 3.98 比特;
: 西班牙文 4.01 比特;
: 英文 4.03 比特;
: 俄文 4.35 比特;
: 德文 4.10 比特;
: 羅馬尼亞文 4.12 比特;
: 漢語9.65 比特。
lq558
因为需要语气
xiaxianyue
因为熵高到一定程度无序度太大了。
【 在 beijingren (to thine own self be true) 的大作中提到: 】
: 法文 3.98 比特;
: 西班牙文 4.01 比特;
: 英文 4.03 比特;
: 俄文 4.35 比特;
: 德文 4.10 比特;
: 羅馬尼亞文 4.12 比特;
: 漢語9.65 比特。
digital
熵是不确定性的度量,熵越长不确定性越大,当然歧义也就越大啊。
b
btphy
文言文有两个阶段,先秦两汉的文言文其实就是当时的口语,基本就是白话。当然因为古代书写条件限制,书面较口头更加简洁是肯定的,但除了略为简略些之外并不会刻意和口语区隔,所以用字和语法基本就是按照口语习惯来。

唐宋以后因为汉语语音和文字的读音都发生了比较大的转变,导致文言文语口语之间的差距越来越大,再加上士大夫故意装B,文言文才开始逐渐变成纯书面语言。

【 在 tend (tend) 的大作中提到: 】
: 你对文言文的理解是错的。
: 文言文不是语言,是文书。白话文才是语言的记录。
: 得上
Y
YXLM
  文言文歧义大,是因为客观条件的限制,书写不易,在造纸术发明以前就更难,所以难免写得过于简短。
  我以为同音字的大量存在,也是同样的原因。说话可以根据语气判断其语义,也可以多说几句,所以同音造成歧义的可能性不大,写下来就必须有所区别才能防止歧义。

  现代汉语歧义不大。只不过语文教学略有问题,不着重于训练基本的表达能力,而着重于训练乱七八糟的进阶能力。造成了一方面很多人语文水平太差,说不明白;另一方面也有很多人语文水平太高,习惯于用制造歧义的方法来达到某些个人目的(其中之一就是装逼)。
zwmpt
语言大致有两种,一种是直接的,具体的,这类基本没有歧义,
一种是主观的,抽象的,意义经常是模糊的,
N
Neitzsche
语言和文字两码事
文言文或书面语没有“的”字不代表活语言中没有这个词
汉语言的语义更加丰富或复杂,应该还是跟汉民族长期以来的生活方式和文化性格有关农耕社会对比如语义、度量衡、时间、法律条文等的精确度的要求天然要比商业社会低因此历史上汉语从来不曾面对提高语义精确度的进化压力也就是自然的
与此相应,中国人的审美观也更加倾向于含蓄美,无论诗歌还是音乐还是绘画,都更加强调预留审美或想象空间。

语义的丰富性,也为后人仅仅通过重新解释经典,就足以在不颠覆古典思想架构的前提下就能为新的时代提供新的价值观体系提供了可能性和操作的便利性,因此中国的历史相比西方历史有更明显的延续性,在文化演变上更多的走了一条渐变式的道路。

【 在 wwwhu (fc) 的大作中提到: 】
: 汉语的来源比整个罗曼语族还宽多了。随便举个例子,最最最基础的底层词,汉语属格
: 助词的发音(常见的如de, di, le, lei, la, ge, gei, nge, ne, 反倒是古文献常见
: 的“之”罕见),各个方言千差万别,连现代汉语第一频度字“的”,是后世借用字(
: 说错别字也不为过。汉字发明两三千年文献千千万,那么长时间竟然没发明中古后期以
: 后迄今汉语第一常见的字?)。
C
ChinaGirl
所有语言都这样吧。就算是programming language也是这样,越verbose就越precise越高readability,越terse就越ambiguous越难maintain。

【 在 beijingren (to thine own self be true) 的大作中提到: 】
: 法文 3.98 比特;
: 西班牙文 4.01 比特;
: 英文 4.03 比特;
: 俄文 4.35 比特;
: 德文 4.10 比特;
: 羅馬尼亞文 4.12 比特;
: 漢語9.65 比特。
c
chyz198
熵越高,不确定性越大,所以就应该是歧义越大啊。
G
GUXBO
我也纳闷。不是说反了吧?
【 在 FoodGod (饭中淹) 的大作中提到: 】
: 熵值越高不就是歧义越大。
zwmpt
语言的规范化,就是孔子说的必也正名乎。
你说一句话,我理解的意思要与你的意思对上口径。这就是消除歧义的最科学的方法。当然,严格规范化的语言,就失去了艺术性。变得枯燥无味,老生常谈。
当一切都格式化,人生就变得单调,无聊。
有时候大家都觉得妙不可言的东西,其实很无逻辑性。
塞涅卡说,人的理性,就是神性。语言的逻辑性,就是一种理性。
PBSNPR
歧义句是在理解上会产生两种可能但在当时语境种只利用其中一种含义的句子。换句话说,就是可以这样理解也可以那样理解的句子,但不确定究竟在表达哪种意思。也就是谓语言文字的意义不明确,有两种或几种可能的解释。
PBSNPR
词语释义

如果一个句子有两种或两种以上的解释,就会产生歧义,歧义产生的原因:操作顺序或跟什么事物关联后的理解、词义不明确、句法不固定、层次不分明、所指的时代或朝代不明确,另外使用的语气也会导致歧义。
PBSNPR
歧义类型

歧义有主要由口语与书面的差别造成的,有主要由多义词造成的,还有语言组合造成的。组合的歧义中又有语法组合的歧义和语义组合的歧义。
(一)组合层次不同造成歧义
①“我们三个人一组”,可理解为“我们/三个人一组”或“我们三个人/一组”。
②“这份报告,我写不好”,可理解为“这份报告,我/写不好(能力有限)”,也可
理解为“这份报告,我写/不好(可能由于身份等因素)”。
(二)结构关系不同造成歧义
①“进口彩电”,可理解为动宾关系,也可理解为偏正关系。
②“学生家长”,可理解为并列关系,也可理解为偏正关系。
(三)语义不明确造成歧义
①“开刀的是她父亲”,可理解为她父亲是开刀的外科医生,也可理解为她父亲有病,医生给他做了手术。
②“妇女理发店”,可能是由妇女开办的理发店,也可能是以妇女为服务对象的理发店。
③“诗人的风度”,所说的可能是诗人,也可能不是诗人。
(四)词类不同造成歧义
①“我要炒肉丝”,“炒”可理解为动词或形容词。
②“饭不热了”,“热”是动词,意即不用热饭了,凉的也可以吃;“热”是形容词,意即饭凉了。
③“他原来住在这里”,“原来”做名词,意即他以前曾住在这里;“原来”做副词,意即没想到他就住在这个地方。
④“县里通知说,让赵乡长本月15日前去汇报”,“前”做形容词,表以前之意,时间范围大;“前”做动词,表往前走之意,则只能在15日这一天去县里。
(五)词语含义多解造成歧义
①“躺在床上没多久,他想起来了”,可理解为他想起了什么事,也可理解为他要起床。
②“请吃菜”,“菜”既可指蔬菜,也可泛指菜肴。
③“贸易部已向华北东北调拨物资”,“向”可理解为“从”,也可理解为“给”,表意大不相同。
(六)句子成分残缺造成歧义
①大家对护林员揭发林业局带头偷运木料的问题,普遍感到非常气愤。因为在“揭发”后随意省去一个“的”字,使文意中心可以前移,造成歧义。既可理解为大家对林业局带头偷运木料一事气愤;也可理解为对护林员揭发这个问题的行为气愤。加上这个“的”字,中心限制在“林业局带头偷运木料的问题”上,文意就明确了。
②买车、船、饭票在服务台。此句在“车”后、“船”后丢掉“票”字造成歧义。可理解为车票、船票和饭票;也可理解为买车、买船和买饭票。
(七)口语中轻重音不同也可造成歧义
如:“他一个早晨就写了三封信”,“就”轻读,是说他写信写得快;“就”重读,则说他工作效率低,只写了三封信。
PBSNPR
汉语中的26种结构歧义

冯志伟



上世纪80年代我在德国Fraunhofer研究院新信息技术与通讯系统研究所研究中文科学技术术语结构时,曾经提出了“潜在歧义论”(Potential Ambiguity Theory, 简称PA论)。PA论认为,语言学家总结出的各种“歧义格式”(我们叫做PT结构[Phrase
Type Structure])的歧义实际上是潜在的歧义,并不是现实的歧义,当我们用具体的
单词来替换歧义格式中的词类符号时(我们叫做“实例化”),这样的潜在歧义可能继续保持,也可能消失,从而转化为真歧义结构、歧义消失结构。PA论补充了朱德熙先生关于“歧义格式”的内容,对于语言现象具有更强的解释力。

博主曾经发表过关于科学技术术语中的潜在歧义结构的博文。PA论也同样适合于日常的语言,它不仅适用于汉语,也适用于英语。今天我们根据“潜在歧义论”(PA论)来进一步讨论日常语言中的潜在歧义问题。

如果我们用PA论的观点来分析英语和汉语的歧义结构时,我们就会得到相当满意的解释。

英语的“VP + NP1 + Prep + NP2”这个歧义格式(也就是PT结构)是一个潜在歧
义结构。当这个潜在歧义结构实例化为 saw a boy with a telescope 时,由于 with a telescope 在语义上既可作 a boy 的定语,又可作 saw 的状语,潜在歧义不能消失,于是,这个潜在歧义结构转化成了现实的真歧义结构。当这个潜在歧义结构实例化为 lost the ticket to New York,由于 to New York 在语义上不能作 lost 的状语,
只能作 the ticket 的定语,于是,潜在歧义消失,这个句子只能解释为“丢失了到纽约的票”,而不能解释为“到纽约丢失了票”,变成了一个歧义消除结构。

同样地,汉语中的“VP + 的 + 是 + NP”也是一个潜在歧义结构,其中的“VP + 的”既可以是施事,又可以是受事。当它实例化为“看的是病人”时,潜在歧义转化为现实的歧义,得到一个真歧义结构,而当它实例化为“发明的是一个工人”时,“发明的”只能是施事,潜在歧义消失,得到了一个歧义消除结构。

汉语中的“N1 + N2 + N3”也是一个潜在歧义结构,其层次可以理解为((N1 + N2) + N3),也可以理解为(N1 + (N2 + N3)),有几何歧义。当这些潜在歧义结构实例化为“台湾语言研究会”时,可以理解为“台湾语言的研究会”,也可以理解为“台湾的语言研究会”,潜在歧义转化为现实的歧义,得到一个真歧义结构;但是,当这个潜在歧义结构实例化为“地名语源词典”时,潜在歧义消失,成为了歧义消除结构。

汉语中的“ADJ + N1 + N2”也是一个潜在歧义结构,其层次可以理解为((ADJ +
N1) + N2),也可以理解为 (ADJ + (N1 + N2)),有几何歧义。当这个潜在歧义结构实
例化为“小学生词典”时,可以理解为“小学生用的词典”,也可以理解为“小型的学生词典”,潜在歧义转化为现实的歧义,得到一个真歧义结构,但是,当这个潜在歧义结构实例化为“新英汉词典”时,潜在歧义消失,成为了歧义消除结构。

根据近年来学者们的研究结果,我们把汉语中的潜在歧义结构举例说明如下:

(1)VP + 的 + 是 + NP:

当实例化为“援助/的/是/中国”时,可以理解为“中国援助了别国”,也可以理解为“别国援助了中国”,潜在歧义转化为现实的歧义。

但是,当实例化为“发明/的/是/工人”时,潜在歧义消失。当实例化为“关心/的/是/分数”时,潜在歧义也消失了。

这种情况,前面已经分析过,兹不赘述。

(2)N1 + N2 + N3:

当实例化“台湾/语言/研究会”时,潜在歧义转化为现实的歧义。

当实例化为“地名/语源/词典”时,潜在歧义消失。

这种情况,前面也分析过,兹不赘述。

(3)ADJ + N1 + N2:

当实例化为“小/学生/词典”时,潜在歧义转化为现实的歧义。

当实例化为“新/英汉/词典”时,潜在歧义消失。

这种情况,前面也分析过,兹不赘述。

(4)全部(部分) + VP + 的 + NP:

全部(部分)可以作为VP的状语,有可以作为NP的定语,从而产生歧义。

当实例化为“部分/锈蚀/的/仪器”时,可以理解为“(部分/锈蚀)/的/仪器” (“部
分”作“锈蚀”的状语),也可以理解为“部分/(锈蚀/的/仪器)”(“部分”作“锈
蚀的仪器”的定语),潜在歧义转化为现实的歧义。

当实例化为“部分/牺牲/的/战士”时,只能理解为“部分/(牺牲/的/战士)”(
“部分”作“牺牲的战士”的定语),潜在歧义消失。

(5)数量结构 + NP1 + 的 + NP2:

“数量结构”可以限定NP1,作NP1的定语,又可以限定“NP1 + 的 + NP2”,作“NP1 + 的 + NP2”的定语,因而产生歧义。

当实例化为“三个/学校/的/实验员”时,可以理解为“(三个/学校)/的/实验员”(“三个”限定“学校”),又可以理解为“三个/(学校/的/实验员)”(“三个”限
定“学校的实验员”),潜在歧义转化为现实的歧义。

当实例化为“三所/学校/的/实验员”时,只能理解为“(三所/学校)/的/实验员”(“三所”限定“学校”,不能限定“实验员”),潜在歧义消失;当实例化为“三位/学校/的/实验员”时,只能理解为“三位/(学校/的/实验员)”(“三位”限定“学校的实验员”,不能限定“学校”),潜在歧义消失。

(6)VP + 数量结构 + NP:

数量结构可以作VP的补语,又可以作NP的定语,这就产生了潜在歧义。

当实例化为“发了/三天/工资”时,可以理解为“(发了/三天)/工资”(“三天
”作“发了”的补语),又可以理解为“发了/(三天/工资)”(“三天”作“工资”的定语),潜在歧义转化为现实的歧义。

当实例化为“(写了/两天)/文章”时(“两天”作“写了”的补语,但“两天”
不能作“文章”的定语),潜在歧义消失;当实例化为“写了/(一篇/文章)”时(“一篇”作“文章”的定语,但“一篇”不能作“写了”的补语),潜在歧义也消失。

上面的例子是改变数量结构中的量词来消除歧义,有时,改变数量结构中的数词
也可以消除歧义。例如,当实例化为“讲了/三年/历史”时,“三年”可以理解为“讲了”的补语,又可以理解为“历史”的定语,潜在歧义转化为现实歧义,但是,当实例化为“讲了/三千年/历史”时,“三千年”只能作“历史”的定语,不能作“讲了”的补语,潜在歧义消失。

(7)V + ADJ + N:

当实例化为“穿/好/衣服”时,可以理解为“(穿/好)/衣服”(“好”作“穿”
的补语),又可以理解为“穿/(好/衣服)”(“好”作“衣服”的定语),潜在歧义转化为现实的歧义。

当实例化为“研究/清楚/问题”时,只能理解为“(研究/清楚)/问题”(“清楚
”只能作“研究”的补语,不能作“问题”的定语),潜在歧义消失;当实例化为“研究/困难/问题”时,只能理解为“研究/(困难/问题)”(“困难”只能作“问题”的定语,不能作“研究”的补语),潜在歧义也消失。

(8)V1 + V2 + NP:

V2与V1可以组成联合结构,它们共同的宾语是NP,但V2又可以与NP组成述宾结构
,作为V1的宾语,而且,V2又可以作为NP的定语,形成偏正结构作V1的宾语,这就产生了潜在歧义。

当实例化为“研究/推广/新技术”时,可以理解为“(研究/推广)/新技术”(“新技术”作“研究/推广”的宾语),又可以理解为“研究/(推广/新技术)”(“新技术
”只作为“推广”的宾语),潜在歧义部分地转化为现实的歧义。

当实例化为“继承/发展/老传统”时,只能理解为“(继承/发展)/老传统”(“老传统”作“继承/发展”的共同宾语),潜在歧义消失;当实例化为“推广/养殖/新技
术”时,只能理解为“推广/(养殖/新技术)” (“养殖”作“新技术”的定语,“养
殖/新技术”这一偏正结构又作为“推广”的宾语),潜在歧义也消失。

(9)NP1 + NP2 + VP:

NP2可受NP1的限定而与之形成偏正结构,作为VP的主语,NP2又可以与VP形成主谓
结构,作为NP1的谓语。这样,就产生了潜在歧义。

当实例化为“小王/心肌/发炎”时,可以理解为“(小王/心肌)/发炎”(“小王/
心肌”组成偏正结构作“发炎”的主语),又可理解为“小王/(心肌/发炎)”(“心肌/发炎”这个主谓结构作为小王的谓语,共同构成一个主谓谓语句),潜在歧义转变现
实的歧义。

当实例化为“中国队/冠军/稳拿”时,只能理解为“中国队/(冠军/稳拿)”(“冠军/稳拿”这个主谓结构作“中国队”的谓语),潜在歧义消失;当实例化为“词尾/辅音/清化”时,只能理解为“(词尾/辅音)/轻化”(“词尾/辅音”组成的偏正结构作“清化”的主语),潜在歧义消失。

(10)N1 + N2:

N1可限定N2而与之形成偏正结构,N1又可作为N2的主语而与之形成主谓结构,N1与N2还可形成联体结构或者同位结构,从而产生多种潜在歧义。这种结构我们在讨论汉语词组型术语的潜在歧义时已分析过,不过,在日常汉语中,其潜在歧义更为丰富。

当实例化为“牛奶/面包”时,可以理解为“烤制时加了牛奶的面包”(偏正结构
),又可以理解为“牛奶和面包”(联体结构),成为现实的偏正-联体歧义结构,但
同位结构和主谓结构的歧义消失。

当实例化为“塑料/玩具”时,只能理解为“塑料的玩具”(偏正结构),联体、
主谓、同位等潜在歧义消失。

当实例化为“飞机/大炮”时,只能理解为“飞机和大炮”(联体结构),偏正、
主谓、同位等潜在歧义消失。

当实例化为“今天/星期三”时,只能理解为“今天是星期三”(主谓结构),偏
正、联体、同位等潜在歧义消失。

当实例化为“数学家华罗庚”时,只能理解为“作为数学家的华罗庚”(同位结构),偏正、联体、主谓等潜在歧义消失。

(11)V + N:

在汉语词组型科技术语中,“V + N” 可形成述宾--定中歧义。在日常语言中,这种潜在歧义仍然存在:V可以作为N的述语(N作宾语),V又可作为N的定语(N作中心语)。

当实例化为“翻译/小说”时,可以理解为“翻译某部小说”(述宾结构),也可
以理解为“翻译的小说”(偏正结构),潜在歧义转化为现实的歧义。

当实例化为“开动/机器”时,只能理解为“开动某种机器”(述宾结构),潜在
歧义消失。

(12)V + ADJ:

ADJ可作为述语V的补语,形成述宾结构,ADJ又可作为述语V的宾语,形成述宾结
构。V又可作为主语,ADJ作V的谓语,形成主谓结构。这样,V + ADJ就可具有述补--述宾--主谓潜在歧义。

当实例化为“说/清楚”时,只能理解为述补结构(“说”是述语,“清楚”是补
语),不能理解为述宾或主谓结构,潜在歧义消失。

当实例化为“感到/混乱”时,只能理解为述宾结构(“感到”是述语,“混乱”
是宾语),不能理解为述补结构或主谓结构,潜在歧义也消失。

当实例化为“认识/落后”时,只能理解为主谓结构(“认识”是主语,“落后”
是谓语),不能理解为述补结构或述宾结构,潜在歧义也消失。

(13)V1 + V2(趋向动词):

趋向动词V2可以作为V1的补语,形成述补结构,V2又可作为V1的宾语,形成述宾结构。这样,V1 + V2(趋向动词)可具有述补--述宾潜在歧义。

当实例化为“想/起来”时,可以理解为“想得起来”(“起来”作“想”的补语
),也可以理解为“想从某个地点起来”(“起来”作“想”的宾语),潜在歧义转化为现实的歧义。

当实例化为“坐/下去”时,趋向动词“下去”只能理解为动词“坐”的补语,形
成述补结构,潜在歧义消失。

当实例化为“要求/下去”时,趋向动词“下去”只能理解为动词“要求”的宾语
,形成述宾结构,潜在歧义消失。

(14)ADJ1 + ADJ2:

ADJ1和ADJ2可以形成联谓结构,又可以形成偏正结构,从而产生联谓--偏正的潜在歧义。

当实例化为“干净/利落”时,只能理解为“又干净又利落”,是联谓结构,潜在
歧义消失。

当实例化为“紫/红”时,表示一种“红中带蓝的颜色”,“紫”作“红”的定语
,形成偏正结构,潜在歧义也消失。

(15)V1 + V2:

在汉语科技术语中,V1 + V2具有联谓--状中--述宾--述补歧义。这种情况,在日
常书面汉语中也存在。如果V2是趋向动词,则具有述宾--述补歧义[如(13)中所述]。这里研究V2不是趋向动词的情况。

当实例化为“审核/批准”时,可以理解为“审核并且批准”,是联谓结构,也可
以理解为“经过审核之后批准”,是状中结构,述补和述宾的潜在歧义部分地消失。

当实例化为“分析/检查”时,只能理解为“分析并且检查”,是联谓结构,状中
、述宾、述补等潜在歧义消失。

当实例化为“举手/表决”时,只能理解为“以举手的方式来表决”,是状中结构
,联谓、述宾、述补等潜在歧义消失。

当实例化为“表示/欢迎”时,“欢迎”是“表示”的宾语,只能理解为述宾结构
,联谓、状中、述补等歧义消失。

当实例化为“淋/透”时(“衣服叫雨淋透了”),“透”(V2)表示“淋”(V1
)的结果,是述补结构,联谓、状中、述宾等潜在歧义消失。

(16)N + V:

在汉语科技术语中,N + V 有主谓--状中潜在歧义。在日常汉语中,情况更为复杂,除了主谓——状中潜在歧义之外,还要加上定中潜在歧义。

当实例化为“系统/研究”时,可以理解为“系统被研究了”(主谓结构),也可
以理解为“系统地进行研究”(状中结构),还可以理解为“系统的研究”(定中结构),潜在歧义转化为现实的歧义。

当实例化为“旗帜/飘扬”时,“旗帜”是主语,“飘扬”是谓语,只能理解为主
谓结构,状中、定中的潜在歧义消失。

当实例化为“上午/开会”时,只能理解为“在上午开会”,名词“上午”作动词
“开会”的状语,形成状中结构,主谓、定中等潜在歧义消失。

当实例化为“工业/建设”时,只能理解为“工业的建设”,名词“工业”作动词
“建设”的定语,形成定中结构,主谓、状中等潜在歧义消失。

(17)Prep + N1 + 的 + N2:

介词Prep一般是“关于、对于、在”等,如果Prep的宾语只是N1, “Prep + N1”
与“的”结合成“的字结构”作N2的定语,整个格式是定中结构,但是,介词Prep的宾语也可能是“N1 + 的 +N2”这个名词词组,整个格式是介宾结构。由于层次的不同,
整个格式的含义也就不同,这产生了歧义。

如果介词为“关于”,当实例化为“关于曹禺的书”时,可以理解为“关于曹禺的某一本书”,“关于曹禺的”作“书”的定语,也可以把“曹禺的书”理解为介词“关于”的宾语,形成介宾结构,潜在歧义转化为现实的歧义。

当实例化为“关于曹禺的母亲”时,只能理解为“曹禺的母亲”作介词“关于”的宾语,潜在歧义消失。

当实例化为“关于语法的书”时,只能理解为“关于语法的”作名词“书”的定语,潜在歧义也消失。

如果介词为“对于”,当实例化为“对于老师的意见”时,可以把“对于老师的”理解为名词意见的定语,整个结构是一个定中结构,也可以理解为“老师的意见”作介词“对于”的宾语,整个结构是一个介宾结构,潜在歧义转化为现实的歧义。

当实例化为“对于罪犯的判词”时,只能理解为“对于罪犯的”作名词“判词”的定语,整个结构只能是一个偏正结构,潜在歧义消失。

如果介词为“在”,当实例化为“在路北商店”时,可以理解为“在路北的”限定名词“商店”,作“商店”的定语,整个结构是一个定中结构,也可以理解为“路北的商店”作介词“在”的宾语,整个结构是一个介宾结构,潜在歧义转化为现实的歧义。

当实例化为“在学校的老师”时,只能理解为“在学校的”作名词“老师”的定语,整个结构是一个定中结构,潜在歧义消失。

当实例化为“在学校的图书馆”时,只能理解为“学校的图书馆”作介词“在”的宾语,整个结构是一个介宾结构,潜在歧义也消失。

在汉语中,由于介词对于宾语的管辖范围的宽狭不同而形成的歧义是很普遍的。在英语中,由于介词词组PP的挂靠的成分不同,易于产生歧义。在汉语中,由于介词Prep的管辖领域不同,易于产生歧义。英语和汉语中的不少歧义都是由于介词引起的,但是,歧义产生的条件并不完全一样,这是汉语与英语的不同之处。

(18)VP + ADJ + 的 + N:

ADJ可以作为VP的宾语,述宾结构“V + ADJ” 再加上“的”作名词N的定语,整个结构是一个定中结构,但是,ADJ也可以加上“的”之后作为名词N的定语,“ADJ + N
” 整个名词词组作为VP的宾语,整个结构是一个述宾结构。因此,就产生了定中--述
宾潜在歧义。

当实例化为“喜欢/干净/的/小孩”时,可理解为“喜欢某一个干净的小孩”(述
宾结构),也可以理解“某一个喜欢干净的小孩”(定中结构),潜在歧义转化为现实的歧义。

当实例化为“研究/困难/的/问题”时,只能理解为“研究/某些困难的问题”,“困难的问题”作为“研究”的宾语,形成述宾结构,潜在歧义消失。

当实例化为“显得宽阔的街道”时,“显得宽阔的”作为“街道”的定语,形成定中结构,潜在歧义也消失。

(19)VP + N1 + 的 + N2:

N1作为VP的宾语,述宾结构“VP + N1”加上“的”之后,作名词N2的定语,整个结构是一个定中结构,N1又可与“能”结合在一起限定N2,作N2的定语,“N1 + 的 + N2”这个名词词组再作为VP的宾语,整个结构是一个述宾结构,因此,产生定中--述宾潜在歧义。

当实例化为“咬死了/猎人/的/狗”时,可以理解为“咬死了一只猎人的狗”,“
猎人的狗”作“咬死了”的定语,整个结构是述宾结构,又可以理解为“一只把猎人咬死的狗”,“咬死了猎人”是“狗”的定语,整个结构是定中结构,这样,潜在歧义就变成了现实的歧义。

当实例化为“咬死了/猎人/的/鸡”时,“猎人的鸡”作为“咬死了”的宾语,整
个结构只能理解为述宾结构,潜在歧义消失。

当实例化为“咬死了/狐狸/的/狗”时,“咬死了狐狸的”作“狗”的定语,整个
结构只能理解为定中结构,潜在歧义消失。

当实例化为“卖掉了/猎人/的/狗”时,“猎人的狗”作为“买掉了”的宾语,整
个结构只能理解为述宾结构,潜在歧义消失。

当实例化为“削/苹果/的/刀”,“削苹果的”作为“刀”的定语,整个结构只能
理解为定中结构,潜在歧义消失。

当实例化为“削/苹果/的/皮”时,“苹果的皮”作为“削”的宾语,整个结构只
能理解为述宾结构,潜在歧义消失。

(20) VP1 + VP2 + 的 + N:

VP2 可作为 VP1 的宾语,这个述宾结构再加上“的”作名词 N 的定语,整个结构形成一个定中结构,VP2 又可以与“的”一起作名词 N 的定语,然后名词词组“VP2 + 的 + N”再作为 VP1 的宾语,整个结构形成一个述宾结构,这样,就产生了述宾--定中潜在歧义。

当实例化为“看/打球/的/同学”时,可以理解为“看/打球的同学”,“打球的同学”作VP1“看”的宾语,整个结构是述宾结构;又可以理解为“看打球的/同学”,“看打球的”作名词“同学”的定语,整个结构是定中结构,这样,潜在的述宾--定中歧义就转化成现实的述宾--定中歧义。

当实例化为“练习/跑步/的/运动员”时,只能理解为“练习跑步的/运动员”,“练习跑步的”作名词“运动员”的定语。整个结构只能是定中结构,潜在歧义消失。

当实例化为“修改/编写/的/程序”时,只能理解为“修改/编写的程序”,“编写的程序”作VP1“修改”的宾语,整个结构是一个述宾结构,潜在歧义消失。

(21)V + N1 + N2:

N1 和 N2 可以分别作 V 的宾语, 形成双宾语结构, N1又可作N2的定语,组成“N1 + N2”的名词词组作 V 的宾语,这就产生了双宾语结构和述宾结构的潜在歧义。

当实例化为“赠/日本/图书”,可以把“日本”理解为“赠”的间接宾语,把“图书”理解为“赠”的直接宾语,整个结构是一个双宾语结构;又可以把“日本”理解为“图书”的定语。“日本图书”理解为“赠”的宾语,整个结构是一个述宾结构,这样,潜在歧义就转化成了现实的歧义。

当实例化为“修理/木头/桌子”时,只能把“木头桌子”理解为“修理”的宾语,整个结构是一个述宾结构,潜在歧义消失。

当实例化为“交/老师/作业本”时,只能把“老师”理解为“交”的间接宾语,把“作业本”理解为直接宾语,整个结构是双宾语结构,潜在歧义消失。

(22)V1 + N + V2:

N可与V2组成主谓结构作V1的宾语,形成主谓结构作宾语的述宾结构;N又可作为V1的宾语,作V2的主语,形成兼语结构;N和V2又可分别作为V1的宾语,形成双宾语结构
;N还可作为V1的宾语, 与V2一起,形成连动结构。这样,“V1 + N + V2 ”就可具有
述宾--兼语--双宾--连动的潜在歧义,

当实例化为“希望/小王/来”时,“小王来”这个主谓结构作为动词“希望”的宾语,形成述宾结构,不能解释为兼语、双宾、连动等结构,潜在歧义消失。

当实例化为“请/小王/来”时,名词“小王”作动词“请”的宾语,又作动词“来”的主语,形成兼语结构,不能解释为述宾、双宾、连动等结构,潜在歧义消失。

当实例化为“通知/小王/开会”时,名词“小王”和动词“开会”分别作为动词“通知”的宾语,形成双宾语结构,不能解释为述宾、兼语、连动结构,潜在歧义消失。

当实例化为“上/图书馆/学习”时,“上图书馆”与“学习”形成连动结构,不能解释为述宾、兼语、双宾结构,潜在歧义消失。

(23) N + V + NP + AP:

“N + V + NP”可形成一个主谓宾齐全的句子(小句),作为 AP 的主语,AP作为它的谓语,整个结构是一个主谓结构,以小句作为主语;“NP + AP”又可以作为一个
主谓结构,充当动词 V 的宾语,N 作 V 的主语,整个结构成为一个主谓宾齐全的句子
,如果不管主语N, 则“V + NP + AP”形成一个述宾结构;N 作主语,NP 可作为 V 的宾语,又作为 AP 的主语, “V + NP + AP”形成兼语结构;因此,便可产生主谓(小句为主语)--述宾--兼语的潜在歧义。

当实例化为“张三/笑/李四/很笨”时,可以理解为“张三笑李四”作主语,“很
笨”作谓语,形成以小句为主语的主谓结构;又可以理解为“张三/笑李四很笨”,“
李四”作动词“笑”的宾语,又作 AP “很笨”的主语,“笑李四很笨”形成兼语结构,但这时“笑李四很笨”不能理解为述宾结构,潜在歧义部分地转化为现实的歧义。

当实例化为“小王/说/故事/很有趣”时,可以理解为“小王说故事/很有趣”,“小王说故事”作为主语,“很有趣”作谓语,形成以小句为主语的主谓结构;又可以理解为“小王说/故事很有趣”,“故事很有趣”作动词“说”的宾语,“说/故事很有趣”形成述宾结构,但“说故事很有趣”不能理解为兼语结构,潜在歧义部分地转化为现实的歧义。

当实例化为“他/考/第一名/太好了”时,只能把“他考第一名”这个小句理解为
主语,“太好了”理解为谓语,整个结构只能理解为以小句为谓语的主谓结构,潜在歧义消失。

当实例化为“我/以为/你/喜欢”时,只能把“你喜欢”理解为动词“以为”的宾
语,“以为/你喜欢”只能理解为述宾结构,潜在歧义消失。

当实例化为“张三/批评/李四/不用功”时,“李四”作动词“批评”的宾语,又
作 AP “不用功”的主语,“批评李四不用功”形成兼语结构,潜在歧义消失。

(24)N1 + 的 + N2 + 和 + N3:

由于连词“和”管辖领域的不同,其层次可以理解为(N1 + 的 + N2) + 和 + (N3),也可以理解为 N1 + 的 + (N2 + 和 + N3),从而产生潜在歧义。

当实例化为“眼镜/的/框子/和/镜片”时,可以理解为“(眼镜的框子)和(镜片)”,也可以理解为“眼镜的(框子和镜片)”,潜在歧义转化为现实的歧义。

当实例化为“眼镜/的/框子/和/钢笔”时,只能理解为“(眼镜的框子)和(钢笔)”,潜在歧义消失。

(25)N1 + 和 + N2 + 的 + N3:

由于连词“和”管辖领域的不同,其层次可以理解为 (N1 + 和 + N2) + 的 + N3
,也可以理解为 N1 + 和 + (N2 + 的 + N3),从而产生潜在歧义。

当实例化为“桌子/和/椅子/的/腿”时,可以理解为“(桌子和椅子)的腿”,也可以理解为“桌子和(椅子的腿)”,从而产生潜在歧义。

当实例化“地毯/和/桌子/的/腿”时,只能理解为“地毯和(桌子的腿)”,潜在歧义消失。

(26)N1 + ADJ + 的 + N2:

ADJ 可与 N1 组成主谓结构, 与“的”一起作 N2 的定语,其层次可理解为(N1 + ADJ) + 的 + N2;ADJ 有可以与“的”一起作 N2 的定语,“ADJ + 的 + N2”构成的
名词词组受 N1 的限制和修饰,其层次可以理解为N1 + (ADJ + 的 + N2)。

当实例化为“营养/丰富/的/晚餐”时,其层次为“(营养丰富)的晚餐”,主谓结
构“营养丰富”与“的”一起作“晚餐”的定语,潜在歧义消失。

当实例化为“中国/丰富/的/资源”时,其层次为“中国(丰富的资源)”,“中国
”作“丰富的资源”的定语,潜在歧义消失。

在汉语日常语言中的同形歧义结构还很多,以上只是举出主要的几种来说明,同形歧义结构也是汉语日常语言中普遍存在的现象。

从上所述可以看出,尽管在自然语言中存在大量的同形歧义结构,但是,它们的PT-结构都是潜在歧义结构,在PT-结构实例化的过程中,由于词汇单元的插入,使得许多潜在歧义结构未能转化为现实的歧义结构,从而导致潜在歧义的消失。这说明自然语言的结构在其实例化过程中有一种自行消解歧义的功能,正是由于这种自行消解歧义的功能的作用,尽管在自然语言中存在大量的潜在歧义结构,但在具体的语言活动中,许多潜在歧义都消解了,正是因为这个原因,自然语言仍然能够完成其交流思想的功能,不至于处处产生歧义,引起误解。可见,自然语言有歧义性(ambiguity)的一面,又有
非歧义性(non- ambiguity)的一面,自然语言中充满着潜在歧义,是其歧义性的表现,而自然语言的这种自行消解歧义的功能,又是非歧义性的表现。我们提出的“潜在歧义论”,正好揭示了自然语言的这种歧义性和非歧义性对立统一的规律性。

我们在自然语言处理中,有必要利用“潜在歧义论”的基本原理,克服自然语言的歧义性,增加自然语言的非歧义性,从而提高自然语言处理系统的效能。