不揣冒昧,谈汉语基因的潜在生命力

不揣冒昧,谈汉语基因的潜在生命力

——拼义语言(第8篇)

夏国民

上篇所述的汉语词根,主要说的是能组成汉语多音节词的单音节词。要进一步探索汉语词根的应用价值,对与其相关词语的产生有必要作一些深度说明。

首先应该强调的是,汉语有的多音节词中并没有词根。比如:吖(ā)嗪(qín)、吡(bǐ)啶(dìnɡ)、嘧(mì)啶(dìnɡ)。这些词都是汉化词,是当时通过增加新字组成新词用以表达新概念,其来源或词源对应的是外语单词 [英azine、pyridine、pyrimidine]。因而有很多这类汉字都不是汉语词根,古代的如“袈、裟”,现代的如前述“吖、嗪”等。

其次,新增的汉字也有经得起必要充分条件检验的汉语词根。比如:的(dī)单独是“的士”(小型载客出租车[英taxi])的简称,是用假借方法创制的一个汉字,并且可以组成“打的、的哥、的姐”等多个多音节词。的(dī)也是2010年出版的第11版《新华字典》才增加的汉语词根。

另外,汉语中还有很多诸如国名、地名、人名、术语等词汇,是用规范汉字作为音化字来记写译音和方音的,比如:西班牙、乌鲁木齐、普京、奥林匹克。但音化字只是规范汉字的附加职能,由音化字组成的多音节音译词,其词源自然应该另当别论。

由此可见,汉语的词根与词源是两个不同的概念。这也从一个侧面佐证了“汉语词根是单音节词且能组成多音节词”必要充分条件的逻辑性。以此还可以简单导出,探索词根的应用价值,一般来说没有必要对大多数词根进行追根溯源,探究的重点应该是现代汉语词根的音和义。

《通用规范汉字字典》包含着8105个规范字,其中多音字有597个,按汉语拼音排列的字头是8702个。

辞书中都把字的不同读音称为音项,把词的不同含义称为义项。

音项和义项是汉语的两个粗分类别,单独无意义的字通常也被混淆在其中,一句口头禅“汉字都有音项和义项”就是典型的错话,实际上单独无意义的字是没有义项的,只是人们一般不在意而已。

对于单音词来说,音项和义项都有实在的内容。当然,多音词的义项内容也都是实在的。

在大多数辞书中,音项都按字头分开了,一查便知,无须深究。再撇开单独无义的字不谈,那么,单独有意义的字或单词的义项,实际上主要是汉语词根的具体内容,其数量和潜力需要深刻挖掘。

前面论述过(详见第2篇),汉语的基本表意单位也就是指单独有意义的字或单音节词,前者是为了区别“拼音文字都没有这种单位”的另一种说法或称谓。

汉语的基本表意单位即单词,大约占《通用规范汉字字典》中全部字头的90%,总数有7000多个。而汉语词根则是进一步缩小了范围的、能够组成多音节词的单词,也就是汉语中最小的音义结合体。词根大约又占单词的90%,总数是6000多个。

汉语的很多单词都含有多层意思或多种含义,尽管传统的称谓是义项,但本质上是词的成分,义项的称谓有点粗放,从微观的视角看称为因素更合适。如此说来,汉语基本表意单位里的具体因素,其简称就应该是汉语基因。反过来说,汉语基因就是词根的具体因素。

基因一词原来的意思是生物遗传体的基本单位,如果说汉语基因有借用之意的话,不妨说是有喻意其微。

尤其值得注意的是,汉语里不少的多音节词也含有多层意思或多种含义,传统的称谓也是义项,本质上也是词的成分,也可以称为因素,但其前提不是基本表意单位或词根,因而多音节词的义项不能称之为汉语基因。

为了便于词根具体因素的数字化处理,如果用因子来称因素也许更贴切。尽管因子的原意是约数和因数,但汉语的增值机能(后文将有论述)是可以赋予因子新一层意思的。

汉语的基因非常丰富,是因为很多词根都有多个因子,下面以“打”为例就可见一斑。

打有dá和dǎ两个音项。“打(dá)”是量词,只有一个义项或因子,意思是某些东西12个叫1打,如:一打铅笔,两打毛巾。

《通用规范汉字字典》上的“打(dǎ)”有20个义项或因子,每一个都有释义和组成词语的范例。

第12版《新华字典》上字头的义项编法有所不同,“打(dǎ)”只有①—④共4个义项或因子,但“②表示各种动作,代替许多有具体意义的动词。”②中又细分了1—16个细分因子。另加①中有1个引申因子。其因子总数、释义、范例,都与《通用字典》差不多。

第7版《现代汉语词典》上“打(dǎ)”有24个义项或因子,具体因子比字典收集得更多。这也说明,汉语基因不是固定的。

综上所述,仅仅一个“打(dǎ)”就有如此众多的汉语基因,它们能够参与组成非常多的多音节词和复合词,足以表达与其相关的概念。由此可见,汉语单词能够承载很大的信息量,汉语潜在且强大的生命力就蕴含在汉语基因之中。

即使仅就基本表意单位而言,汉语词根也在随着社会科技文化的发展而不断生发,稀土元素名称就是近现代比较新的创造。

500

实际上汉语基因也是开放的,汉语基因或因子越多的字,其构词功能往往越强。比如“上(shàng)”就有18个因子,能够构成很多与其相关的词。再比如字形最简单的“一”字也有10个因子,能够组成几百个概念不同的多音节词。

汉语词根的应用价值,实际上就是这样深刻地体现在汉语基因的精细之处,精准表达和逻辑追求都开始于此。

整体上来说,汉语基因数倍于汉语词根,就像一座积累了几千年的智慧宝库,博大精深,生生不息,无边无际。

下面梳理一下从现代汉字到汉语基因的关系。

现代汉字——单音节词——汉语词根——汉语基因

现代汉字=单独无意义的字+单独有意义的字(单音节词)

单音节词=不能组成多音节的单词+能组成多音节的单词(词根)

汉语词根=能够组成多音节词的单词(单音节词)

汉语基因=单音节词的义项(单词的因素或因子)

如果把汉语基因比作能打开汉语词语宝库的钥匙,那么,汉语基因的不同字词适配形成不同的概念就是密码。所谓掌握了汉语密码钥匙的高手,就是那些深谙汉语基因、选词和造词套路、特别会遣词造句的人。而不断积累汉语基因,包括阅读、视听、口语交流、理解消化等,则是大众提高汉语水平的基本功训练,其上才是语言文字在生活和工作中的实际应用。

不言而喻,汉语基因的积累是比汉语词汇更深层次的积累,但往往被人们所忽视,习惯于模糊应对。

汉语最大的特点是基因多、规矩少,能灵活表达,在很大程度上影响着汉语母语者的思维。

人工智能过目不忘,能读取它所能读取的所有汉语密码,因此,理解能力和表达能力强大。当下人们都感受得到,汉语正在赋予人工智能无可比拟的潜在能量,无论如何,汉语的前途一片光明。

站务

全部专栏