破解汉字“病于不能分”之谜,将汉字拆分为字根

 ​

   将汉字拆分为字根

——拼形文字(第10篇)

       夏国民

学者李华在公开发表的《汉字部件研究的回顾与展望》一文中指出:“清人王筠《文字蒙求》自序中说:‘人之不识字也,病于不能分,苟能分一字为数字,则点画必不可以增减,且易记而难忘矣’,足见古人早已认识到汉字拆分的重要意义。”——题记

按笔画顺序将汉字拆分为笔画,方法简单,最大优点是有规则可守,近乎有规律可循。但此法的最大缺点是拆分太细,效率很低,不便于实际应用。引入字根概念,将汉字拆分为字根,能够保持上述优点,克服上述缺点。

从笔画角度看,汉字字形是分为笔画和整字两个层次。

从字根角度看,汉字字形分为零件、部件和整字三个层次。这里所谓的零件和部件,是借用机械行业的零部件名词,用于文字领域,是取其相辅相成之意,仅此而已。假设三十三个不同的现代汉字笔画是零件,大概而言,由多个笔画构成的形态则是部件。

通俗地说,汉字的零件和部件统称为字根。汉字的零件就是单笔画,汉字的部件则是由两个以上笔画构成的固定形态。举两个最简单的例子:“一、丨”是零件,“十”就是部件。至于大多数汉字中的部件如何界定,则要先从确定字根入手。

简单来说,字根是由笔画构成的构字单元。严格来讲,只有完全符合特定拆字规则(字根诀)的构字单元才是各字的字根。

将汉字拆分为字根是汉字拆分的第二种方法。细论字根之前,先要明确如下几点。

第一,对于“一、丨、丿、丶、乙”这五个单笔画汉字来说,它们均具有“笔画、字根、汉字”三重身份。

第二,把笔画相对简单且能构成其它汉字的独体字称为字根字。除上述五个单笔画字根字外,现代汉字里还有逾百个多笔画字根字。比如“够”字里的“口、夕”是字根字,但“句”和“多”就不是字根字。至于具体的字根如何确定,稍后说明。

第三,一般来说,人们认定汉字部件的主观性较强,不应该泛泛地就部件论部件,否则很容易陷入见仁见智的争论之中。实质上,务必确定的应该是构字部件。

下面来详细论述字根。

字根大部分是由多笔画构成的构字单元,理应保持笔画构字的三个优点。

其一,笔画交叉构形是汉字有别于其他字母文字最显著的特点,具有二维变化和承载更大信息量的优点,字根自然应该保持重叠构成汉字的优势。

其次,前面提到的字根字,其本身就是构成普通汉字的部件或零件,是特殊的基础字,为了加强离散性,在实际应用时仍应将其拆成笔画进行特殊处理。

其三,现代汉字的笔画顺序规则,是形成字根的重要隐形资源,应该充分利用。

汉字字根不是自古就有的概念,即使固定形态的呈现形式也只能追溯到宋体定型初期。字根是基于大量现代汉字拆分实验的数据统计中优化提炼出来的,其中大部分的形态与汉字偏旁相同。其历史沿革,这里不作赘述。

以下重点讨论字根中的部件。

33个不同的笔画都是零件,至少有两个零件构成的“块”才可称其为部件。当然,字中的零件不能切断或重复使用,这是常识。

一般来说,部件比整个字的笔画少,比零件的笔画多,很多笔画较少的独体汉字,自然而然能够入选构字部件。比如:日月水火,山石田土,人手工干士,口耳目夕了,二三四五六,七八九十丁,厂卜儿几匕,刀力又乃之,工寸大小广,子女马上弓,门己巳尸幺。

上列这五十多个常用字,其中两笔和三笔的就有四十多个。不过,不是所有的两笔、三笔常用字都能入选部件。

具有构字功能是入选构字部件的必要条件,因而很多常见的偏旁都能入选,哪怕像“雨”这样笔画多达八个的都需要入选其中。入选构字部件的最低要求,是至少可以构成另外一个字。比如,已经的已就没有这个资格。

引入构字部件进行汉字分拆,是为了克服“按笔画拆分汉字编码过于冗长”这个效率低的缺点,介于笔画与整字之间的多笔画“块”很多都有必要成为部件。例如,如果将八笔的“雨”做进一步拆分,就会弄成一笔或两笔的一大串“块”,将有五个之多。由此可见,如果单纯讲拆字的效率,部件笔画宜多。倘若按照这个道理操作,最好是把各字都拆成两、三“块”。如果把这里的“块”看成是透明的,自然就能重叠拼汉字。比如将“口”和“丨”拼成“中”。实际上,《说文解字》中,本来早就注明了:“中,从口从丨”。这也就是零件和部件应该被允许重叠拼汉字的理据。

对构字部件的鉴别和认定,从总数上来说,需要综合考虑多种因素,主要在于方便学习与应用的效率权衡。部件数量过多,学习时记忆负担太重,不利于熟悉。数量太少,则容易形成大量重码,影响应用效率。根据数万级的拆字编码对比权衡实验,构字部件总数以二百几十个为宜,接近目前普遍使用的字典词典的部首总数。当然,这里存在一个对其中少数部件认定的社会共识问题,但无论如何,从总体上来说,部件应用效率高是客观存在的。

倘若构字部件总数定了,加上前面论述过的五个有代表性的单笔画字根,全部字根总数也就定了。

从实际应用出发,就具体的汉字论字根,从国家规定的现行一、二、三级汉字中,可以总结出一个严密的将汉字拆分为字根的规则:顺序按笔画,简单让复杂,数量要最少,尽量不交叉。

以上规则具有逻辑性,按此操作能够层层递进锁定各个汉字的字根。通俗地说,如果严格按照这个字根规则拆分普通汉字,针对各个汉字所拆得的字根,答案都是唯一的。如此操作,各个汉字的零件和部件都能一目了然:单笔画字根是零件,多笔画字根是部件。

下图是汉字拆分示例。

500

再以本文标题为例,“将汉字拆分为字根”这八个字的字根数,依次为“3、2、2、3、2、3、2、3”,总数是20个,其中零件只有3个(碰巧是“拆、为”字中的三个“丶”),部件是17个。即使是从来没有学习过这种拆分方法的人,稍为观察一下,也能大致分得出来。按字根分拆汉字的快捷,由此可见一斑。

按字根分拆汉字,关键是严格执行国家颁布的统一笔顺规范,突破了汉字自有字典以来一直沿用的以方框(囗)为代表的部首检字法人为框框的限制,将“国”字的前两笔与最后一笔,按写字顺序拆分成“冂、一”两个字根处理,没有墨守类似方框不能拆的陈规陋习,避免了非笔画顺序之间前笔与后笔隔位拉扯的操作。由于有逻辑性,没有歧义,因此奠定了高效拆分汉字的基础。

站务

全部专栏