汉文字是表意文字,与西方表音文字是存在明显区别

【本文来自《人工智能的基础语言将是中文》评论区,标题为小编添加】

汉文字是表意文字,与西方表音文字是存在明显区别

        在表音文字中,语言是源,文字只是对其的记录,是二手的,是对语言本体的不精确复制。在流通过程中因地域、人种的原因会产生扭曲、变形,于是西方出现了logocentralism主义,认为语言重于文字,因而要通过不精确的文字去尽量还原语言本体。

        汉文字是表意文字,起源于商人具有高度神性的甲骨文。商人仅用其表达对祖先鬼神超越世界的信仰,而非日常生活。周人将其继承下来用于日常生活,虽去掉了其神鬼性,但却保留了文字恒常不变的特性。汉文字的这种抗拒时间、维持不变的恒定特性与真理类似,因而比语言,比其他许多人为的事物,更接近于真理。而语言没有延续性,没有抗拒时间改变、地域改变的特质。因此,古人的文字今人看起来毫无困难,能够精确理解;但对他们当时所用的语言则绝无可能听懂。不仅如此,如今各地的方言差别之大足以令人懵圈,但假如落实到文字上则理解毫无困难。

         由此可以理解,西方的表音文字系统与中国的汉文字系统在承载的信息容量上差别巨大。汉文字系统由于其本体性、恒定性,包含的信息时间上从古至今、范围上涵盖中华文化圈。而西方表音文字系统,作为语言的二手不精确的副本,无论从时间延续上还是涵盖的范围上,都与表意的汉文字差别甚远(没有任何一种西方文字像汉字一样贯通了古今!)。

         生成式人工AI是从文字途径模仿人的思维的,使用何种类型的文字将影响其思维生成的水平。如何应用工程上的方法,将汉语言所包含的多维度的信息(不是指目前西文的多向量,而是类似于汉字本意之外的情感、意象、隐喻、指代甚至气味、质感等多维度)利用起来,有可能会产生新的突破!

        最后总结一点,所谓特定人群(或者特定生物群体)的文明,就是该群体自诞生起至今产生的所有信息总集合(此处的信息定义是指物理学中的熵的度量值)。目前该信息集合的表达是以人类能够理解的形式,如文字、语言、思想学说、习俗、音乐、绘画、饮食风格、审美观念等展现的。今后随科技的进步,基因、蛋白质组甚至AI等都会加入其中。但这些仍然只是该信息集合的一小部分,大量的集合内因子会随着人类的进步逐渐被认识。

站务

全部专栏