现在大语言人工智能,如何在新增加更多更丰富语料时,让模型更接近智能本质

【本文来自《人工智能的基础语言将是中文》评论区,标题为小编添加】

  • 普洛科皮乌斯
  • 汉语是以义造字,也就是在对事物和人的行为之间的相互关系有所认知和理解的基础上造字,所以要彻底弄明白一个汉字的字义,搞明白与这个字有关的词为什么是这个意思,只有知道这个字最早出现的样子,以及最早被使用的场景,就豁然开朗了,比如“权利”的“权”。诸如拉丁语英语之类的字母字是以音赋义,也就是说字母字并不探究事物与人的行为之间的关系,而是一个人告诉你这个东西叫什么,这个东西就被这么叫了,被告诉的人知道怎么发音就可以了,被告诉的人永远搞不明白为什么这个东西要这样发音。

    所以,个人以为,西方文化就是洗脑文化,所以西方历史上【先知】层出不穷。

造字法有象形,指事,会意,形声,用字法除了对应使用还有有转注,假借。造词法就更多了,就我查到的有词法学,句法学,修辞学,语音学,综合式,隐语等等方法。

我觉得归纳为以义造字不准确,但是汉字系统优势可能是随着造字造词指代事物更加具体,字词的本质或者说是义就会历史性的展现出来。

比如"权"字造出来时指代的事情可能比较具体,是某种树,但随着如权衡,权杖,权威,权秉,权力,权利,权责,权且,权变等等随着社会历史发展,而产生的一系列和权相关的更具体的指代的词语的出现,权字本身的指代就会随着社会历史发展不断抽象化,本质化。为学日益,为道日损,这两个看似相反的过程同时发生,当字词文章指代事更准确更具体时,对字词指代事物本质的认识也在同时深入。

而现在大语言人工智能,如何在新增加更多更丰富语料时,让模型更接近智能本质,而不是随着语料而偏移,那么同时具有变化丰富性和本质稳定性的文字系统就会使历史的必然选择。

站务

全部专栏