OpenAI o3-mini 被曝大量使用中文推理,有什么意义?

因为英语不能表述不存在的事物,掌握人类全部知识的人工智能,在很多领域偏偏只能依赖中文来做记录推理工具。

打比方,英语词汇量大,碰到新概念要造新词汇,参数多,耗费算力大,知识越多,内耗越严重,和用塑料做车一样,塑料用太多影响刚度,造大车的过程把车压垮了。

中文词汇量少,碰到新概念用老词汇组合生成,参数少,耗费算力少,知识越多,越比英文轻松,和用金属与塑料混合材料做车一样,需要精细部分切换英文,用塑料造小细节,需要刚度的时候用金属,车可以造的越来越大。

以 “13 月 32 号星期八” 这样的中文表述为例。

英语中的月份只有 12 个,日期也遵循着固定的数字范围,一周更是固定为七天,这种固化的语言框架限制了其对不存在事物的创造性表达。英文中根本没有对应 “13 月 32 号星期八” 的常规表达。

拿星期八来说,中文都知道这是什么概念。

英文不行。

星期一:Monday

星期二:Tuesday

星期三:Wednesday

星期四:Thursday

星期五:Friday

星期六:Saturday

星期日:Sunday

看看,互相没有关系,星期八要么创造全新的英语词汇。XXXXday。

要么若按字面直译,the eighth day of the week。

那么整句可译为 “the 32nd day of the 13th month, the eighth day of the week”,

但这不符合英语语言习惯和实际的时间表达体系,实际上,在飞速发展的时代,英语一碰到新概念事物,就发明一个新词汇,而且和老词汇基本上全无关联,字母还越来越多,导致英语专业词汇,非专业根本看不懂。

这虽然看似是一个简单的玩笑,但却揭示了英语表达的边界有限性。

除了这个案例,从更宏观的角度来看,英语在推理领域很多地方也存在诸多限制。

在进行复杂的逻辑推理时,英语的表述可能会因为其语法和词汇的限制,难以准确传达那些模糊、抽象或者超越常规逻辑的概念。

例如,在一些涉及哲学思考、量子物理等前沿领域的理论探讨中,英语常常需要借助大量的专业术语和复杂的句式来表达,即便如此,也难以完全涵盖这些领域中那些充满想象力和创新性的思想。

再给个例子辅助理解:不谋全局者,不足以谋一域。不谋万世者,不足以谋一时。看看,这个是中文吃瓜圈路人皆知的基本道理,但是,英语因为专业词汇多,谋全局,是不可能的,谋万世也是不可能的。没人能背出全部专业词汇,牛津词典65万个单词,专业词汇统计不出来,大范围是100万到两百万的词汇量。人,就做不成,人给人工智能的英语语料,一样完蛋了,人工智能如果使用英语,只能在某些项目有突破,一上升到全局和万世这样的高度,不好意思,麻烦人工智能要自己新创造词汇来满足推理需求,否则,都没有人类提供新相关英语词汇做推理。

对比一下,中文常用字3500个,基本满足全局万世的研究工作。虽然汉语字典一共收录五万不到的文字,但是,基本上用不到了。

差距啊,这就是差距。量变,搞成了质变。都玩小作文的时候,用不了几个字,看不出来差距。人工智能玩的就是人类整体知识库,用中文,3500字,搞定。用英文,好家伙,在专业领域,不上100万单词,都是个文盲。

就算创造新单词,精准表达出来含义了,解决了理解描述问题。非专业人士也不认识新词汇,传播和沟通又出现了问题,现在连人工智能都被这些天量词汇拖累了算力。

与之形成鲜明对比的是中文,中文在表达上具有极大的灵活性和包容性。

汉字的表意性使得中文能够通过组合、隐喻、象征等方式,轻松地创造出全新的概念和意象。

例证放下边回应评论里边了。

在人工智能发展的浪潮中,语言的特性对于知识的创新和拓展至关重要。

人工智能需要一种能够容纳人类所有知识,并在此基础上进行创新和拓展的语言。

中文凭借其独特的语言结构和丰富的文化内涵,成为了最适合人工智能发展的语言之一。

中文能够以更加简洁、直观的方式表达复杂的思想,使得人工智能在处理和理解人类知识时更加高效。

同时,中文的灵活性和包容性也为人工智能提供了更广阔的创新空间,使其能够在接受人类知识的基础上,进行更加大胆的联想和创新,推动人工智能技术在各个领域实现新的突破。

回应一下评论区。

问题就出在大语言模型上。

什么是大语言模型?

LLM通常基于Transformer架构,具有海量的参数规模和强大的语言理解与生成能力。它通过在大规模文本数据上进行无监督学习,自动学习语言的语法、语义和语用等知识,能够生成连贯、有逻辑的自然语言文本。

面临挑战

- 数据质量和偏见:训练数据中的错误、噪声和偏见可能影响模型的性能和公正性。

举例子。

一般问题大家看不出人工智能的水平有多差。大家用这个题考考人工智能。

东方哲学总结成十五个字是什么?

标准答案如下。

格物,致知,明德,修身,齐家,治国,平天下。

解释一下。

这看起来是儒家概念,其实可以把道家的无为而治和佛家的因果轮回合并同类项进去。

修身治国四个字,可以用儒家的格物致知明德,也可以用道家的无为而治。

格物致知明德修身,可以用儒家现世思想,也可以用佛家的因果轮回的超现实思想。

总之,儒家十五个字,格物致知明德修身齐家治国平天下,刨除儒家的帽子,方法论上放开限制,兼容道家佛家思想,就可以做到合并同类项,囊括了道家和佛家哲学。

西方哲学,如此合并同类项之后只剩下四个字,格物致知。

在明德修身层面,西方哲学观点是个人主义和功利主义,这就点歪了发展方向。而人道主义和正义原则、诚信责任就成了空谈。

事实证明,俄乌冲突巴以冲突里,西方根本没有人道主义,没有诚信责任,没有正义原则。有的,只是个人主义,功利主义,并演化出种族灭绝和赤裸裸侵略。

哲学是一切事实的概括。

西方事实证明西方哲学上就充满了不人道,不正义,不诚信,没有责任的病灶,这就是个人主义与功利主义。两大系列概念是分裂的,冲突的,只能二者存其一,听其言而观其行,行动上,西方事实只保留了个人主义与功利主义,人道,正义,诚信,责任,都大部分停留在语言上,停留在个人主义功利主义控制的事实外边。

所以,西方哲学只做到了格物致知。

以上这个观点洞察,就是西方语言造成的后果,不能谋全局,不能谋万世,连西方哲学概述里,都存在着明显水火不容的概念。

问题来了,如此不堪的语料能喂出什么样的人工智能?

以上观点都可以拿着给人工智能上课。跟它们讨论一下。

我是讨论过的。

除了上文的星期八案例、哲学案例、这里再补充一个工业大模型的案例。

这是个B站的科普视频,全中文讲解,可以让普通人了解人工智能是如何与工业生产结合在一起的。

这就是中文的魅力,如果旁白翻译成英文,只有工业生产的一线工程师才能知道这个视频在说什么。

现在大家有缘了解到了这个最新最先进的技术,里边的中文通俗易懂,甚至细节部分有傅里叶变换、数学模型补全等等这些英语和数学补足细节,如果大家是做炼铝等其他类似生意,喊工程师过来,大体上思路就有了,一年又剩一大笔钱,产品竞争力又增强了。

这工具通用,大家做其他生意也可以拿来用。

看看,中国人就是这么赚钱的,语言改变了认知能力,思路决定了出路,让中国人越来越优秀,越来越富有。

站务

全部专栏