下意识去中华文明因子的韩国,没未来!
出处 | 策辩
人得知道自己从哪里来,国家亦如是!
2月16日,韩国统计厅发布韩国2024年人口数据。韩国很高兴,2024年出生人口为23.8万人,较2023年增加8300人,同比增加3.6%,时隔9年止跌回升。
韩国怎么解释的呢?
韩国媒体理由说了一大箩筐,总结起来主要有2大点:
一是韩国政府“英明”,政策得力有效果;
二是韩国民众“有觉悟”,婚姻生育观开始积极。
不过傻子都知道这是一种暂时现象,如美国纽约时报也关注到了这一消息,毫不留情指出韩国生育率仍然为全球最低,并隐晦指出这必定是短暂波动。
其实2024年出生人口增多,哪有那么复杂,就5个字:想生龙宝宝!
2024年是甲辰龙年,在中华文明圈龙象征着吉祥、尊贵和成功,人们普遍认为龙年出生的孩子会拥有非凡的命运,会给家庭带来好运。因此,许多家庭倾向于在龙年生育孩子。
韩国传统上同样有如此认知,2024年在韩国被称为青龙年,而青龙被视为好运的象征。
韩国发布相关消息的媒体不少是韩国国家媒体,如韩联社,信源是韩国官方,他们这种认知,某种程度上反映:该国受美国影响控制,下意识的排斥中华文明因子,否定自己从何而来!
事实上,中华文明才是整个东亚在人类文明历史长河中,长期领先于世界,面临危机时又能反复崛起的根本原因。韩国这种下意识的去中华文明因子的行为,是在自断未来!
这不是喊口号的大话,而是随着人工智能加速演进,这个世界越来越意识到的真理——华流才是顶流。
过去一些年,坊间一直有传言:联合国文件,中文版是最薄的!
薄意味着什么?
意味着中文作为有价值信息传播的载体,效率是最高的。为了再次验证这个传言,笔者又搜索了一下。当下搜索工具基本都已经接入AI工具,用以提高效率,其直接罗列答案:
2016年版联合国秘书长工作报告,各语言版页数:
中文:32页;
英文:36页;
法语:41页;
西班牙语:41页;
俄语:46页;
阿拉伯语:51页。
因为写韩国,所以专门问了韩文版,列出的信息是43页。中文仅仅32页,传言不虚。
效率意味着什么?
成本、竞争力!
这在AI时代,体现得尤为明显。
想必不少伙伴们用AI工具,已经经常接触到一个度量单位:tokens。因为这是大模型收费的定价单位,如GPT-4的输入Tokens每百万收费2.5美元,输出Tokens每百万收费10美元;收费版Deepseek价格为每百万输入tokens 2元,每百万输出tokens 8元(题外话:拿tokens做锚的话,享受同等服务,人民币和美元汇率是1:1.25,人民币1元可以换1.25美元)。
在处理汉字时,通常将每个汉字视为一个独立的识别单位,即一个token代表一个汉字;而处理英文时,则通常是,一个Token大约对应0.75个单词或3-4个字母。
我们都知道,AI模型的搭建和训练,需要投建算力中心,投喂海量数据。那么得出同等有价值信息,这个时候你是否意识到:汉字资料绝对是这个世界效率最高,成本最低的。
所以今年年初幻方量化Deepseek出炉时,让美国深感挫败,,觉得天塌了。除了Deepseek开发者天才算法设计外,就是汉语资料信息密度远比英语资料高得多,从而大幅度减轻了AI数据处理的负担。
这同样是有根据的。
美英语言学家自己都有过统计,英语每年新增的专业词汇量,是汉语的7.6倍。反过来讲,同一件事,英语要让AI明白需要处理的数据量是汉语的7.6倍。只有这样,AI才能建立完整的认知知识体系。
更让美英难受的是,汉语底层逻辑实际是二进制(如著名的八卦),绝大数词汇都是由3000-3500个常用基本汉字组合排列。而英文不断新造单词,搜索相关资料给出的答案是年增4000个单词。
据统计英语词汇量已经达到了106万个左右,并且还在不断增加。汉语虽然每年也增加,但其增加词汇让人望文生义,一见便知。
而上述词汇、文本信息给AI处理,都是要算力,要成本的。所以Deepseek只用了OpenAI不到百分之一的算力,十几分之一的成本,就搞出了比肩甚至很多领域超过他们的AI大模型。
Deepseek出来后,美国人工智能大模型研究专家进行过对比研究,给出的结论是:汉字模型在处理复杂逻辑时,神经网络的能耗比英文模型低42%,训练周期缩短70%。
时间短效率高、能耗还低,中华文明不愧于才是世界顶流!
再注意2016年联合国秘书长的工作报告,比中文仅差4页的英文,AI领域都竞争不过,那多了十几页的呢?
韩国政府抵制Deepseek,韩国媒体下意识去中华文明因子,捧美国的臭脚,绝对是最错误的选择!