AI将进入的汉语的时代
DeepSeek的横空出世,估计让很多人都懵了,较小的成本开销,实现了很好的效果。估计很多人不服,不服没有用,效果实实在在的放在那里。最让有些人难过的地方,这是一群普通的中国年轻人,他们绝大部分在中国大陆上学,进入社会的时间也不是特别长,他们就搞出了这个震惊世界的产品。
这颠覆了传统的理论体系,传统的那个体系是中国人是不能做创新的,新进的技术要有人从国外引进。人工智能是需要大量对算力,中国因为先进的芯片受限,无法在人工智能领域领先世界。
一个DeepSeek让这个理论都崩溃了。
这段时间,我也密集的和行业内的专家们进行了讨论,昨天下午还参加了一个行业内的聚会,讨论原因何在。
当然对这样的一个技术,完全搞清楚还是需要时间,我也相信,人工智能再进入一个汉语的时代。
1.用专用模型优化通用模型。说这句话不知道有没有人听得懂。在大模型开始炒作的时候,openAI代表的公司,走的路线图就是多模态通用大模型,关于这件事情我在我的书中,两年前就指出,这有一定的问题。这两年我陆陆续续的多次表达过。用通用的大模型,想用一个模型解决所有的事情,这是非常不现实的,这个过程需要大量的算力,而大量的数据也是冗余的,甚至是有干扰的。
我相信DeepSeek这个用的思路,是把通用的模型和专用模型结合了起来,我用一件事情,可以作为一个证明。DeepSeek会骂人了,而且他会模仿鲁迅的风格,这个风格惟妙惟肖。用ChatGPT是不可能的,我认真研究以后相信, ChatGPT主要还是基于知识和逻辑进行训练。事实上鲁迅的语言风格,并不是知识,也不是逻辑,对语言进行专门的训练和优化,才让我们看到了,表达上多么有意思,基本的信息可能是一样的,输出的风格却是完全不同。
用专用的模型进行专门的优化。跟着别人抄永远没有突破。然而一个改变却可以有完全不一样的感觉。
2.我们经常在说神经语网络。其实人类的语言,就是一个编码和解码的系统,我们把世界的理解把知识,编码成为语言,通过声音传递到对方。对方进行解码,获取相关的信息。
世界上有很多语言,尽管今天有很多人看不起汉语,但是我们老祖宗创造的语言,是这个世界语言,最有生命力的语言,而我们的汉字,却用最小的成本开销,实现了最大的信息传输。
DeepSeek当今世界上对于汉字理解最深刻的模型,把对汉语和汉字的理解达到了至高的境界,同时也有利用汉语和汉字的能力,提升自己模型的效率。用低成本的开销,获得很好的计算、推理效果。
这件事情相信很多人心里听了还是很不舒服,汉语和汉字又要被尊重了,他们动不动冒几句英语不是显得不那么高级了吗?
作为一种高效的信息编码,汉语在人工智能的处理过程中间。极大的提升了效率,也大大的降低了成本。
据说西方已经开始,重新去研究汉语了,甚至要去学习中文了,估计很多人没有想到吧,没有想到,你就会落后。