也谈谈人工智能的内容生成(AIGC)
最近,ChatGPT的风骚对话惹得一众财经类,生活类,房产类,投资类,甚至还有软硬件技术类的自媒体齐声惊呼人类又要被人工智能淘汰了(咦?为什么要说又呢?)。这场西洋景,我本只欲冷眼旁观之。但最近的两件小事,却使我对AIGC有了一点看法,不得不说。
第一件事。前几日,我在查阅技术资料时,偶见一个熟悉的数学定理:指数函数e的x次方求导仍然其本身。虽说熟悉,证明却早已忘记。这个定理的形式过于优美,使我禁不住想要再次学习一下其证明过程。按平常习惯,首先在必应中以关键词“proof of derivation of e power x”搜索英文内容。果然跳出了很多网页。我从前搜索结果中挑选了一个公式排版比较顺眼且提供了多种证明方式的数学类聚合网站开始学习。这一学,掉坑里了。这个网站提供的多种证明,多数是正确的废话。例如,其中一条证明是从更一般形式的指数函数a的x次方的求导公式以及e的自然对数等于1得到。很正确,但不是我想要的。因为e的自然对数为1我还是知道的,而a的x次方的求导公式的证明过程我却同样不了解。看了这个证明,我感觉什么也没有学习到。另一条证明则是将e的x次方先做泰勒级数展开再行求导得证。但泰勒级数展开公式本身又依赖对指数函数的求导公式。属于循环论证。这是我又多花了好多时间复习泰勒级数展开的原理之后才发现的。其它证明方式也有类似问题,多数为循环论证。
在把这个网站的所有相关证明都看过了一遍后,我依然没有找到我想要的那个直接的,不循环的证明,只能看着桌上无情跳动的座钟陷入了沉思。很显然,这个网站的表面功夫做得非常不错。公式有优美的排版。每一步推导还有解释,甚至还有指向所引用定理的证明的链接。这也是吸引我最终点击进去的地方。但是证明的质量与其中的知识含量实在堪忧,使我不得不怀疑网站的内容是人工智能生成的。即使不是人工智能,也至少是某种网络爬虫自动生成的。不然,一个数学专业的网站管理者不会如此放任无效证明堂而皇之地出现。但是,再仔细一想,还是天真了。我们免费浏览网站,只是花了一些时间。但网站要提供服务,是实实在在地花费了金钱。如果没有足够的爱来支持,网站的第一目的并不是传播知识,而是至少弥补亏空。而要弥补亏空,甚至赚钱,最直接有效的方法还是吸引用户看广告。所以,网站的主要功能是吸引流量。把公式写漂亮,收集尽可能多的证明内容,都是吸引流量的方法。至于所提供的证明是否正确,其间又有多少知识,只要不妨碍吸引用户,就不会是网站要考虑的事情。
之前,网站为了吸引用戶,还要四处搬运内容来充实自己。现在,AIGC翩翩而来。对于网站的运营方来说,AIGC绝对是吸引用户的利器。一次运行就可以生成成百上千分内容。组织起一个看起来内容丰富的网站,也许只要一两个小时。尽管现在的AIGC,还常常因为智障内容遭人嘲讽。但于网站而言,只要能以足够的形式吸引来流量即可。至于内容,从来不是网站关注的重点。
对于网站的用户而言,这却绝不是一个好消息。因为这会导致像上述数学证明网站一样充斥着似是而非的内容的网站越来越多。用户想要通过浏览网站而获得所需的信息,只会越来越难。也许,随着AI技术的进步,其生成的内容也将越来越可靠。但现在生成智障内容的AI模型已经大到个人和小型公司无法负担的地步。想要再进一步提高其所生成内容的质量,按现在AI模型的演化路线,其规模必然更加庞大。这会导致生成每一份内容的成本成比例增加。打个简单的比喻。假如现在有两个AI模型,在同样的费用下,一个可以生成100份似是而非的内容,而另一个能生成一份精准专业的内容。那么,网站运营方会选择采用哪个模型来构建网站?答案应该不难确定。
第二件事。还是前几日,我要在自己的云服务器上搭建一个邮件服务。在查看某个邮件服务程序的用户手册时,看到一句话,大意为:“最早的邮件发送服务程序的设计者是一批理想主义的工程师。他们设计这个程序的目的就是为大家提供方便,所以根本没有认证功能。无论是谁,都可以向任何服务器上的邮件发送服务投递邮件”。后来,邮件发送服务的确给所有人都提供了方便,其中包括那些发送垃圾邮件的人。现在的邮件发送服务必须加上某种认证方式,否则迟早沦为垃圾邮件发送源之一。可见,面对任何一项新技术的问世时,除了大声赞扬技术的神奇之外,我们更应该仔细想想,这项技术如果被“恶意”利用,会对我们的生活产生什么样的影响。当年的邮件服务是如此,现在的AIGC亦是如此。技术的演进不会停止,但如何应对新的技术对我们生活的冲击是必须要仔细考虑的。
最后,我还是在百度上搜索到了我想要的那个证明。在某中文问答网站,一个热心网友上传了一张手写的公式推导过程。没有循环认证,直接从e的定义和导数的原始定义推导出来,非常直白。看完之后,我为再次领略了数学的美妙而欣喜。
最后的最后。现在中文互联网巨头们也开始纷纷上项AIGC。凤兮凤兮,何德之衰。往者不可谏,来者犹可追。