《流浪地球》元评论:一场史无前例的神经网络训练
昨天三刷了 IMAX 小破球。入场前陆家嘴黄昏的天际线,散场后东方明珠瑰丽的夜景;游人们永是三三两两地拍着照片,很能够将人从电影场景拉回现实世界。
从年前先行观影会一众大佬的推荐到现在,也过了不短的一段时间。互联网世界节奏如此之快,一些常用于引导舆论的 app 早已换了一波热点。但就在这样的消费主义健忘空气中,我们的#小破球#话题却犹如那木星的大红斑,持久的气旋,仍然在搅动着舆论大气层;就在这两天,甚至还“喜提钟声成就奖”、“喜提钧正平”,累计票房冲上华语电影历史第二位,简直是给一些 PTSD 患者实行饱和式刺激疗法!
当然,这些人也没有闲着;某系媒体据传谋划“黑掉”小破球、大刘形象(“人设”),吴京酒后挪车的新闻被翻出来炒,某教授观影后提出 69 个质疑随后即被附上“编者按”传播,“批评不自由则赞美无意义”……
--
鄙人上次从自己三脚猫的投资知识视角出发,写了一篇为何资本们不会因为一部电影成功就更多投资良心电影的文章。当然后来也有一些别的“更专业”公号来写了,虽然鄙人并不知道他们实际上比我有多专业,但看上去很厉害的样子,就不跟他们蹭热闹了。
这次来写一写鄙人稍微更熟悉一些的话题——机器学习吧!(下称“炼丹”,反正差不多一个意思)
--
关注炼丹界花边新闻的读者应该都知道一个喜闻乐见的项目 DeepFakes……不过不知道也不要紧(你可以看完、喷完之后再搜),类似原理的项目还有很多。前几天刚出的 StyleGAN(生成人脸)、前一阵子还有风闻写过的 style2paints(线稿上色),等等。如果把视野放宽,甚至 Alpha 系列(AlphaGo、AlphaGo Zero、AlphaStar),也具有类似的特点。
这些项目的共同特点是训练方法基于对抗。
DeepFakes、StyleGAN、style2paints 这些都是典型的 GAN 结构。GAN 全称 Generative Adversarial Network(生成性对抗网络),其基本套路是两个网络间进行零和博弈。具体来讲,一个网络负责鉴别(evaluate、discriminate)输入的“真伪”;一个网络负责生成特定的输入以击败前一网络,也就是让前一网络的准确率最低为训练目标。两个网络协同训练、一起进化——显然生成网络的输出全是假的,这部分数据当然就是鉴别网络的训练集。具体的训练方法因为鄙人自己也没玩过。。所以感兴趣的同学可以参考维基百科,以及上述项目的代码自行折腾。
Alpha 系列 AI 的结构并不是 GAN,但它们的训练过程仍然基于对抗。这些网络本身都是智能体,生存环境是某种游戏的状态空间,主观能动性表现为能够执行游戏操作;训练过程的架子基本上是一种“天梯”竞技场,以活得最久、拿最高分为目标,是一种强化学习(reinforcement learning,RL)。
人类社会中,也存在类似的数学构造。
俗话讲“道高一尺,魔高一丈”,这句话能贴切形容的行业,各位看官仔细想想,还不少!
互联网行业喜闻乐见的爬虫/反爬,社会治安中的诈骗/反诈骗、侦查/反侦查,军事中的隐身/反隐、制导/拦截……
当然也有这次要讲的,舆论上的“粉黑”互撕现象。
前面讲,AlphaGo 这种神经网络,本质上已经属于智能体;因为它们有输入输出,能感知环境,能发挥主观能动性。实际上,我们人类本身,按照当代神经生理学的理解,本质上也没有太大不同——感觉神经元收集信息,传入中枢神经系统,经过信息处理后,转化或者不转化为运动神经元的兴奋,体现为影响或者不影响周围环境。
尽管人类至今未能破解大脑的全部工作原理,但按照目前的理解,人脑也是一种神经网络,只不过:
- 神经元数量极其庞大,其中又分出很多规模较小的子网络,执行较为特化的功能;- 神经通路有塑性(plasticity),高频“调用”通路的延迟、信噪比可以自动优化(貌似是加髓鞘,相当于导线包一层绝缘皮),还可以重新编程;- 信息在神经元间的传递并非像人工神经网络一样高度简化(加法),而是基于脉冲的复杂变化;- 一些神经元本身有状态(“记忆”),按照很久以前看过的一篇忘记了名字的文献,它们会自己合成一些新的蛋白质,或者基因片段,具体是为了干嘛好像还不清楚。
简而言之,人类大脑是一个充满“未来感”“黑科技”的神经网络黑盒模型。但很大程度上,它的工作原理,甚至面对训练集的反应,其实与人工神经网络也有几分相似。人脑能提取的特征,卷积层也能提取;一种网络结构总有些困难样本,人脑也有,等等。
站在这样的视角,再来看人类社会,你对一些社会现象的看法会不一样。
--
你终将意识到,
那从散场的影院走出,酝酿着影评的每一个个体;
还坚守在岗位前,履行着职责的每一个个体;
穷困潦倒的,声名显赫的,失落彷徨的,踌躇满志的,
却都是平凡的个体,都说着类似的语言,有着类似的文化,
输入、输出的类型是兼容的。
这每一个智能体组合起来,成为强大的神经网络 ensemble,
来面对下一个未知的输入,做下一个选择。
在这场史无前例训练的另一侧,同样也有着
穷困潦倒的,声名显赫的,失落彷徨的,踌躇满志的,
也都是平凡的个体,也说着类似的语言,有着类似的文化,
输入、输出的类型是兼容的。
这每一个智能体组合起来,却多了资本的加持、神的授意,
也成为不可一世的神经网络 ensemble,
要让天下皈依这天选的安排
——命运天注定。
——龙生龙,凤生凤,老鼠孩子会打洞。
——人人生而平等,但有些人更平等。
——国际贸易中,每个国家应该发挥比较优势,擅长什么,就提供什么服务。
——你今生受的苦,来世终会得报。
……
氢气与氧气正如往常一样混合,直到《流浪地球》这根火柴点亮。
大气爆燃了,训练开始了!
短短的一两周,话题下的语料倍速增长。
正方、反方;反装忠,手动狗头。
政治、法律;天文、地理;投资、管理;讨论,元讨论。
语料的流动是如此迷人,甚至来不及写一个爬虫搜集,因为怕编程挤占了人脑的阅读理解——享受时间!
由于双方个体的分野早已存在,两组 ensemble 迅速自组织起来,形成了阳春白雪-下里巴人的分论坛(战场),意见领袖-吃瓜群众的 ensemble 层次结构,建构了各自的话语体系,并试图解构对方。
双方的注意力向量有如战火,从影片本身的人设、剧情、特效延烧开去,迅速回归了社会治理、政治经济、意识形态的主战场。这何等熟悉、何等亲切的战场啊!
这次的 GAN 战役,反向传播的权值更新之快之剧烈,网络结构的自我调整之灵光乍现,都是这一代年轻的个体所未曾见。
我们在目睹的,无疑是一场史无前例的对抗式神经网络集群训练。
这是千千万万人类至今无力描述的高阶神经网络,
组成了人类至今无力描述的恢宏集群,
用人类至今无力描述的高阶训练算法,
打响的磅礴训练过程;
而这样的磅礴,
只不过是人类进化过程中
从未停止的竞争、厮杀的又一秒钟而已。
--
呼吸着陆家嘴带着些微寒意的空气,面对着繁华的夜景、安宁的人们。
这时代是科幻的时代,我们就生活在这科幻的时代。
胸膛涌现一股暖流,我知道这是名为多巴胺的感动,是大脑的强化学习算法告诉自己——
这事做对了;无论是受到了激励,获得了工作激情这一点,
还是获得了崭新的切入视角,可以发贴走一波阅读量这一点。
找不到好的配图,就不放了,虽然会影响阅读量,不过算了。。。