看起来聪明的人工智能,其实还处于“史前文明”阶段?| 造就·邬学宁

经历了数十年时间的积累,人工智能、通信、大数据等技术与产业进入了高速发展的阶段,全域智能时代已经来临。

2020年,新基建的提出,给全行业设定了一个明确的发展方向。造就与张江集团共同推出“新基遇”系列Talk,探讨新基建对于社会与人类未来影响的同时,也希望能够推动不同行业间的交流。

本期内容出自造就x张江「新基遇」系列Talk第〇期——智能新价值

500

邬学宁

e成首席数据官

AI在新基建中扮演什么角色?

让我们先来回顾一下历史。公元前300年的都江堰,和公元300年罗马人的饮水渠,是人类历史上迄今为止仍然在工作的水利系统,它们灌溉了我们的农业文明;从有电以来,电灯泡给我们带来了光明,然后到特斯拉(Nikola Tesla)的交流电孕育了我们如今的工业文明;而今天我们进入了云和大数据时代,各行各业的应用都已经上云了。

云计算带来的另外一方面,就是产生了很多很多的数据,而这些数据当中就孕育了数据的智能。当人工智能成为我们所有社会应用的基础设施之后,必将会使人类进入下一个智能时代。

其实人工智能现在已经是无处不在了,但是人工智能成为新基建又意味着什么?人工智能在新基建当中的地位是怎样的呢?

大家都已经了解新基建有7个主要组成部分。除了人工智能以外,其他6个都是很具体、具象的技术,而只有人工智能比较“虚”。

新基建当中,人工智能首先会用到三个支撑技术——这一波人工智能主要是靠大数据,所以大数据中心是人工智能的一个重要基础;第二个是工业互联网,工业互联网产生了非常多的数据,这些数据到大数据中心也给人工智能产生了很多燃油;还有5G,5G高速的通讯速度会给我们将来生活的世界带来很多改变,也可以和人工智能产生一些化学反应,孕育出新的应用。

那么除了这三个之外,其他技术也和人工智能有着密切的关系,更多的是人工智能去赋能这些技术。无论是新能源充电桩,还是特高压以及城际交通,当中都会产生非常多的数据。

比如说特斯拉的充电桩,其实你可以把它看成是个大号的iPad装了4个轮子,它的核心技术不是造车。用人工智能技术精确地控制了7600块锂电池,每一块电池都单独地控制它的电压和电流,这才是它的核心技术。

特高压、智能电网也用到了非常多的人工智能技术,比如说在一些设备的预防性维修等方面用了很多算法。

500

AI已融入我们的生活,但数字化转型之路仍漫长

大家知道从AlphaGo打败李世石开始,所有媒体都对人工智能进行了大量报道。我们日常生活当中到处都能看到人工智能:女生的美颜相机、车牌识别、非常多的导航系统、手环手表、电冰箱……

美国有个统计,电冰箱里面有20%的食品基本上都是临近保质期的。韩国的一个电冰箱厂商,它的产品会识别食物的保质期,在临近保质期的时候会提醒你要不要购买,然后一键就可以给你购买。所以未来,电冰箱可能是一个入口——未来电冰箱可能完全免费,因为你需要什么,它就可以给你送什么——就是把一个产品经济向服务经济和体验经济转化的一个非常重要的入口。  

右侧是我们一个养猪的客户。从猪生下来打耳标开始,全都是用物联网技术,跟踪养猪的整个生命周期过程。

所以其实人工智能大数据已经在我们的生活中无处不在,只是可能在用的时候,你没有感觉到。那么未来的趋势是什么?人工智能不再是作为一个一个单独的技术,它将成为一种基础设施,赋能所有的行业,赋能所有的企业。

当人工智能成为新基建之后——

第一,它会成为一种新的元能力。所谓元能力就是赋能其他能力的能力,它会赋能到其他基建以及基于基建的上层的应用和产品的能力。

第二,AIaaS(AI
as a
Service),人工智能作为一个服务。它首先要变得非常容易调用,成为基础设施之后大家都要去调用它,不能搞得很复杂。我们现在有很多算法,虽然也提供了服务,但还是很难调用。因为有很多不同的算法,你要搞清楚什么时候用决策树,什么时候用神经网络,什么时候用贝叶斯方法等等。 

第三,就是荀子讲的,“君子善假于物也”,“登高而招,臂非加长也”。其实未来从企业的角度,从社会的角度上来说,如何获得竞争优势,非常重要的一点就是看你是否拥有善于利用人工智能的基础的能力。并不是说每个企业都要去找数据科学家,都要去请很多人工智能的专业人才,而是我们都可以利用基础设施,利用基建里边的人工智能的能力去赋能我们的业务。

AI将在哪些领域有所突破?

未来十年,人工智能可能在哪些领域有所突破? 

第一是想象力。大家可能知道有本书——尤瓦尔·赫拉利(Yuval Noah Harari)写的《未来简史》,其中就讲到了想象力。想象力是人和其他动物最大的差异之一,而目前人工智能有很大的问题——其实它没有想象力。

500

人工智能没有想象力

这是在德国发现的目前人类历史上最早的雕塑之一,这个雕塑是人的身体、狮子的头。虽然现在人工智能也能做一些艺术的东西,也能写个诗,但它其实并没有真正地理解。那么人工智能什么时候能够具有想象力,这可能是通往通用人工智能的一个非常关键的步骤。 

第二个方向就是脑科学的进一步研究。我们人一般有1000亿个神经元,每个神经元跟其他的神经元有1000个连接,所以我们有100万亿的神经元连接,数量非常大。

目前即使是最复杂的人工智能神经网络,跟人的大脑的神经元连接的数量大概还差10的6次方的数量级。为什么现在人工智能看上去还很傻?因为在通用人工智能领域,它可能只是一岁到一岁半的水平而已。从硬件上来说,现在的计算力还不够,现在的人工智能神经网络的神经元数量和连接数比人的大脑要少得多。

第三是情感。现在人工智能基本上没有情感,没有情绪,它不会发怒、不会生气、不会高兴。现在人工智能当中有一个领域也很火,就是做情感分析、情绪分析、微表情分析——你笑了,它就知道你笑了,但是笑有很多种,冷笑、苦笑它就很难识别出来。

美国的一些科学家发现,其实人的情感可以解构成两部分,一部分是脸上的表情,另一部分是身体的温度。其实我们人的表情也是训练出来的,每个人的心跳、身体的温度不同,对应的表情可能是不一样的。所以现在有一个观点,认为人工智能也可以有情绪,我们人的表情是可以训练的,人工智能的情绪也可以训练出来。

500

人工智能没有常识

目前的人工智能看上去很聪明,但其实它在很多方面非常弱智,最基本的常识都没有。比如说最左边这张桌子,上面放了一些红色和黄色的方块,我推一下桌子,是红色方块掉下来多,还是黄色方块掉下来多?大家一看就知道,肯定红色方块掉下得多,但这个问题目前的人工智能解决不了。

上面第三张图片上,桌子上放了4个颜色的16个物体,这个人随机抓一个物体看是什么颜色,然后人工智能算法根据人的动作来猜测她什么时候要去抓哪一个物体。下一步就是对面放一个机器手,人要去抓哪一个,机械手就会过来去帮助抓哪一个。你下一步要做什么,对现在的人工智能来说还是比较难预测的。

现在的人工智能是没有解决问题的能力,没有推理的能力,很难判断你的意图。

其次,我要讲一讲过去10年人工智能在发展过程中的误导或者说必须经历的阶段。

12年的时候,大家知道有一本书叫《大数据时代》,非常强调相关性,包括我前几年也是持这样的观点。比如我给中国某个大型超市做分析,发现了一个规律——买车厘子的顾客很多会买山东桃,我就会建议他们把山东桃放在车厘子边上,互相带动销售。但你不要问我为什么,我不知道为什么,我只是从数据当中发现这个规律。

500

《大数据时代》 维克托·迈尔-舍恩伯格&肯尼斯·库克耶 【著】

在很多行业里,在过去很多的场景当中,通过大数据我们发现了很多相关性——弱的相关性,但我只能告诉你这两个事情之间是有相关性的,却不知道原因。

所以未来十年,我们可能会去研究因果。《大数据时代》这本书当中有一个非常重要的观点:你不要知道因果,你只要知道相关性就可以了,它能够帮助你带动业务发展就可以了,不要问为什么。但其实很多事情我们还是需要知道为什么。

比如说我同事今天去医院,他发烧了,他会去抽血验一下白血球。如果白血球升高了,说明它是细菌性的,问题不大;如果白血球没有升高,说明这是病毒性的,有可能跟新冠有关系。这个事情是有因果的。

500

相关性与因果

再比如,有人发现冰淇淋跟晒伤之间有相关性,还与游泳池里淹死的人有相关性,但你不能说因为冰淇淋卖多了,导致游泳池里淹死的人多了。我们原来发现的相关性就可能陷入这样的困扰中——是游泳池里淹死的人多了导致冰淇淋卖多了,还是冰淇淋卖多了导致游泳池里淹死的人多了。其实都不是,背后隐藏的原因是温度升高了。

所以未来人工智能的发展方向中很重要的一点就是相关性,它是在因果关系之梯的最底层。我们首先要知道相关性,第二步我们要知道为什么,要知道原因。知道原因的话就要通过一个干预的动作,去人工介入到实验当中,传统的统计学里就是控制组、实验组。

另一个重要的层面就是反事实,是人工智能从最底层的发现相关性开始,接下去它会推理是什么原因导致了结果,再往上面人工智能要会想象。我刚才讲的想象很重要,这个事情如果没有发生结果会怎么样,从来没有发生过的事情人工智能也要能够知道。

我们现在的人工智能是基于大数据的,一定是发生过的事情才有数据,没有发生过的事情是没有数据的。未来,人工智能就是没有发生过的事情也能推理。

那么从未来人工智能非常重要的一个来源——脑科学和心理学的角度上来说,大家都知道巴普洛夫(Ivan Pavlov)的狗,中间这个是桑代克(Edward Thorndike)的猫。二者的区别是,桑代克把猫关在笼子里,里面有开关,摁一下门会打开。猫第一次放进去的时候,要很久才发现这个开关。摁一下之后门打开,猫出去了。第二次把猫放进去之后,猫立刻摁开关就出去了,它的学习时间很短。

500

巴普洛夫的狗、桑代克的猫与斯金纳的老鼠

第三个是斯金纳(BF Skinner)的老鼠。斯金纳把老鼠关在笼子里,笼子里有两个按钮,一个按钮按下去有好吃的掉下来,还有个按钮按下去警铃大作。老鼠一不小心碰到警铃把它吓坏了,所以第二次再把它放进去的时候,它看到警铃就会躲得远远的。

这是心理学当中的一个学派——行为主义。行为主义认为心理学没有办法知道别人脑子里究竟在想什么,只有观察他的行为。这个学派就直接导致了人工智能当中的强化学习这一派在过去几年中的蓬勃发展。

AlphaGo就是一个典型。AlphaGo的核心思想就是从心理学这一流派衍生出来的。今天非常火的深度学习,本质只是做一个映射,把输入到输出之间做一个映射,然后做一个数学上的最大值或者最小值,其实它没有智商、没有情感。AlphaGo棋下得再厉害,它也不知道它在下棋,而且它很容易被骗过。

第四个是无人驾驶。无人驾驶非常高大上,但是无人驾驶公司不会跟你说,他们请了很多很多人给这些卡车、汽车、行人、红绿灯打标签。他们在这上面花的钱,比请所有数据科学家加在一起还要多。所以今天的人工智能是有很多人工的,没有人工就没有智能。在里边打标签最终表现出来的智能,其实人工比智能还要多。

包括我们的机器翻译,实际上今天的机器翻译并不懂它在翻什么,它不懂意思,但是它翻得很好。所以今天的人工智能表现出有很高的智能,其实它并没有智能。

500

未来十年人工智能趋势与挑战

总结一下未来十年人工智能发展的一些主要方向。

第一是从相关性到因果。大家现在非常关心相关性,不太关心因果。

第二是从感知到认知。今天的人工智能主要都是感知,能够知道周围发生了什么,但是它不能够认知。从感知到认知有很多途径,比如我刚才讲的脑科学、符号主义(注:符号主义就是第一波人工智能和第二波人工智能中,人们认为智能可以是通过计算得到的,明斯基有一句话就是,“大脑只不过是肉做的机器而已”。)、意识(有科学家提出,人的意识是长期记忆跟短期记忆当中进行转存的时候所需要的一种能力)以及强化学习。

人工智能什么时候能够自己有兴趣去做一件事情,而不仅仅是受到外界的一个奖励?今天强化学习的AlphaGo,它只是因为我们给它外界的奖励,它没有内在的兴趣,我们能不能想办法让人工智能有兴趣去做它自己想做的事。

还有一点非常重要,我们现在这一波人工智能当中最火的这些技术,都是二十年前就已经发明了的。现在的人工智能缺乏理论上的储备和突破。所以未来十年当中,从学术领域来说,人工智能能不能出现大的突破,也挺令人担忧。

AI的未来发展有哪些隐忧?

我们现在的人工智能繁荣,只是因为现在的计算力和数据足够多,把二十年前、三十年前的技术实现了而已。

最近人工智能的主要发展来源是什么?第一是脑科学、心理学,第二是经济学、博弈论。去年的图灵奖得主杰弗里·辛顿(Geoffrey Hinton)带来的深度学习热潮,其实其起源是量子力学的玻尔兹曼机。所以我们看到人工智能的发展不是在计算机科学内部,而是其他领域给人工智能的发展带来了很多新的思想。

所以我觉得人工智能一定是人才之争。人才培养需要从本科生开始,要通才教育。至少你把数学、统计学这些基础学好之后,要学得很宽广,要有人文科学。硅谷已经让大家知道科技是可以改变世界的,但是如果我们把人文科学放进去的话,结果将是不一样的。

现在的人工智能就是我们知道它、知道怎么用它,但是我们还不知道为什么。

我举一个例子,牛顿(Isaac Newton)发现牛顿三大定律,其实是在开普勒(Johannes Kepler)的行星定律基础之上,而开普勒的行星定律是在他老师第谷(Tycho Brahe)的大量观察数据基础之上完成的。

所以其实我们发现,科学发展都会经历这样一个阶段。就是要先收集数据,然后发现规律,再去解释和应用它。所以现在在深度学习领域,我们还没有发现它的理论。

那么融合智能时代,我想用无人驾驶来做一个象征。汽车无人驾驶,其实是融合了现在主要的人工智能的所有技术,包括物联网、5G技术。未来的话,比如说车在过红绿灯的时候,都是无人驾驶的话,可能就不太需要红绿灯了。这时候就需要通讯——可能是车和红绿灯基础设施的通讯、还有车和车之间的通讯——两辆车过马路的时候会互相协商,你先过还是我先过,这都需要5G的高速通讯,慢一点点就会出现交通事故。

500

新技术采纳周期缩短

大家知道摩尔定律60年代左右提出的。在摩尔定律之前,我们称其为扩展摩尔定律。从1900年开始,人类的计算能力已经开始指数增长了,是以10为单位的指数增长。现在有人说摩尔定律要失效了,因为已经到了它的物理极限。

而我们看到量子计算机可能是上亿倍地提升我们的计算能力,我们知道这波人工智能主要是靠算力才得以发展的,而我们看到人类现在对于所有的新技术采纳的速度是越来越快的。我们看到1900年的电话机,可能用了几十年的时间才普及;而像现在的笔记本电脑或者是平板电脑,只用了几年时间就已经普及了。

所以技术的发展在不断加快,最后我们看到今天的人工智能像是什么呢?今天人工智能像是个鹦鹉,它学人说话学得很像,你觉得它已经很像人了,其实它很傻,智商很低。

很聪明的动物是什么?是乌鸦。我们看到在日本有人拍到的这样一个场景:有乌鸦捡到一个坚果,它要吃坚果里面的肉,就把坚果抛起来,想掉地上把它砸碎。砸不碎,它就把坚果放到马路上,车轧过去之后它就可以吃到里面的肉了。但是路上车很多,它如果下去的话一不小心会被车轧死,它发现红灯的时候车会停下来,这时候是它下去吃坚果的最好时候。

所以现在的人工智能是鹦鹉,将来我们的通用人工智能,它要有解决问题的能力,要变成像乌鸦这样的。

500

群体智能

这个是我们的群体智能,群体智能是说我们看到的蜜蜂也好,行军蚁也好,它的单体都是智力是很低的,但是放在一起的话,表现出来的群体的智商非常高。集群智慧也是实现人工智能的一个途径。

费米(Enrico Fermi)被称为二战之后仅次于爱因斯坦(Albert Einstein)的最聪明的物理学家,他讲过我们宇宙的结构其实可能很简单,但只是数量很多。很多很简单的东西放在一起,当它的数量到了一定程度,量变发生质变,然后就会涌现出难以想象的事情。比如说我们刚才讲的人的意识,就是有很多每个都很简单的神经元放在一起之后,形成的一个非常复杂的难以想象的新的生命。

人工智能在增长期还是爆发期?

500

达尔文预测的地球物种数量与实际物种数量

最后,我认为现在人工智能还处在一个非常早期的阶段,用生命来打比方就是史前文明阶段。如果达尔文(Charles Robert Darwin)的进化论是对的,地球上的物种数量应该是沿着A这条曲线上升的,而实际上考古学家发现地球上的生命物种数量是按照B这个曲线上升的。

从5亿3000万年到5亿1000万年前,在短短的2000万年的时间中,95%的物种都一下子出现了——如果我们把地球的历史算成24个小时,这个2000万年就相当于是5分钟——这个阶段我们称为叫寒武纪大爆发。

其中一个原因就是在寒武纪早期,动物分化出了眼睛。原来动物基因突变长出了两条腿,如果没有眼睛的话,这两条腿对它就是个累赘,这个物种就被淘汰掉了;但变成有眼睛之后,这两条腿可能变成它的生存优势,吃东西可能更方便,这个物种就能够存留下来。

现在的人工智能就是可以看懂这个世界、可以听懂这个世界,就好像是在寒武纪大爆发早期的眼睛,特别是当这种人工智能成为一种基建,成为赋能所有应用的能力之后。

我相信,在未来的十年、二十年,人工智能会给整个人类带来一个完全不一样的命运。

全部专栏