专访葛冬冬:我们做华人该有的求解器,BAT和国内科研单位做不了

2018年4月,商务部联合中国物流与采购联合会等8个部门联合下发《关于开展供应链创新与应用试点的通知》,在全国范围内开展供应链创新与应用试点。随着物流行业的快速发展,提高效率、降低成本也成为了企业和政府部门共同关注的热点和极力追求的目标。

杉数科技是一家依托于世界领先的深层次数据优化算法和复杂决策模型的求解能力,致力于为企业提供解决方案的人工智能决策公司,成立短短不到两年时间内,杉数科技不但获得了国家高新技术企业、中关村高新技术企业等多项荣誉,也于今年5月获得了‘中国创业企业新苗榜年度新锐企业’的称号。

日前,观察者网科工力量专栏采访了杉数科技联合创始人、上海财经大学教授葛冬冬。葛冬冬告诉记者,像求解器这种业务,BAT做不了,国内别的科研单位更做不了。在这个领域里,杉数科技在技术上有一些事情可以保持垄断。

500

科工力量:运筹学的工业应用,主要有哪些方向?

葛冬冬:在OR(Operations Research)之外,美国的工学院有个工业工程industrial engineering的方向,商学院有个叫运营管理OperationsManagement的方向,这些就代表了一些交叉的方向。

IE(IndustrialEngineering)这块在工业生产中有相关的一些概念,比如排程调度。举个例子,像华为、上汽这些大型工厂,它的某个车间怎么去规划,每个机器该干什么事情,每个工人应该干什么事情。不光是工厂,比如说医院里边手术该怎么排能够让病人的等待时间缩短,或者让资源的利用率提高。所以排程不只是工业生产,健康管理里也可能用到。

刚也提到,(美国的)商学院一个主要的方向叫Operations Management,就是运营管理。运营管理这块基本上涉及到企业方方面面的管理工作,最典型的是供应链,供应链的每个环节,可能都会用到所学的东西。比方说收益管理,包括物品的定价、服务的定价、劳动力的定价,这些问题怎么做到智能化、科学化、精确量化,这是各个企业广泛面临的问题。现在有很多平台,上面聚合了各种资源进行运作,比如一个物流平台,它上面一个物流服务的动态定价,再比如机票的定价,我们看到的始终都是变动的,这些我们都叫收益管理。

定价后边就是库存,比方说最基本的,你可以看到在一个大的体系下,消费者拿到制造商的生产出来的产品,但在基层,收到需求再组装按照流程制造等一系列事情,排程调度就是做这些事情。

生产出来以后它经过供应商发货到大仓,大仓再到地区仓,地区仓可能再到前置仓,最后到消费者手里去。经过了一个多级的仓储体系,这里头每一级仓库都会面临一个问题,“预期什么时候库存不够需要补货”,就是触发了一个什么红线以后我就知道我要补货,要补多少货,要从哪个仓调拨。这个是库存管理,inventory management。

这个东西本身就是运筹学里最经典的问题。当然还有相关的问题,比如说卖汽车的他开店开在哪,这个叫location,也是选址问题,这也是运筹学里的经典问题。

还有物流,比方说我怎么送,快递员的路线该怎么跑,仓库里的检货员路径该怎么跑,车辆该怎么跑,导航该怎么导航,规划路线,甚至说仓库里边的机器人应该怎么跑,都跟这个相关。涉及物流问题的企业像饿了么、美团都非常重视这个事情,京东这些,(库存管理)是他们的立身之本。像亚马逊这种企业它有几百个OR方向的PhD都在做这些事情。

当然你大而广之地讲,它(运筹学)本身还可以做很多事情,比方说从国家战略角度来讲,像石油勘探之类的行业,用一些优化的技术,可以让勘探成本下降非常多。再比如说像整个国家电网、南方电网的实时调度、定价这些事情,比如有个电站突然出事了,旁边的电站可能需要增大输电量,怎么增加,哪些电站增加,以什么样的方式运行。这些可能的突发情况,你要对其做出反应就要用到(运筹学)的。

还有一个就是金融行业。比方说现在炒的很热的智能投顾。根据历史数据去分析,对你的资产做一个调配,做一个合理的配置。可能用到预期收益、预期风险、股票这些信息和它们之间的相关性,把这些输入模型以后,去做一个自动的计算,算出来你的理想投资方案。这些其实背后用的一些,我们叫作非线性规划,或者叫二次规划的一些数据模型的求解,有很多时候是用运筹学的软件在做。

我能想到的可能暂时大方向就刚才提到的这些。有排程,有供应链的各个环节,有国家战略角度,再有金融领域等等。当然肯定还有军事等。

 

科工力量:你们这个求解其实是通用的,还是说不同行业的模型不一样?

葛冬冬:我举个例子,像我刚才说金融,它的场景跟其他的场景可能看起来都不大一样,但最后写这个模型无非就是解一个数学的东西,这个数学模型本质上(跟其他行业)是一样的。实际上在黑箱子求解器上面可以衍生出很多垂直的场景,这些场景看上去差别很大,但本质上相通。你建模的时候,可能各有各的约束,目标也都不一样,但一旦划定数学语言都到黑箱子里面求解以后,数学上Mathematically是非常相似的。我的博士论文是做一个航空的问题,刚开始我做背景调查课题没发现,后来做了2年以后发现跟别人的一个医学图像的问题重复了,这两个风马牛不相及的东西压根就没想到会出现重复,最后2年的功夫很多白费了。

 

科工力量:下一个问题,你们建立的初衷是什么?包括为什么你们准备自己开发这个求解器?

葛冬冬:有两个想法,一个是我们的导师叶老师(注:斯坦福大学终身教授叶荫宇)他觉得华人应该有一个自己完全独立的的求解器。另一方面就是作为一个商业公司,你的核心竞争力要体现出来。你说做供应链做金融,基于已有的求解器,你做各种垂直场景,这谁都能干。但你既然有这么一波在算法求解方面最优秀的人才的话,你为什么不把这部分资源利用起来,去做一件中国人一直没做好的事情,去做一个自己的求解器呢?一方面是利国利民,另一方面也是利于公司独特性。

 

科工力量:如果用国外的求解器,是不是中国人的数据是要给他们的?

葛冬冬:看你怎么选。你选择云服务的话可能就要交出去;你也可以选择直接把软件拿过来离线用。但离线是有很多缺点的,你买了一个license,这个软件完全是一个黑箱子,一方面他怎么做你完全不了解。另外一方面是,有些时候你需要做一些个性化的定制,可能如果你能打开做一个定制的话,算法速度能提个10倍100倍都很容易,但他不给你打开。

将来我们的这个东西,虽然对外也是需要保持黑盒子的状态。但是有一些行业,有特殊性的时候,我们会做针对性的改造。相当于这个盒子是半打开的。

 

科工力量:开发的难点是在什么地方?数学原理我想应该差不多。

葛冬冬:原理很经典,都是经典的,但是最大一个问题就是说,你像国外比较成熟的,像IBM的Cplex,像美国的Gurobi,他们都是积累了30年以上经验了,就是说他基本原理有了。就算给你一个东西,或者做一个东西,做一个命题,有了大概的骨骼了,但这个东西它的皮肤是什么样的,肉是什么样的,其实你还是不知道。你就知道这个骨骼,这个人应该长这个结构。所以其他这些东西需要长期的摸索,你要看看这个人,你才知道这个人体应该怎么去塑造。国外的机构他们做这个求解做了30多年,积累了很多经验,每一个环节都优化到了不能再优化的地步。但我们现在只有一个很梗概的算法,里头每个细节怎么实现更高效率,你其实不清楚。所以就是说,一方面你需要对数学的原理和算法非常了解,另一方面你得有行业经验的积累,知道怎么去写一个高度工程化、达到真正商业水准的软件。

这些工作需要非常好的编码能力和经验,同时又要求对数学非常了解。目前来看,兼具这两个事情的开发者非常少,全世界加起来华裔就个位数。

 

科工力量:行业特征反而不是最重要的,可以这么理解吗?

葛冬冬:对求解器来说吧,垂直场景是什么并不重要,关键是编码的能力和经验以及历史上累积下来的经验。

 

科工力量:求解器是不是像深度学习,你的数据越多,就越容易推进?

葛冬冬:经典的求解器能求解很多模型,包括线性规划、非线性规划,这些模型可能求解的方法都不一样,但在现实中,90%以上场景你用到的可能都是(线性规划和整数规划)。像我刚才举的例子,除金融以外的场景,90%以上其实就是线性规划和整数规划,这些东西主要取决于你算法写得怎么样,跟数据无关。

比方说,现在有许多大规模的非凸优化问题,不再是一个线性规划问题了。虽然深度学习的很多技巧是从运筹学进化到现在这样的,但是深度学习的一些技巧、用途和深度学习的算法是能给我们带来启迪的。从整体上来说,在求解器来说,在工业实践中能用到的那部分,实际上90%以上是不需要数据的,是独立存在的。


科工力量:我们再讲一下你当时是怎么说服那么多人回来做这件事情的?

葛冬冬:2年时间,公司现在已经有70、80人,最开始的时候,只有我们四个创始人,我跟王子卓(CTO)都是做这行的,本身对这个行业比较了解,也非常有激情,许多的人都是我跟王子卓叫回来的,我们四个创始人,加上CEO、CPO这些,都是我们当时的同学,大家都觉得这个事情比较有意义,从商业角度讲也比较有实现价值,所以很容易谈拢。后面招募了一些新人,过去一两年,扩张到80人,这里头有近一半左右是海归。这些海归我觉得有很多也不是我们劝回来的,海归回国工作现在其实是很平常的一个事情,国外现在形势对中国人找工作其实也不是很有利。当然还有一些是靠号召力,比方说我们求解器的开发团队,里头大多数人都是叶老师号召他们回来做些有意义的事情。

 

科工力量:你刚刚说了运筹学在物流定价系统上的一些应用,因为中国的移动支付特别发达,有滴滴、顺丰、京东、美团、饿了么这些企业,是不是中国在运筹学的应用上,会有优势?

葛冬冬:很大程度上说,中国的很多事情其实在美国没有发生,比方说饿了么这种,美国的饭馆,店家有自己的外卖团队,你打个电话就给你送来,就是说就是在线了,但它可能还是餐厅自己的外卖团队给你送,这时候你产生一个巨无霸来统一这个事,并不容易。

我们觉得这种后发,可能也是我们一个机会所在。这也是我们的一些观察,中国的一些企业,比如现在出现了一个新的商业模式,大家有了,他就有了,所以新的商业模式可能很快能够主宰这个行业,这是很有可能的。

另一方面,从运筹学本身能做的事情来讲,可能美国有很多,在美国,大型公司都有optimization department,优化的部门专门来做。比如供应链的优化,像亚马逊、波音,以前我给他们工作,他们有一个很大的优化部门,能力很强,把公司很多环节优化得很好。但中国很多体量很大的公司,基本上这一块都是空白,所以这是机会所在。因为很多公司可能确实战略重心或者说公司的业务特点决定了,它不是很愿意花很大一个成本去养一个团队去做这个事情,而更愿意靠外部力量来做。

 

科工力量:现在中国这些企业,他们会不会有种心理是觉得,还是凭经验做会比这样用运筹学的方法来做优化要好?

葛冬冬:我们也打交道了很多企业,确实有很多企业最开始的时候会有这样的疑虑,这个时候我们只能去做一些实际的测试来打消他的疑虑,证明你的方法确实比他的直觉更好。

我经常讲一句话说,科学往往是反直觉,你不能过于相信直觉,相信经验。

举个例子,比方说我们曾经帮公司做一个定价,在节日的时候,他担心这个节日过完了东西卖不出去。他会靠直觉去采用降价策略,认为可以薄利多销。

但我们分析就会发现,比如这个节日你针对的消费主体是年轻人,他对价格并不敏感,这时候你本来卖10块钱的东西,降到8块他也会买,提到12块他照样会买。在这种情况下,你降到8块,可能销量增加了20%,但是利润就被压缩很低。但你把他提到12块,可能损失了20%的销量,但是利润可能就翻番了。

很多时候,业务员可能意识不到这个问题,所以频频降价。

我们就通过测试去说服他。测试发现,如果这时候反而你提价,利润会急剧增加,那他可能就会被说服。

 

科工力量:网上有一些争议,比如携程等公司大数据杀熟,你们会怎么看待这个问题?

葛冬冬:我们上课讲定价策略经常举一些有趣的例子,有些机票或者旅馆,你订的时候只要把设置稍微一变,系统往往就会把这个顾客的分类改变,那个价格就会发生极大的变化。对任何一个商家而言,只要它能拿到一定的历史数据,或者从模型分析杀熟是永远存在的一个选项,过去几十年来,从美国到中国,全世界的公司都有这个选项。

问题在于,在这个选项下,他要平衡什么样的因素,比如说他是把顾客满意度放在第一位,还是把利润追求放在第一位。在这个阶段如果企业自己没有调整好,比方说顾客满意度,和追求更高的利润之间的这个平衡点他没选好,就会出现一些问题,比如你提到的这种批评的声音。从专业的角度来讲,我觉得这个现象本身不奇怪,它说到底就是算法或者模型不够完善,没有把人类的行为习惯和心理模式的影响计算进去的问题。

 

科工力量:能不能举例说明一下,你们的产品能够给企业带来哪些改变?

葛冬冬:比方说我们曾经参与了某个出行平台的分单系统。最开始的时候是说,直接派单给离得最近的司机,2015年的时候他们开始考虑,每个切片的时间点上,怎么在整个城市范围内通过决策实现一个均衡状态,让所有人的满意度尽可能地最大化。

到了2016年的时候他们会考虑通过运营调度、激励机制、价格变动去实现削峰填谷。让任何一个派单的决定,对未来能够产生一个更积极的影响,而不是只考虑切片的那一秒钟全局的优化。

从这个事情你可以看到中国的企业成长的速度非常快,从开始什么都不懂,到变成可以做到全空间的全局优化,后来可以做到整个时间轴上的优化,进化很快。

 

科工力量:他们会把你们要做的事给自己做掉吗?

葛冬冬:我觉得,企业有不同的类型,有一些企业会希望什么都自己来做,但总会有另一些企业是希望把一部分事情外包出去的。另一个问题在于,即使是想自己做,有些事情高到了一个门槛,企业是没法自己做的。像求解器这种业务,BAT做不了,国内别的科研单位更做不了。所以在这个领域里面,技术上你有一些事情是可以保持垄断性的。

 

科工力量:你们现在离国际水平还有什么差距?

葛冬冬:我们打交道过的很多企业,现在看来他们在某些自己深耕的领域上已经达到国际最好的水平,比如我们斯坦福团队曾经跟京东一起合作开发的无人仓调度系统,这个系统冬奥8分钟还曾经出场,几百个机器调动的很快,很高效。确实已经是一个全球范围内的领先水平。但也还有一些领域,比如说求解器这个东西,我们确实跟国际水平有差距,能做的事就是尽快把这个差距弥补掉或者缩短掉。

我们公司本身从理论上讲的话,跟国际水平没太大差距,因为我们也雇了很多国际上有名的科学家,像斯坦福、NYU等一些名校,他们的教授在帮我们做事情,国际上发生什么事情,我们也了解,像我们CTO王子卓30岁就已经是明尼苏达的终身教授了,也担任了很多国际上最好的期刊的编委或者领域编委,更不用说叶老师这种国际上也是泰斗的,对于这些动向其实我们都很清楚。你说跟国际水平有什么差距,还真没什么差距,但是中国运筹学跟工业结合的这个问题上,过去这些年一直没做好,可能也是国内不注重运筹学的关系。所以我们理论结合实际这方面确实和国外有差距,这两年这个领域新兴的公司都在努力去弥补这个差距,追赶的速度很快,但目前还是有很大的差距。


科工力量:最近有个概念是“中国制造2025”,您觉得运筹学在当中能发挥什么作用?

葛冬冬:整体上,在制造业的发展中,我们不是要扮演一个很敏感的角色,但是我们确实是一个非常重要的角色。你造不出来的我们没有办法,但你能生产出来的,从组织流程上,我能让你更高效。比如说一个巨大的汽车工厂,甚至华为这种,他的生产排程;或者物流公司,车辆调度的系统,本来就是手动去排,可能排几个小时,排一天都很正常。有了系统后,他可能几分钟给你出一个非常科学的规划了,这是很显著的一些提升。

 

科工力量:现在德国人讲工业4.0,里头涉及很多概念,包括智能制造,或者说自动化,你说的这个通过算法来优化工业流程是不是扮演了一个类似的角色?

葛冬冬:工业4.0的智能制造这个东西用我们业务上的话说,就是人、料、系统三者之间,尽可能快地达成匹配。它需要几个要素,一个是信息化完备,不能原料没送来,而且你不知道这个事情,就直接把机器开动了。要把类似“原料送没送来”这些信息集成化、标准化,这些事情其实还没涉及到算法,就已经挺麻烦了。

我们做的事情呢,就是把这些事情做好之后,对整个系统的优化、科学化、效率最大化工作。这些是我们可以做的事情,如果没有前面信息化的这些环节,后端这些就都做不了。(但)如果你这块做不好,同样会对你整体效率产生非常大的负面影响。

 

科工力量:按这个标准来看,中国现在很多企业是不是还停留在2.0,甚至3.0时代?

葛冬冬:我怀疑很多企业可能还在1.0时代。至少从我们看到的来说,有很多企业非常落后,信息化都还基本没实现。

 

科工力量:是不是发达国家的水平已经到了你们扮演的角色出场的时候了?

葛冬冬:有很多国家有很多企业做的很好,但也不是每个企业都这样。资源需要好好配置,排程需要更科学。这个不是我的臆测,事实上就是如此。

 

科工力量:我们下一个问题是你们为什么要做开源求解器?

葛冬冬:我们求解器的开发是两个方向,一个是说我们以学校为主题做一个开源的Leaves算法平台,主要考虑就是说希望能激发大家的兴趣,提高我们科研团队的影响力。也给大家提供一个科研的工具。另外一个呢,我们团队内部有一个非常成熟的开发团队在做商业版的求解器,这个版本未来一两年内我们就会公布。这个版本对国内教育来说肯定还是免费的,但对商业用途肯定以后要收费。

 

科工力量:叶老师曾说过深度学习本质上就是个非凸优化问题?

葛冬冬:我不是专门研究深度学习的,我对这个事情理解本质就是一个非凸优化问题。从数学结构上讲,非凸优化是一个比较困难的问题。数学意义上,他就是一个非常大规模的求最优解问题。但这个问题很难解,所以大家要设计各种各样的算法来求解。从计算机,从运筹学,从统计学的角度,大家从各个角度去尝试,几个社区互相启发互相激励,能取得一些进展,但那个机理彻底弄清楚,到目前为止还是一个未解之谜。

所以很多时候,它能把问题解决得比较好,但原理是什么说不清楚。像银行很多时候,利用数据去做一些模型来做风险控制,他会需要一些解释性强的模型,需要知道每一步模型的意义何在,每一个变量意义何在,这样他才能指出可能的风险会出在什么地方。但你像深度学习这个模型,他看不出来风险在哪里,他不知道你每一步操作的意义何在,所以很多时候,金融行业就会出现没人敢用你的深度学习模型的困境。你要真用,效果还可以,但是会不会出大篓子,没人知道。

 

科工力量:你们会做人工智能这一块的东西吗?

葛冬冬:我们做了很多人工智能的事情,就像比如我们做无人仓里机器的调度,跑来跑去,大家肯定觉得算人工智能的事情。但在这个问题里,我们把他分解成为三步。每一步都是运筹学里面大规模优化的问题,所以你说到底是运筹学项目,还是人工智能的项目。就像刚才说的深度学习本质上是一个非凸优化,一旦叫优化,优化就是运筹学,优化就是运筹学的核心。在这个时代,人工智能这些概念的边界都是模糊的,你很难说清楚。

 

科工力量:但是人工智能这个概念这么火,你们为什么不把自己往这个方向靠?

葛冬冬:我们做了很多人工智能的事情,但我们还是坚信我们没必要去蹭这个热点。有时候我们也需要跟人去讲说,我们是个与人工智能非常相关的公司,但是我们有自己的特色,运筹学、求解器这些东西,任何时代都是国家和社会需求的,你把这些事情做好,他也需要一些工匠精神,也能实现商业价值和学术价值。

 

科工力量:你们做这个开发需要跟外面合作吗,有什么业务上需要合作的?

葛冬冬:我们公司的开发工作主要是两块,一块是求解器的开发,基本上是我们独立在完成。这是一个我们从长远计,希望不求回报慢慢去做好的事情。另一方面我们需要针对各个场景,比如说物流的场景、库存的场景、定价的场景,不停地开发出一些轻量化的系统解决方案。这些东西是需要跟实际结合来快速迭代的,所以会非常需要和外界的交互。基本上还是以我们自己开发力量为主在运作。

 

科工力量:我的意思是,这些场景相当于一个生态,如果让外面的人一起参加进来,你们的生态会不会作用变得更大?

葛冬冬:在我们的规划里面,现在已经有了一个雏形的平台cardinal optimization platform,我们把这个平台称为“杉数智慧链”,就是以求解器为底层,上面由各个场景共同构成的供应链的管理平台,我们希望能通过这种中立的系统解决方案的平台让大家都参与进来,达成一个双赢的局面,我们为大家提供便利,大家为我们提供数据驱动算法的进化。

目前我们正在筹备的2018“第二届AI大师圆桌会”,邀请了很多学术和业内顶级的专家们,主题就是为了探讨供应链行业未来的发展形势。对供应链管理与优化感兴趣的人都可以来听听。

全部专栏