“许多棋手学阿尔法狗,结果下得臭极了”

  • 老聂说的对,只看阿法狗的棋谱是看不出好坏的。需要配合阿法狗的后台思考运算数据来看。阿法狗的围棋大使樊麾和其他世界冠军带来过五盘阿法狗自战对局的解说,实话说,看了以后,下巴都惊掉了。人类不理解阿法狗的棋谱太正常了

回复1

  • 电脑的算法是赢,是稳赢,不是更看重优势大小。可能讲围棋作为业余人讲不清楚,我就讲战争类(RTS)游戏来打个比方。比如我们人类选手在认为对手可能会怎么打的情况下,喜欢玩“偷”,比如前期少出、晚出兵,多造点农民早点放分矿,那么这就是属于一种风险与收益并存的偷了。收益在于一旦偷成功,经济会比常规好很多,从而扩大优势(如果双方都常规相互对抗是很小的优势的话),这样自己容错率会低很多,假设原来常规玩法,我到后期失误送了3个兵然后我就劣势了,但是如果是我偷鸡成功的话,我优势扩大了,于是我死10个兵都无所谓。所以人类很多时候博弈就包括了赌——赌对方没针对到,从而扩大优势,让自己容错率增加。但是,既然是赌,那就必然伴随着风险,例如前者,可能人家前期暴兵的玩法,一波A过来,完蛋……那么,电脑的思维是啥——容错率?不存在的,无论电脑的算法是不是毫无漏洞了,就算是有漏洞,但是在电脑看来(程序设计里),就没有扩大优势这一说,也没有什么“早定大局”,有的只有稳赢的概率最高化。我们讲围棋,肯定也有那种棋,让别人一旦没看出陷阱走错一步就亏得很严重,从而很难翻盘的局。但是如果要设计这样的陷阱,一旦对方破了可能你就是劣势(哪怕是小劣),那么——人类可能会这样走,因为收益很大,万一对方没看出来呢,万一对方失误呢?一旦成功,后面好下多了(小失误一点照样赢)。但是对于电脑来说,他的算法是,对方一旦走出那唯一正确的一步,我是亏还是赚(亏),那不好意思,要走最稳的。容错率?需要么?我步步不失误,你迟早失误(哪怕很小),你怎么赢。所以不就出现了双方一直不分上下最后险胜么。看上去是险胜,实际上换个词就是稳赢——每一步都不打算扩大优势——但是同时你根本没有任何办法取得优势,因为求稳,所以我赚不到你的,你也赚不到我的,但是我先后手优势,就靠这点优势赢,你输得一点脾气没有。但是人类这样学是不科学的,因为人几乎不可能失误。有时候确实要抓住机会赌一波(但是要选好时机,尽量是那种容易成功、风险小、失败的损失也很低的情况),扩大优势,从而对人类来说更稳的获胜(即使失误也有前面优势打底)
返回文章

站务

最近更新的专栏

全部专栏