十几位高手惨败于AI选手:人类失守扑克牌最后一块阵地
人工智能已经跨过了掌握扑克的最后一个里程碑——六人德州扑克。
人工智能已经跨过了掌握扑克的最后一个里程碑——六人德州扑克。
对人工智能(AI)来说,像扑克这种有着隐藏牌面和虚张声势的对手的游戏是非常大的挑战。过去的几年中,电脑已经成为日益复杂的一对一扑克游戏中的佼佼者,但多人游戏将这种复杂性提升到了一个新的水平。
研究人员于7月11日在《科学》杂志网络版上发表报告称,如今,一个名为Pluribus的扑克高手AI在德州扑克(Texas Hold 'em)的六人游戏中击败了十几位精英专业人士。而这种能够利用零散信息对多个对手进行密谋的算法,可能会成为精明的商业谈判代表、政治策略师或网络安全监管机构。
最开始时,Pluribus通过与自身的副本竞争,从零开始学习并逐渐掌握了那些有助于赢牌的行为。之后,它会在每手与五名人类玩家进行第一轮投注时,利用这种直觉决定何时持有和何时弃牌。
在随后的投注过程中,Pluribus通过想象如果采取不同的行动,游戏将会如何发展来微调自己的策略。
与为双人扑克而训练的人工智能不同的是,Pluribus并没有一直推测到游戏的最后,原因是面对更多玩家时,这将需要太多的计算。相反,它设想了未来的几个步骤,并根据这些假设的未来以及玩家可以采用的不同策略来决定该怎么做。
在德州扑克锦标赛的10000名选手中,Pluribus与来自13名专业选手中的5人进行了比赛,这些人都曾赢得超过100万美元的扑克奖金。结果每100手,Pluribus就能从它的人类竞争对手那里平均捞到480美元。
纽约Facebook人工智能研究公司的Noam Brown表示:“这大概是人类精英专业人士立志击败较弱玩家时想要达到的水平。”
这意味着Pluribus比人类对手更聪明。Brown和匹兹堡卡内基梅隆大学的Tuomas Sandholm一起创造了Pluribus。
布拉格捷克技术大学的计算机科学家Viliam Lisy说,既然人工智能已经掌握了扑克,那么我们或许可以在包含更复杂隐藏信息的游戏中测试它们的战略推理能力。
即使是“赌神”发哥亲自出马,估计也没戏了。
Lisy并没有参与这项工作,不过他说,在Kriegspiel(一种象棋衍生游戏,玩家看不到彼此的棋子)这样的游戏中,未知的东西可能会变得比紧挨着对手胸口的几张牌复杂得多。
◎编译 |Max
◎审稿 |alone
◎责编 | 张梦
◎期刊来源 | 《科学》
◎期刊编号 | 0036-8075
◎原文链接:
https://www.sciencenews.org/article/artificial-intelligence-has-now-pretty-much-conquered-poker?tgt=nr
中文内容仅供参考,一切内容以英文原版为准,转载请注明来源。