热门话题: 中美关系·贸易ACG垃圾分类军事电影

继星际争霸后,科学家成功用AI来玩愤怒的小鸟,但还是赢不过人类玩家

几年前的热门手游愤怒的小鸟如今也被AI看上了。

 

500

在本周于Arxiv.org 上发表的预印本论文中 ,布拉格查尔斯大学的研究人员详细介绍了使用Deep Q学习技术训练的AI系统DQ-Birds,该技术是Alphabet的DeepMind率先提出的,它指示代理商在什么情况下应采取何种行动。使用先前行动的随机样本的情况。 研究人员选择实施“深层Q学习”风格的Double Q学习,该策略不同于用于选择下一个动作的策略,用于评估第一个策略的决策。

 

参与项目的研究人员表示,由于顺序决策,不确定性的游戏环境,极大的状态与角色可行动空间,同时又要求区分不同小鸟的能力和最佳射击时间等问题,愤怒的小鸟可以说是解决人工智能代理的一项艰巨任务。

 

为了在看似毫无头绪的关卡空间中找出最佳解法,研究人员捕捉了关卡的屏幕截图,并将之进行裁剪,同时隐藏UI等与游戏互动无关的元素,裁剪之后在调整大小并进行规范化,接着再传递给Deep Q机器学习技术来找出模型。

 

为了学习他们的模型,团队编辑了《愤怒的小鸟经典》的《荷包蛋》合集中的21道关卡的数据集,其中包括超过经过裁剪与整理的115,000张屏幕截图。接下来,他们将AI系统设置为一个包含10个关卡的验证集。研究人员指出,他们的AI玩家能够在某些关卡中超过一组四个专业玩家的得分,但是就21个关卡获得的得分的总和而言,它的表现其实还是追不上人类。

 

研究人员指出,Deep Q在尝试让AI玩愤怒的小鸟赢过人类玩家的这个目标并没有成功,但已经是历年来尝试用AI解决愤怒的小鸟问题的案例中表现最好的一次了。

 

研究人员认为,目前AI解决愤怒的小鸟的不足之处,在于缺乏足够关卡差异的训练数据集,然而AI也常常在初次尝试解决关卡时,首发就过关,而某些关卡的弱点过于明显,也让AI很难从错误模式中学习到不同关卡的解法,关卡完成了,但没能提升多少AI的解题经验。

 

这是很有趣的一点,可能是愤怒的小鸟本身的关卡设计逻辑并不一致所导致。

免责声明

风闻热评

因为奢侈品关税跟朋友杠起来了,求大佬帮助
左千户 :

槽点太多都不知道怎么说了。
1,中国没有奢侈品关税这个税种,奢侈品的关税率也不是很高,因为奢侈品跟普通消费品的差别在价格上,海关的关税是根据商品品类的定价的,而不是根据价格,比如路易斯威登的包,关税率就是6%,不管你的价格是多少。
2,中国关税的计税标准是进口成本,跟市场销售价格无关。也就是说某种产品,进口成本是100块钱,市场价格卖10000,关税是那100块的6%,就只有6块。这种定价方式在进口产品中是经常事,比如红酒,80%以上的红酒进口价格是1到3欧元之间,但市场销售价格在200-5000都有,所以对于进口商来说,关税的成本几乎是忽略不计的。所以用关税控制你认为的奢侈品其实没啥效果。
3,真正能起到奢侈品高关税作用的应该是消费税,这是独立于关税和增值税之外的一种进口税,一般用于酒类,化妆品等,但由于计税的依据还是进口成本,所以也起不了太大作用
4,关税的设定是一个非常复杂的决策过程,可能一个国家最强的经济人才每天996也想不明白的。如果简单的认为降低关税就能让老百姓达到最高的生活标准,我记得有两个政权这么干,一个是国民党,已经丢了江山,另一个是墨西哥,变成了贩毒国家。
5,你们最大的错误是压根不知道什么是奢侈品,路易斯威登和古奇的包说不上是什么奢侈品,真正的奢侈品是教育,健康,医疗,这在国外都是天价的,是真正的贵族产品。奥巴马在当选总统前三年才还清助学贷款,你比奥巴马早还完助学贷款,不是你比奥巴马优秀,只是因为你是中国人。

228
全部热评

全部专栏