首页-新闻-军事-文化-历史-体育-NBA-视频-娱谈-财经-世相-科技-汽车-房产-时尚-健康-教育-母婴-旅游-美食-星座

NBA | CBA | 中超 | 亚冠 | 足球 | 综合

解读德扑人机大战：AI一路碾压共赢176万美元

正文
我来说两句(人参与)

扫描到手机

关闭

2017-02-04 19:39:23

来源：品途网

　　当地时间1月30日，在宾夕法尼亚州匹兹堡的Rivers赌场，卡耐基梅隆大学（CMU）开发的人工智能系统Libratus战胜四位德州扑克顶级选手，获得最终胜利。据官网介绍，此次由4名人类职业玩家Jason Les、Dong Kim、Daniel McAulay和Jimmy Chou对战人工智能程序Libratus，赛程为20天，一共进行了12万手牌的比赛。

　　176万美元

　　经过20天的鏖战之后，四位顶级人类扑克高手，在这场德州扑克人机大战中，总共输给人工智能(AI)选手共计176.6万美元。四天之前，这个数字仅仅是106万美元。

　　如果这场大战继续下去，也许人类高手们还要在匹兹堡的河流赌场输得更多。

　　AI一路碾压人类高手

　　怎么描述这20天令“人”精疲力尽的比赛？量子位觉得，还是先放一张图表吧。一图胜千言~

　　这张图代表了从1月11日比赛开始，到1月30日比赛落幕，人工智能德州扑克选手Libratus的每日战绩。在整整二十天的时间里，Libratus没有一天以输钱告终：从第一天“仅仅”赢下7万美元，直到最后一天累积下200多万美元的优势。

　　曲线清楚的告诉我们，整个比赛期间，人工智能至少有两天明显出现了状态下滑。然而人类选手们没有一次能够把胜利延续下去。

　　整个比赛期间，Dong Kim都充满挫败感，而他已经是四位人类高手里面，对战成绩最好的那个。大约两年前，Kim曾在同一个赌场击败了这个人工智能的前身。在这场为期二十天的比赛刚刚过半之时，Kim就直言：人类已经没有真正获胜的机会。

　　每一天，Libratus都会进步。人类选手很难找到它的漏洞。即便找到一个漏洞，第二天就会消失不见。上面的曲线也正说明了这一点。

　　而且之前的最终战果也表明，四位人类高手里面，Dong Kim输得最少：总计8.5万美元；而Jason Les输的最多：88万美元。

　　复盘AI的德州扑克战术

　　AI究竟是怎么打德州扑克的？来，我们复盘两局看一下。

　　第一盘人类赢了

　　每一局都有200盲注。

　　Kim这局是庄家，下注274。Libratus跟。首三张公共牌是：黑桃6，红桃5，黑桃4。机器下注274，Kim跟。第四张开出的公共牌是：红桃8。Libratus再次下注274，而Kim则直接下注3151。Libratus的选择是继续跟。

　　最后一张公共牌是：黑桃9。这意味着，牌局有可能出现“同花”。电脑直接下注15000，再次把赌注翻番。Kim有点犹豫，但还是跟进开牌：他手上是个最高为9的顺子。而Libratus手上是一张黑桃8，和一张梅花8，显然刚才电脑是在诈唬。

　　第二盘 AI赢了

　　人类高手Jason Les当时以一对10开局，一张是方片，一张是红桃。翻牌之后，首三张公共牌是：K、9、4，其中有两张梅花。下注继续。在这种局面下，AI按理说应该希望再出一张梅花，凑成一个同花。

　　第四张公共牌，发出一张5，不是梅花。当时，两边都已经看牌。最后一张公共牌，是一张Q，也不是梅花。然后，人工智能突然压上了所有的筹码。

　　面对这个局面，Les选择不跟。人工智能赢下一手。

　　与此同时，Les的拍档Dong Kyu也在一模一样的局面里，但是又有所不同。为了消除运气的影响，这次人工智能和人类玩家的对决，被安排成两对一模一样的牌局。区别是，在镜像局里人类玩家和人工智能手上拿到的牌，进行了对调。

　　Kyu手上是梅花7和梅花3。这意味着，在主局里面对人工智能的疯狂押注，Les如果果断跟进的话，绝对是稳赢的一手牌。雪上加霜的是，在镜像局Libratus早早为手上的一对10下了重注，最后Kyu也选择不跟，放弃了这手牌。

　　Libratus经常特别激进的下注，下注的额度远远超过底池里的额度。“其实人类并不这样，通常不会为了赢一点钱，冒着输掉很多钱的风险”，扑克高手Doug Polk说，“但人工智能没有这种心理，它只看怎么玩更好”。

　　会打扑克的AI有什么用？

　　Libratus在德州扑克人机大战中获得最终的胜利，是人工智能领域的巨大成就。玩扑克需要推理能力，而这对于机器来说很难模仿。虽然人工智能在跳棋、象棋乃至围棋比赛中，已经完胜人类对手，但无限注德州扑克是一个完全不同的情况。

　　这是一场“不完美信息”游戏。

　　由于一些卡牌并没有发出来，在德州扑克的对局里，任意时间，任何一个玩家，都只能观察到一部分的情况。要赢，他们需要直觉：一种猜测其他玩家手上是什么牌的能力。而且还要考虑到对手每一种可能的打法，想得到理想的战略非常困难。

　　现实世界中，不完美信息才是常态，各种看不见的隐藏信息产生了大量的不确定性，而德州扑克代表的就是这种类型的博弈。在围棋界纵横无敌的AlphaGo，本质上处理的还是完美信息博弈，而AlphaGo无法处理德州扑克的问题，更遑论使出诈唬。

　　未来Libratus这样的AI，可以用于商业谈判、网络安全、医疗方案制定等领域。

　　去年，Libratus的创建者Sandholm曾经领导开发了一个打扑克的程序Claudico，但是在一场面对数位高手的比赛中被痛殴。Sandholm解释说，Libratus的水平提升基于几个技术进步，包括一个新的平衡近似技术，以及几种新的方法来分析可能的结果。

　　人工智能发展的终极目标，是通用人工智能（AGI）。通用人工智能可以解决任何一个问题，而不是像Libratus或者AlphaGo这样只能专注于扑克或者围棋。想要实现AGI就得让人工智能学会解决不确定性问题，这也是此次人机大战的重大意义之一。

　　人机大战背后的超级计算机

　　每个牌局结束后的夜晚，匹兹堡超级计算中心的Bridges电脑执行计算，用以优化Libratus的策略。而在白天的比赛过程中，Bridges用于计算每一手的终结游戏策略。

　　Libratus来自卡内基梅隆大学，而Bridges又是谁？

　　Bridges不是当今世界最大、最快、最强劲的超级计算机。但它可能是面向公众开放的，最大、最快、最强劲的超级计算机。

　　研究生物学、地质学、考古学、经济学和其他社会科学的科学家们，都可以得到Bridges的帮助。而此前，这些科学家通常没有机会利用超级计算机，来处理相关领域的大量数据。而这就是Bridges最大的意义所在。

　　卡内基梅隆大学（还是这个大学，因为它就位于匹兹堡）的教授Jay Apt说，在Bridges的帮助下，原本在个人电脑上要耗时数月的计算，仅仅几个小时就搞定了。

　　超级计算机本质上是几个计算机联网在一起，以一个整体进行运算。通常要使用2500个电缆连接组件，如果连在一起，可以绕地球……不是，大约是7.2公里。

　　Bridges的机房有一个双锁的大门，需要用钥匙卡和访问码才能进入。Bridges由27个机架组成，每个大约1.8米高，堆叠的计算机共有三排。冷气从地泵吸入用以冷却。

　　Bridges提供三种类型的计算选项，称为节点：常规、大型和超大型。常规内存节点具有128GB内存，大约是高端笔记本计算能力的8倍。常规节点共有800个。

　　Libratus在600-700个节点上运行，这些节点的小子集在打牌时做出决定。而其余的工作则是改善Libratus，让这个人工智能程序可以玩得更好。

(责任编辑：田宇 US019)

我要发布

热词：死亡航班饲养蜘蛛侠夺命房间引力双眼皮

热剧：非正常事件夏至未至深夜食堂楚乔传刺客列传

热点推荐更多>>

詹皇脚踝酸痛季前赛报销或缺席揭幕战

体育策划更多>>

世预赛锁23强豪门无忧

本次FIFA比赛日结束后，各大洲世界杯名额归属已明朗化…[详细]

动物系恋人啊 | 钟欣潼体验爱情哲学

南方有乔木 | “科创CP”渐入佳境

魔都风云 | 周冬雨任达华演父女

我来说两句排行榜

客服热线：86-10-58511234

客服邮箱：kf@vip.sohu.com

解读德扑人机大战：AI一路碾压共赢176万美元

本文相关推荐

相关新闻

相关推荐

我要发布