第571章AI“赌神”完胜人类扑克冠军以一敌五实现多人博弈里程碑

作者:蔡泽禹 加入书签推荐本书

ai 在多人扑克里超越人类的表现,为 ai 与博弈理论发展树立了新的里程碑。

六人无限德州扑克是世界上最流行的扑克形式。日前,卡内基梅隆大学与 facebook ai 合作开发的人工智能程序“pluribus”,击败了六人无限德州扑克的职业选手。

在一项包含 13 名职业选手的实验中,pluribus 一次对战 5 名职业选手,共进行了 10,000 手牌,并最终取得胜利。这些职业选手都曾在扑克竞技游戏里赢得超过 100 万美元。

在另一项实验中,每位职业选手要对阵 5 个 pluribus。在 5000 手牌的对阵中,pluribus 击败了扑克专家 da

en elias 和 chris“jesus”ferguson——他们前者保持着世界扑克巡回赛冠军最多的纪录,后者赢得了 6 项世界扑克系列赛冠军。

当地时间 7 月 11 日,《科学》杂志发表了描述这一成就的论文(doi: /)。

pluribus 由卡内基梅隆大学计算机教授 tuomas sandholm 与 facebook ai 部门科学家 noam

own 共同开发。

tuomas sandholm 依托过去 16 年在卡内基梅隆大学实验室开发的战略推理技术,创立了两家公司——strategic machine和 strategy robot。前者将这些技术应用于扑克、游戏、商业和医学领域,而后者则将它们应用于国防和智能领域。

noam

own 在 facebook ai 工作的同时在卡内基梅隆大学攻读了计算机学博士学位。二人早前开发了双人扑克 ai li

atus,在 2017 年击败了四名扑克职业选手。

多人博弈里程碑

“pluribus 在多人扑克里超越人类的表现,将成为 ai 与博弈理论领域公认的里程碑,” pluribus 开发者 sandholm 说,“目前为止,策略推理中的超人 ai 里程碑仅限于两方竞争。在如此复杂的游戏中击败其他五名选手的能力为使用 ai 解决各种现实问题开辟了新的机会。”

为什么科学家总是喜欢让 ai 在各种棋牌类游戏里进行突破?这是因为棋牌游戏自古以为都被认为是人类智力活动的象征,模仿人类的 ai 自然要以此为目标。

不过根据棋牌规则,不同棋牌类型的游戏的博弈难易各不相同。根据信息的公开程度,我们可以将棋牌博弈分为“完全信息类”和“不完全信息类”。

“完全信息类”博弈包括国际象棋、围棋等,它们的盘面信息都是公开的,对弈双方接收到的信息完全。在

上一章 返回目录 下一章