博弈树的问题

作者&投稿：示届（若有异议请与网页底部的电邮联系）

关于博弈树的问题，谢谢了~

这个应该不难吧？像概率统计那样画棵树，第一行甲剪刀、石头、布，第二行乙，在甲的每一项下长三个枝剪刀、石头、布。这样行不行啊。或者是画个表格，求纳什均衡？
第二个条件对甲很不公平呀…
只是自学了一点博弈论，在这里实在是献丑啊！

博弈树

探讨一下难度较大的棋类游戏程序，比如国际象棋和西洋跳棋
等等。用这些程序来同人或其他程序对弈。然而，有些程序是把计算机精心设计成一个棋
盘，人们可以在其上对弈（或者是一种单人玩的棋盘游戏）。这种程序更接近于系统模拟
的领域，而不属于人工
智能的范畴。我们此处所要介绍的却是让计算机能够“思考”如何下棋。

假定有两个人或者两台机器在下棋。我们把其中一名称为棋手，另一名称为对手。而我们
始终从棋手的角度来观看这场竞赛。这样一来，如果棋手赢了、对手输了，我们就说这盘
棋赢了；如果棋手输了、对手赢了，我们就说这盘棋输了。

假设现在该轮到棋手走了。在大多数情况下，棋手对这步棋可以有若干种选择。对于棋手
的每一种选择，对手也有若干可供选择的相应棋步。对于棋手的每一步棋以及对手的每一
步回棋，棋手又有自己进一步的选择。显然，这里所遇到的分支情况同我们在状态搜索中
遇到的情形相同的。

实际上，我们可以把一盘棋想象成具有一个入口（起始位置）和一组出口的迷宫。有些出
口标上了赢的记号；有些出口标上了输的记号；而有些出口标上了和局的记号。在入口处
，棋手选择某条路径起步，在路径的一个岔口，对手挑选了自己的路径回步，棋手和对手
就这样轮流选择自己的
路径走下去。棋手总是力争通向胜利的出口，而对手却总是把棋路引向输的出口。有时双
方各自的努力不相上下，最后在和局出口结束棋局。或者他们一直在这个迷宫中徘徊，直
到形势变得非常明朗：双方循环兜圈子，这时只好双方握手言和。

因此，下棋游戏同状态图搜索是相似的，就是要在状态图中找出一条从初始状态到目的状
态的路径。但是，它们之间却有一个很大的差别。在状态图搜索中，总是由一名选手来选
择下一步往哪走。而在棋类的对弈中，棋手只有一半选择的权利，另一半由对手作出决定
。棋手是一直朝着目标
努力，而对手却是通过它每一步棋对此设置障碍。寻找机会把棋手从通往目标的路径上引
开。

对于任何一种博弈竞赛，我们可以构成一个博弈树。它类似于状态图和问题求解搜索中使
用的搜索树。博弈树的结点对应于某一个棋局，其分支表示走一步棋；根部对应于开始位
置，其叶表示对弈到此结束。在叶节点对应的棋局中，竞赛的结果可以是赢、输或者和局
。

所谓棋局，就是所有那些必须记录下来的信息。根据这些信息，比赛在按计划暂停以后能
够得以继续进行下去。显然，这些信息包括了此时棋子在棋盘上的位置以及指出下一步是
轮到棋手走，还是对手走。

博弈树是一棵与／或树，不同于在状态搜索中使用的纯粹的或树。

其原因是：当轮到棋手走时，他可以决定选择哪一步棋走。如果起码有一步可以担保棋手
能够到达赢的棋局，那么棋手就会选择这一步并保证能够取胜。因此对应于棋手走的节点
是一个或节点。

当轮到对手走时，选择是由对手决定的。棋手没有任何选择的权利。只有对手的所有可以
走的棋布都会导致棋手赢时，这时棋手才能保证会赢。因此，对于对手走的结点是一个与
节点。

对于一场经过深思熟虑地棋局来说，其博弈树是非常庞大的（国际象棋来说有10^120个节
点）。以至于不可能把这样大的博弈树装入计算机，也不可能在任何合理的、有限的时间
内进行详细的搜索。尽管如此，首先深入的考察一下完整的博弈树，然后再看看如何来修
正我们的原来的想法，
以便把搜索树修整到一个合理的范围。这样做还是很有意义的。

博弈策略

假设我们对所讨论的博弈问题构造了一棵完整的博弈树，我们希望能从中找出棋手应采用
的策略。这种策略应当确保棋手会赢，或者起码能够得到和局的结果。

首先我们把该博弈树的每一个节点标上w（对应于赢）、d（对应于和局）或者l（对应于
输）。如果当前的棋局对应于标有w的节点，那么就存在一种策略可以担保棋手会赢；如
果结点标的是d，那么除非对手失误，否则棋手最好的前景就是争取和局；如果节标的是l
，那么棋手只好认输了，
除非对手下错了棋。

对一个节点标以w、d和l的过程，可以如下进行。

我们的讨论从叶节点开始，每一个叶结点对应于一场棋赛的结束的终局。根据博弈的规则
，叶节点确定了棋手的赢，输和和局。这样，我们就把每一个叶节点标上相应的值。

现在我们按照从叶往根本方向进行研究。按照每一节点的子节点的标号来标记该节点本身
。节点标注的规则如下：轮到棋手走步时，如果该节点的子节点至少有一个标有w，那么
，该节点就标为w；如果所有子节点都标为l，那么该节点标为l。其他情况标上d。
轮到对手走步时，如果该节点的子节点都标上了w，那么该节点标为w；如果有一个以上的
子节点标上了l，那么该节点标为l。其他情况标上d。

根节点的标注表明，在对手不失误的情况下，棋手能够得到的最好结果。如果根节点为w
，那么棋手稳操胜券；如果为l，那么对手一定能击败棋手；如果为d，那么在对手不失误
的条件下，棋手能够得到的最好结果就是平局。

一场比赛，如其根节点能够标上w或l，并且是很简单易于分析的话，就可以成为骗人的棋
局。该节点标作w的话，无论是谁先走，先走者都能赢；根节点为l的话，无论谁后走，则
后者也一定能赢。当然需要采取正确的策略。骗子知道哪一方面能够赢，以及要赢所需要
采用的策略。而这些，
受骗者肯定是不知道的。

棋手的策略应该遵循这样的原则：如果有一步棋能走到节点为W的棋局，那么就应当走这
步棋；如果所有的棋步都通向节点为l的棋局，那么就只好放弃这盘棋认输。其他情况下
，就要走到标为d的节点。

对手采取的策略正好相反：如果有一步棋能走到节点标为l的棋局，那么就下这步棋，如
果所有的棋步都通向节点为w的棋局，那就只有放弃认输。其他情况下，就要走到标为d的
节点。
当有两条以上的路径都能通往l节点，或者有两条以上的路径通往d节点时，棋手所采取的
策略就不再是决定性的了。在实际对弈中，棋手总是想选择w节点，达到了w节点，就使得
往后的对弈过程变得简单了。这样做就能减少棋手失误以致失去优势的机会。基于同样的
理由，棋手在达不到节
点时，应该选择d节点。这样就可以导致最复杂的情况产生。希望对手在这种情况下失误
以便使自己重新得到优势。到现在为止，我们的讨论还是很不充分的。因为在所有的w节
点或者所有的l节点之间，我们并没有给出任何差别。

博弈树的研究程序更难棋盘游戏，如象棋和跳棋

如此。使用这些程序给同事或其他国际象棋程序。然而，一些计算机程序被设计成一个国际象棋

板，其上的人可以下棋（或一个人玩棋盘游戏）。本程序是接近系统仿真

，不属于人工智能的字段。我们要在这里介绍的是允许计算机“想”怎么下棋。

假设有两个人或两个机器在下棋。我们叫了一个球员，另一名对手。我们

总是从玩家的角度来观看比赛。因此，如果玩家赢了，对手输了，我们说这个菜

棋取胜;如果玩家输了，对手获胜，我们说，这盘棋输。

现在假设玩家的回合中去。在大多数情况下，玩家可以有几种选择移动此步骤。

对于每一个球员选项，有许多竞争者，以选择合适的动作。对于每一个举动，每一步

棋对手的回馈玩家，也能促进他们自己选择的球员。显然，随着形势的分支遇到的情况在这里我们说明搜索

遇到了同样的。

其实，我们可以想象一盘棋有一个入口（起始位置）和一组迷宫的出口。一些口腔

胜利标志着标记;失去一些出口附有标志，而在该商标及董事会部分出口标志。在入口处

，玩家选择开始在路径叉子，他的对手回选择步骤，玩家和对手的路径，以便

轮流选择自己的道路走的路径上。球员总是力争胜利的出口，而对手已经向着出口道路始终将失去。有时候双

媲美各自的努力，终于结束了领带出口的游戏。或者他们一直徘徊在迷宫中，直到

到情况变得很清楚：无论是在兜圈子循环，然后让双方握手言和。

所以，用状态图棋牌游戏是类似于搜索是要找到从初始状态的路径，以状态图的目标状态

状态。但是，它们之间有很大的区别。在状态图搜索总是由玩家来选择下一步去哪里

选择。在国际象棋棋盘，玩家的权利，选择的对手，另一半

决定的只有一半。玩家

努力一直朝着目标迈进，但对手是通过它的一举一动此设置障碍。寻找机会从

开放路径到目标引领玩家。

对于任何类型的游戏

大赛，我们可以形成一个博弈树。它类似于状态图和解决问题的搜索操作

与搜索树。博弈树节点对应于一个特定的棋局，其分支表示此举是为了去;根

对应的起始位置时，它的叶子代表象棋的目的。在叶节点对应的国际象棋比赛，比赛的结果可以是赢，输或绘制

。

所谓的棋局是，所有的信息必须是记录。根据此信息，游戏可以在计划

足以继续之后被暂停。显然，这种信息包括位置，并指出，下一步就是去

玩家回合在黑板上这段时间片，或对手了。

博弈树是树和/或树，不同于纯态或在搜索中使用的树。

原因是这样的：当玩家转来转去，他可以决定转会离开。如果你能保证玩家有至少一个台阶，达到取胜

棋牌游戏，那么玩家将可以选择这一步，并确保胜利。因此，对应于玩家去的节点

1或节点。

当对手的回合中去，选择由对手决定的。球员没有选择的权利。所有的对手只能去

遍布将导致当玩家赢了，那么玩家就可以保证取胜。因此，该节点是对手一起去

节点。

对于一个深思熟虑的方式棋牌游戏，其游戏树是非常大的（10 ^来讲象棋节

120分）。这是不可能的这样一个大博弈树插入电脑，他们不能在任何合理的行为在有限的时间

详细的搜索。尽管如此，第一次深入看看完整的博弈树，然后看看如何修复
是我们最初的想法，

要调整到一个合理的范围内搜索树。仍然是有意义的话。

游戏战略假设我们所讨论的博弈树的问题，构建了一个完整的博弈树，我们希望能找出球员应该

策略。这一策略应确保玩家将获胜，或者至少能够得到的结果和董事会。

首先，我们把游戏标记W（相当于赢），D（对应于领带）或L（相当于

输）树的每个节点上。如果当前棋局标W相应于一个节点，则有可能是一种策略，以保证玩家将赢得;如果

如果节点为d的主题，那么，除非对手犯错，否则玩家提供最有利的争夺和局;如果是节日的主题升

，那么玩家不得不认输，

除非对手错误的举动。

对于标记瓦特的一个节点，D和L的过程可以进行。

我们的讨论从叶节点开始，每个叶节点对应一个棋局的最终结束。根据游戏

规则，叶节点决定了玩家赢，输和借鉴。因此，我们把对应于标示每个叶子节点的值。

现在我们研究按照从叶片的方向到根。参考根据标签节点本身

的每个节点数字的子节点。注下列规则节点：玩家携带反过来，如果有至少一个标记瓦特的节点的子节点，然后

，该节点被标记为瓦特;如果所有的子节点被标记为l，则该节点标升。标有D的其他情形。

携带对手转，如果子节点上都标有W，则该节点标记瓦;如果有一个以上的子节点

标有L，然后在升节点的标记。标有D的其他情形。

根标签表明，在对手失误的情况下，最好的结果，玩家可以得到。如果根为w

，那么玩家一定要赢，如果升，那么对手将是能够击败的玩家，大多数，如果它为d，则在不失误的对手

条件下，玩家可以得到良好的结果是平局。

游戏，因为它的根节点可以标记W或L，并且是非常简单和易于分析，那么它可以成为一个谎言象棋

局。这个节点标记为w，然后，不管是谁先走，先走谁是赢家;升根，然后去后谁，然后

后者必须取胜。当然，需要采取正确的策略。骗子知道哪边可以赢了，赢得了政策方面

需要。这些，

上当了当然不知道。

玩家的策略应该遵循这样的原则：如果有一招可以来点W棋局，那么就应该采取这一步骤

棋，如果所有的动作都是通过对节点升棋牌游戏，然后不得不放弃这盘棋失利。在其他情况下

，我们必须去节点标记为D。

对手的策略是正好相反：如果有一招可以去一个节点标记的1棋局，那么这一招，因为

如果所有的动作都导致该节点为w棋牌游戏，它只能放弃认输。在其他情况下，我们必须去

节点被标记为D。

当有两个或多个路径通往升的节点就可以了，或者有两个以上的路径，从而导致采取

策略在D点的玩家不再是决定性的。在实际的国际象棋，玩家总是希望选择达到瓦特节点瓦特节点使得象棋

后续过程变得简单。这样做可以减少出错的几率，玩家失去优势。

出于同样的原因，玩家在一节

达到的地步，你应该选d节点。这可能导致在最复杂的情况下出现的。在这种情况下，对手希望

做出自己的错误重新夺回优势。到现在为止，我们的讨论是不够远。由于所有部分之间
点w或全部升的节点，我们没有给任何区别。

选择500米的位置~
这是最简单的博弈，等同于条件恒定的选民理论。
把1000米分为10段，0到100 100到200 …… 900到1000。
选在400到500和500到600米的位置，不论对手如何选择，至少可以获得50%的顾客，也就是这个博弈的最优策略。
然后推导到100段 1000段，仍然是最中间的位置，即490到500 500到510 499到500 500到501。
微积分到最后剩下500~
用博弈树的话，自己画图就行，A选择位置，然后B确定位置，按顺序选择即可。

极大极小过程体现了怎样的一种思想
极大极小过程是一种思想，主要应用于博弈论和决策树等领域。它的核心思想是通过遍历博弈树的所有节点，找到能够使己方收益最大化的动作，同时最小化对手的收益。极大极小过程常用于解决零和博弈问题，其中一方的胜利代表另一方的失败，比如象棋、五子棋等。在极大极小过程中，通过构建博弈树来表示游戏的...

C语言五子棋博弈树算法叶子节点的分值是如何计算的
其实这个不是难点的，那个分数是当前落子后所形成的以这个棋子为中心的9x9矩阵中所形成的棋型，计算其他地方的棋型显然没有什么意义，再有就是不是C语言才可以写算法的，对于极大极小原理，博弈树和alpha-beta剪枝算法都是基于这个原理的，如果你是刚学编程不久，而且没有数据结构的基础是写不出来运用...

人工智能 AI3章作业题解释
游戏的规定走法是：(1)任意一个将牌可移入相邻的空格，规定其代价为1；(2)任何一个将牌可相隔1个其它的将牌跳入空格，其代价为跳过将牌的数目加1。游戏要达到的目标什是把所有W都移到B的左边。对这个问题，请定义一个启发函数h(n)，并给出用这个启发函数产生的搜索树。你能否判别这个启发函数是否...

计算机中的博弈问题一直是什么领域研究的重点内容之一
计算机中的博弈问题是人工智能领域研究的重点内容之一。其中最具代表性的是双人完备博弈，如国际象棋、西洋跳棋、围棋、中国象棋等。对于任何一种双人完备博弈，都可以用一个博弈树（与或树）来描述，并通过博弈树搜索策略寻找最佳解。1997年5月，由IBM公司研制的高性能并行计算机“深蓝”与国际象棋冠军...

博弈论思维
2001年，乔治·阿科尔洛夫、斯宾塞和约瑟夫·斯蒂格利茨，利用博弈论分析了市场的信息不对称问题，为现代信息经济学奠定了基础。2005年，托马斯·克罗姆比·谢林和罗伯特·约翰·奥曼通过博弈论分析了冲突和合作的理解。2007年，罗杰·迈尔森和埃里克·马斯金、里奥尼德·赫维茨，通过博弈论的研究推动了机制设计...

棋类游戏的算法有哪些
使用置换表最大的问题是置换表的组织和查找的效率。一般来说，置换表越大，查找的命中率就越高。但这个关系不是绝对的，当置换表大小达到一定规模后，不仅不会再提高命中率，反而会因为耗时的查找操作影响算法的效率。所以置换表不是越大越好，需要根据计算机的性能以及搜索的深度选择一个合适的大小。此外...

如何正确解读上天的预言?
汉献帝相信天命曹丕相信天命曹:作出合理理解;汉:禅让不相信天命曹:不作解释;汉:不禅让不相信天命曹:作出合理解释;汉:不禅让禅让的信息垄断从博弈树来看,相信天命是当时的公共知识,汉献帝不相信天命是不合常理的,应该去掉。作为公共知识,曹丕当然知道天命,但他可以不信或不作解释,也可以取得帝位,但就不可能有所谓...

云顶之弈树界降临流阵容怎么搭配_云顶之弈树界降临流阵容搭配攻略_百度...
云顶之弈树界降临流阵容搭配攻略阵容的成型期在6人口，妮蔻、奇亚娜、妖姬、梦魇、大树和翠神组成了这套阵容的全部。在很多8人口成型的阵容面前，这套6人口阵容同样不落下风。森林和德鲁伊羁绊能够提供足够的坦度和续航能力，刺客则是提供输出能力。阵容的核心点是梦魇、大树和翠神这三个英雄，因为需要的...

LOL云顶之弈大树怎么出装介绍_LOL云顶之弈大树怎么出装是什么_百度知 ...
在英雄联盟云顶之弈中，作为强力肉盾与控制角色的扭曲树精·茂凯备受玩家青睐。那么，如何为大树设计出装方案呢？以下是一份详细的攻略。首先，为了增强茂凯的生存能力和控制效果，推荐装备守护神板甲和守护天使。板甲为他提供了额外的防御力，而守护天使则在关键时刻为他抵挡伤害，确保他能在战场中持久作战。

我预判了你预判我的预判——关于预测的思维模型
博弈讨论的问题是合作过程中责、权、利的划分。零和博弈中 ,每个博弈参与者选择一个行动,并根据博弈参与者自己的行动和另一个博弈参与者的行动获得一定...在博弈树最末尾的分支上,我们写下相应行动路径的收益。在市场进入博弈中,有两个博弈参与者:拟进入者和现有企业。如果拟进入者选择不进入市场(博弈树的...

阳谷县18916341004： 博弈树的问题是这么一道题,一条1000m 的路上,分别有两个商店,每个顾客都会挑选离自己近的商店进行选购,这两个商店分别不知道对方在这一条路上... - ？
姓以复方：[答案] 选择500米的位置~ 这是最简单的博弈,等同于条件恒定的选民理论. 把1000米分为10段,0到100 100到200 …… 900到1000. 选在400到500和500到600米的位置,不论对手如何选择,至少可以获得50%的顾客,也就是这个博弈的最优策略. 然后推...

阳谷县18916341004： 什么是博弈树,怎么用来分析? - ？
姓以复方： 博弈树探讨一下难度较大的棋类游戏程序,比如国际象棋和西洋跳棋等等.用这些程序来同人或其他程序对弈.然而,有些程序是把计算机精心设计成一个棋盘,人们可以在其上对弈(或者是一种单人玩的棋盘游戏).这种程序更接近于系统...

阳谷县18916341004： 博弈问题状态空间图的特点是什么 - ？
姓以复方： 博弈树的特点1. 博弈的初始格局是初始节点.2.在博弈树中,“或”节点和“与”节点是逐层交替出现的.自己一方扩展的节点之间是“或”关系,对方扩展的节点之间是“与”关系.双方轮流地扩展节点.3.所有自己一方获胜的终局都是本原问题,相应的节点是可解节点;所有使对方获胜的终局都是不可解节点.

你可能想看的相关专题

星空见康网

博弈树的问题

你可能想看的相关专题