博弈树的问题

作者&投稿:示届 (若有异议请与网页底部的电邮联系)
关于博弈树的问题,谢谢了~

这个应该不难吧?像概率统计那样画棵树,第一行甲 剪刀、石头、布,第二行乙,在甲的每一项下长三个枝 剪刀、石头、布。这样行不行啊。或者是画个表格,求纳什均衡?
第二个条件对甲很不公平呀…
只是自学了一点博弈论,在这里实在是献丑啊!

博弈树

探讨一下难度较大的棋类游戏程序,比如国际象棋和西洋跳棋
等等。用这些程序来同人或其他程序对弈。然而,有些程序是把计算机精心设计成一个棋
盘,人们可以在其上对弈(或者是一种单人玩的棋盘游戏)。这种程序更接近于系统模拟
的领域,而不属于人工
智能的范畴。我们此处所要介绍的却是让计算机能够“思考”如何下棋。

假定有两个人或者两台机器在下棋。我们把其中一名称为棋手,另一名称为对手。而我们
始终从棋手的角度来观看这场竞赛。这样一来,如果棋手赢了、对手输了,我们就说这盘
棋赢了;如果棋手输了、对手赢了,我们就说这盘棋输了。

假设现在该轮到棋手走了。在大多数情况下,棋手对这步棋可以有若干种选择。对于棋手
的每一种选择,对手也有若干可供选择的相应棋步。对于棋手的每一步棋以及对手的每一
步回棋,棋手又有自己进一步的选择。显然,这里所遇到的分支情况同我们在状态搜索中
遇到的情形相同的。


实际上,我们可以把一盘棋想象成具有一个入口(起始位置)和一组出口的迷宫。有些出
口标上了赢的记号;有些出口标上了输的记号;而有些出口标上了和局的记号。在入口处
,棋手选择某条路径起步,在路径的一个岔口,对手挑选了自己的路径回步,棋手和对手
就这样轮流选择自己的
路径走下去。棋手总是力争通向胜利的出口,而对手却总是把棋路引向输的出口。有时双
方各自的努力不相上下,最后在和局出口结束棋局。或者他们一直在这个迷宫中徘徊,直
到形势变得非常明朗:双方循环兜圈子,这时只好双方握手言和。



因此,下棋游戏同状态图搜索是相似的,就是要在状态图中找出一条从初始状态到目的状
态的路径。但是,它们之间却有一个很大的差别。在状态图搜索中,总是由一名选手来选
择下一步往哪走。而在棋类的对弈中,棋手只有一半选择的权利,另一半由对手作出决定
。棋手是一直朝着目标
努力,而对手却是通过它每一步棋对此设置障碍。寻找机会把棋手从通往目标的路径上引
开。

对于任何一种博弈竞赛,我们可以构成一个博弈树。它类似于状态图和问题求解搜索中使
用的搜索树。博弈树的结点对应于某一个棋局,其分支表示走一步棋;根部对应于开始位
置,其叶表示对弈到此结束。在叶节点对应的棋局中,竞赛的结果可以是赢、输或者和局


所谓棋局,就是所有那些必须记录下来的信息。根据这些信息,比赛在按计划暂停以后能
够得以继续进行下去。显然,这些信息包括了此时棋子在棋盘上的位置以及指出下一步是
轮到棋手走,还是对手走。

博弈树是一棵与/或树,不同于在状态搜索中使用的纯粹的或树。

其原因是:当轮到棋手走时,他可以决定选择哪一步棋走。如果起码有一步可以担保棋手
能够到达赢的棋局,那么棋手就会选择这一步并保证能够取胜。因此对应于棋手走的节点
是一个或节点。


当轮到对手走时,选择是由对手决定的。棋手没有任何选择的权利。只有对手的所有可以
走的棋布都会导致棋手赢时,这时棋手才能保证会赢。因此,对于对手走的结点是一个与
节点。


对于一场经过深思熟虑地棋局来说,其博弈树是非常庞大的(国际象棋来说有10^120个节
点)。以至于不可能把这样大的博弈树装入计算机,也不可能在任何合理的、有限的时间
内进行详细的搜索。尽管如此,首先深入的考察一下完整的博弈树,然后再看看如何来修
正我们的原来的想法,
以便把搜索树修整到一个合理的范围。这样做还是很有意义的。

博弈策略

假设我们对所讨论的博弈问题构造了一棵完整的博弈树,我们希望能从中找出棋手应采用
的策略。这种策略应当确保棋手会赢,或者起码能够得到和局的结果。

首先我们把该博弈树的每一个节点标上w(对应于赢)、d(对应于和局)或者l(对应于
输)。如果当前的棋局对应于标有w的节点,那么就存在一种策略可以担保棋手会赢;如
果结点标的是d,那么除非对手失误,否则棋手最好的前景就是争取和局;如果节标的是l
,那么棋手只好认输了,
除非对手下错了棋。

对一个节点标以w、d和l的过程,可以如下进行。

我们的讨论从叶节点开始,每一个叶结点对应于一场棋赛的结束的终局。根据博弈的规则
,叶节点确定了棋手的赢,输和和局。这样,我们就把每一个叶节点标上相应的值。


现在我们按照从叶往根本方向进行研究。按照每一节点的子节点的标号来标记该节点本身
。节点标注的规则如下: 轮到棋手走步时,如果该节点的子节点至少有一个标有w,那么
,该节点就标为w;如果所有子节点都标为l,那么该节点标为l。其他情况标上d。
轮到对手走步时,如果该节点的子节点都标上了w,那么该节点标为w;如果有一个以上的
子节点标上了l,那么该节点标为l。其他情况标上d。

根节点的标注表明,在对手不失误的情况下,棋手能够得到的最好结果。如果根节点为w
,那么棋手稳操胜券;如果为l,那么对手一定能击败棋手;如果为d,那么在对手不失误
的条件下,棋手能够得到的最好结果就是平局。


一场比赛,如其根节点能够标上w或l,并且是很简单易于分析的话,就可以成为骗人的棋
局。该节点标作w的话,无论是谁先走,先走者都能赢;根节点为l的话,无论谁后走,则
后者也一定能赢。当然需要采取正确的策略。骗子知道哪一方面能够赢,以及要赢所需要
采用的策略。而这些,
受骗者肯定是不知道的。

棋手的策略应该遵循这样的原则:如果有一步棋能走到节点为W的棋局,那么就应当走这
步棋;如果所有的棋步都通向节点为l的棋局,那么就只好放弃这盘棋认输。其他情况下
,就要走到标为d的节点。

对手采取的策略正好相反:如果有一步棋能走到节点标为l的棋局,那么就下这步棋,如
果所有的棋步都通向节点为w的棋局,那就只有放弃认输。其他情况下,就要走到标为d的
节点。
当有两条以上的路径都能通往l节点,或者有两条以上的路径通往d节点时,棋手所采取的
策略就不再是决定性的了。在实际对弈中,棋手总是想选择w节点,达到了w节点,就使得
往后的对弈过程变得简单了。这样做就能减少棋手失误以致失去优势的机会。基于同样的
理由,棋手在达不到节
点时,应该选择d节点。这样就可以导致最复杂的情况产生。希望对手在这种情况下失误
以便使自己重新得到优势。到现在为止,我们的讨论还是很不充分的。因为在所有的w节
点或者所有的l节点之间,我们并没有给出任何差别。

博弈树的研究程序更难棋盘游戏,如象棋和跳棋

如此。使用这些程序给同事或其他国际象棋程序。然而,一些计算机程序被设计成一个国际象棋

板,其上的人可以下棋(或一个人玩棋盘游戏)。本程序是接近系统仿真

,不属于人工智能的字段。我们要在这里介绍的是允许计算机“想”怎么下棋。

假设有两个人或两个机器在下棋。我们叫了一个球员,另一名对手。我们

总是从玩家的角度来观看比赛。因此,如果玩家赢了,对手输了,我们说这个菜

棋取胜;如果玩家输了,对手获胜,我们说,这盘棋输。

现在假设玩家的回合中去。在大多数情况下,玩家可以有几种选择移动此步骤。

对于每一个球员选项,有许多竞争者,以选择合适的动作。对于每一个举动,每一步

棋对手的回馈玩家,也能促进他们自己选择的球员。显然,随着形势的分支遇到的情况在这里我们说明搜索

遇到了同样的。

其实,我们可以想象一盘棋有一个入口(起始位置)和一组迷宫的出口。一些口腔

胜利标志着标记;失去一些出口附有标志,而在该商标及董事会部分出口标志。在入口处

,玩家选择开始在路径叉子,他的对手回选择步骤,玩家和对手的路径,以便

轮流选择自己的道路走的路径上。球员总是力争胜利的出口,而对手已经向着出口道路始终将失去。有时候双

媲美各自的努力,终于结束了领带出口的游戏。或者他们一直徘徊在迷宫中,直到

到情况变得很清楚:无论是在兜圈子循环,然后让双方握手言和。

所以,用状态图棋牌游戏是类似于搜索是要找到从初始状态的路径,以状态图的目标状态

状态。但是,它们之间有很大的区别。在状态图搜索总是由玩家来选择下一步去哪里

选择。在国际象棋棋盘,玩家的权利,选择的对手,另一半

决定的只有一半。玩家

努力一直朝着目标迈进,但对手是通过它的一举一动此设置障碍。寻找机会从

开放路径到目标引领玩家。

对于任何类型的游戏

大赛,我们可以形成一个博弈树。它类似于状态图和解决问题的搜索操作

与搜索树。博弈树节点对应于一个特定的棋局,其分支表示此举是为了去;根

对应的起始位置时,它的叶子代表象棋的目的。在叶节点对应的国际象棋比赛,比赛的结果可以是赢,输或绘制



所谓的棋局是,所有的信息必须是记录。根据此信息,游戏可以在计划

足以继续之后被暂停。显然,这种信息包括位置,并指出,下一步就是去

玩家回合在黑板上这段时间片,或对手了。

博弈树是树和/或树,不同于纯态或在搜索中使用的树。

原因是这样的:当玩家转来转去,他可以决定转会离开。如果你能保证玩家有至少一个台阶,达到取胜

棋牌游戏,那么玩家将可以选择这一步,并确保胜利。因此,对应于玩家去的节点

1或节点。

当对手的回合中去,选择由对手决定的。球员没有选择的权利。所有的对手只能去

遍布将导致当玩家赢了,那么玩家就可以保证取胜。因此,该节点是对手一起去

节点。

对于一个深思熟虑的方式棋牌游戏,其游戏树是非常大的(10 ^来讲象棋节

120分)。这是不可能的这样一个大博弈树插入电脑,他们不能在任何合理的行为在有限的时间

详细的搜索。尽管如此,第一次深入看看完整的博弈树,然后看看如何修复
是我们最初的想法,

要调整到一个合理的范围内搜索树。仍然是有意义的话。

游戏战略假设我们所讨论的博弈树的问题,构建了一个完整的博弈树,我们希望能找出球员应该

策略。这一策略应确保玩家将获胜,或者至少能够得到的结果和董事会。

首先,我们把游戏标记W(相当于赢),D(对应于领带)或L(相当于

输)树的每个节点上。如果当前棋局标W相应于一个节点,则有可能是一种策略,以保证玩家将赢得;如果

如果节点为d的主题,那么,除非对手犯错,否则玩家提供最有利的争夺和局;如果是节日的主题升

,那么玩家不得不认输,

除非对手错误的举动。

对于标记瓦特的一个节点,D和L的过程可以进行。

我们的讨论从叶节点开始,每个叶节点对应一个棋局的最终结束。根据游戏

规则,叶节点决定了玩家赢,输和借鉴。因此,我们把对应于标示每个叶子节点的值。

现在我们研究按照从叶片的方向到根。参考根据标签节点本身

的每个节点数字的子节点。注下列规则节点:玩家携带反过来,如果有至少一个标记瓦特的节点的子节点,然后

,该节点被标记为瓦特;如果所有的子节点被标记为l,则该节点标升。标有D的其他情形。

携带对手转,如果子节点上都标有W,则该节点标记瓦;如果有一个以上的子节点

标有L,然后在升节点的标记。标有D的其他情形。

根标签表明,在对手失误的情况下,最好的结果,玩家可以得到。如果根为w

,那么玩家一定要赢,如果升,那么对手将是能够击败的玩家,大多数,如果它为d,则在不失误的对手

条件下,玩家可以得到良好的结果是平局。

游戏,因为它的根节点可以标记W或L,并且是非常简单和易于分析,那么它可以成为一个谎言象棋

局。这个节点标记为w,然后,不管是谁先走,先走谁是赢家;升根,然后去后谁,然后

后者必须取胜。当然,需要采取正确的策略。骗子知道哪边可以赢了,赢得了政策方面

需要。这些,

上当了当然不知道。

玩家的策略应该遵循这样的原则:如果有一招可以来点W棋局,那么就应该采取这一步骤

棋,如果所有的动作都是通过对节点升棋牌游戏,然后不得不放弃这盘棋失利。在其他情况下

,我们必须去节点标记为D。

对手的策略是正好相反:如果有一招可以去一个节点标记的1棋局,那么这一招,因为

如果所有的动作都导致该节点为w棋牌游戏,它只能放弃认输。在其他情况下,我们必须去

节点被标记为D。

当有两个或多个路径通往升的节点就可以了,或者有两个以上的路径,从而导致采取

策略在D点的玩家不再是决定性的。在实际的国际象棋,玩家总是希望选择达到瓦特节点瓦特节点使得象棋

后续过程变得简单。这样做可以减少出错的几率,玩家失去优势。

出于同样的原因,玩家在一节

达到的地步,你应该选d节点。这可能导致在最复杂的情况下出现的。在这种情况下,对手希望

做出自己的错误重新夺回优势。到现在为止,我们的讨论是不够远。由于所有部分之间
点w或全部升的节点,我们没有给任何区别。

选择500米的位置~
这是最简单的博弈,等同于条件恒定的选民理论。
把1000米分为10段,0到100 100到200 …… 900到1000。
选在400到500和500到600米的位置,不论对手如何选择,至少可以获得50%的顾客,也就是这个博弈的最优策略。
然后推导到100段 1000段,仍然是最中间的位置,即490到500 500到510 499到500 500到501。
微积分到最后剩下500~
用博弈树的话,自己画图就行,A选择位置,然后B确定位置,按顺序选择即可。


极大极小过程体现了怎样的一种思想
极大极小过程是一种思想,主要应用于博弈论和决策树等领域。它的核心思想是通过遍历博弈树的所有节点,找到能够使己方收益最大化的动作,同时最小化对手的收益。极大极小过程常用于解决零和博弈问题,其中一方的胜利代表另一方的失败,比如象棋、五子棋等。在极大极小过程中,通过构建博弈树来表示游戏的...

C语言 五子棋 博弈树算法 叶子节点的分值是如何计算的
其实这个不是难点的,那个分数是当前落子后所形成的以这个棋子为中心的9x9矩阵中所形成的棋型,计算其他地方的棋型显然没有什么意义,再有就是不是C语言才可以写算法的,对于极大极小原理,博弈树和alpha-beta剪枝算法都是基于这个原理的,如果你是刚学编程不久,而且没有数据结构的基础是写不出来运用...

人工智能 AI3章作业题解释
游戏的规定走法是:(1)任意一个将牌可移入相邻的空格,规定其代价为1;(2)任何一个将牌可相隔1个其它的将牌跳入空格,其代价为跳过将牌的数目加1。游戏要达到的目标什是把所有W都移到B的左边。对这个问题,请定义一个启发函数h(n),并给出用这个启发函数产生的搜索树。你能否判别这个启发函数是否...

计算机中的博弈问题一直是什么领域研究的重点内容之一
计算机中的博弈问题是人工智能领域研究的重点内容之一。其中最具代表性的是双人完备博弈,如国际象棋、西洋跳棋、围棋、中国象棋等。对于任何一种双人完备博弈,都可以用一个博弈树(与或树)来描述,并通过博弈树搜索策略寻找最佳解。1997年5月,由IBM公司研制的高性能并行计算机“深蓝”与国际象棋冠军...

博弈论思维
2001年,乔治·阿科尔洛夫、斯宾塞和约瑟夫·斯蒂格利茨,利用博弈论分析了市场的信息不对称问题,为现代信息经济学奠定了基础。2005年,托马斯·克罗姆比·谢林和罗伯特·约翰·奥曼通过博弈论分析了冲突和合作的理解。2007年,罗杰·迈尔森和埃里克·马斯金、里奥尼德·赫维茨,通过博弈论的研究推动了机制设计...

棋类游戏的算法有哪些
使用置换表最大的问题是置换表的组织和查找的效率。一般来说,置换表越大,查找的命中率就越高。但这个关系不是绝对的,当置换表大小达到一定规模后,不仅不会再提高命中率,反而会因为耗时的查找操作影响算法的效率。所以置换表不是越大越好,需要根据计算机的性能以及搜索的深度选择一个合适的大小。此外...

如何正确解读上天的预言?
汉献帝相信天命曹丕相信天命曹:作出合理理解;汉:禅让不相信天命曹:不作解释;汉:不禅让不相信天命曹:作出合理解释;汉:不禅让禅让的信息垄断从博弈树来看,相信天命是当时的公共知识,汉献帝不相信天命是不合常理的,应该去掉。作为公共知识,曹丕当然知道天命,但他可以不信或不作解释,也可以取得帝位,但就不可能有所谓...

云顶之弈树界降临流阵容怎么搭配_云顶之弈树界降临流阵容搭配攻略_百度...
云顶之弈树界降临流阵容搭配攻略 阵容的成型期在6人口,妮蔻、奇亚娜、妖姬、梦魇、大树和翠神组成了这套阵容的全部。在很多8人口成型的阵容面前,这套6人口阵容同样不落下风。森林和德鲁伊羁绊能够提供足够的坦度和续航能力,刺客则是提供输出能力。阵容的核心点是梦魇、大树和翠神这三个英雄,因为需要的...

LOL云顶之弈大树怎么出装介绍_LOL云顶之弈大树怎么出装是什么_百度知 ...
在英雄联盟云顶之弈中,作为强力肉盾与控制角色的扭曲树精·茂凯备受玩家青睐。那么,如何为大树设计出装方案呢?以下是一份详细的攻略。首先,为了增强茂凯的生存能力和控制效果,推荐装备守护神板甲和守护天使。板甲为他提供了额外的防御力,而守护天使则在关键时刻为他抵挡伤害,确保他能在战场中持久作战。

我预判了你预判我的预判——关于预测的思维模型
博弈讨论的问题是合作过程中责、权、利的划分。 零和博弈中 ,每个博弈参与者选择一个行动,并根据博弈参与者自己的行动和另一个博弈参与者的行动获得一定...在博弈树最末尾的分支上,我们写下相应行动路径的收益。 在市场进入博弈中,有两个博弈参与者:拟进入者和现有企业。 如果拟进入者选择不进入市场(博弈树的...

阳谷县18916341004: 博弈树的问题是这么一道题,一条1000m 的路上,分别有两个商店,每个顾客都会挑选离自己近的商店进行选购,这两个商店分别不知道对方在这一条路上... -
姓以复方:[答案] 选择500米的位置~ 这是最简单的博弈,等同于条件恒定的选民理论. 把1000米分为10段,0到100 100到200 …… 900到1000. 选在400到500和500到600米的位置,不论对手如何选择,至少可以获得50%的顾客,也就是这个博弈的最优策略. 然后推...

阳谷县18916341004: 什么是博弈树,怎么用来分析? -
姓以复方: 博弈树 探讨一下难度较大的棋类游戏程序,比如国际象棋和西洋跳棋 等等.用这些程序来同人或其他程序对弈.然而,有些程序是把计算机精心设计成一个棋 盘,人们可以在其上对弈(或者是一种单人玩的棋盘游戏).这种程序更接近于系统...

阳谷县18916341004: 博弈问题状态空间图的特点是什么 -
姓以复方: 博弈树的特点1. 博弈的初始格局是初始节点.2.在博弈树中,“或”节点和“与”节点是逐层交替出现的.自己一方扩展的节点之间是“或”关系,对方扩展的节点之间是“与”关系.双方轮流地扩展节点.3.所有自己一方获胜的终局都是本原问题,相应的节点是可解节点;所有使对方获胜的终局都是不可解节点.

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网