博弈论基础及其应用电子书 博弈论基础Game Theory Basics

小编 2025-03-19 论坛 23 0

博弈论基础Game Theory Basics

编者按:当前,群体智能已成为新一代人工智能的重要领域,如何更好实现多智能体间的相互协作、相互竞争意义重大。而当我们面对群体智能决策问题、要使多智能体系统具备更强大能力时,对博弈论的学习与应用必不可少。今天,小编为你整理了中科院自动化所张海峰副研究员讲授的《博弈论基础》课程,邀你一起了解人工智能强化学习语境中的博弈论。

转载来源:中国科学院自动化研究所

备注:该课程来自于近日国内外知名高校和研究机构的强化学习领域研究者共同发起的RLChina 2020强化学习夏令营。该夏令营以在线公开课的形式开展,课程内容包括严谨的数学推导、最新的研究结果和理论。相关课程视频在ZOOM、B站同步直播。中科院自动化所(公众号:casia1956)获得课程主讲老师授权,做不改变原意的课程概要编辑整理。

本期内容为中科院自动化所副研究员张海峰带来的《博弈论基础》 课程。课程内容包括研究动机和标准式博弈、扩展形式博弈和不完美信息、贝叶斯博弈和不完全信息、纳什均衡及其变体、纳什均衡理论结果、重复博弈及其学习方法、其他解法和进化博弈论等7个章节。

张海峰 中国科学院自动化研究所副研究员、硕士生导师

观看课程

https://v.qq.com/x/page/f31330qkut8.html

提前剧透一下,文末有课程脉络总结哦!

课程概要

01

研究动机和标准式博弈章节解释了博弈论在强化学习中的必要性和地位,由生活中的博弈及博弈论发展历史引入,明确博弈中的基本要素、前提条件,并通过例子直观地解释一般形式的博弈,解释了纯策略和混合策略的概念。

02&03

扩展形式博弈和不完美信息、贝叶斯博弈和不完全信息 两个章节介绍了结合马尔可夫决策过程的马尔可夫博弈、不完全信息的贝叶斯博弈,充分比较了扩展型博弈和标准型博弈,解释不完全信息和不完美信息的区别,总结了不同类型下游戏的策略表示,并展示了不同类别博弈的经典案例。

04

第四章纳什均衡及其变体 由博弈的解法推导出发,介绍纳什均衡的含义,并解释了帕累托最优和纳什均衡的差别。接着进一步介绍混合策略的纳什均衡、扩展型博弈的纳什均衡、子博弈精炼纳什均衡、贝叶斯纳什均衡以及完美贝叶斯纳什均衡。章节最后,张海峰副研究员总结了各类博弈下对应采用的纳什均衡概念

05

第五章纳什均衡理论结果 介绍纳什均衡的理论部分,包括纳什定理,即纳什均衡存在性证明,同时引出证明的基础Brouwer不动点定理和Sperner引理。最后介绍纳什均衡的计算复杂度及PPAD问题类,以及学者对四个问题的归约。

06

第六章重复博弈及其学习方法 重复博弈及其学习方法中,在定义重复博弈概念后,介绍重复囚徒困境问题中的Tit-for-tat和Win-stay, lose shift经典策略,以及无限重复博弈下的无名氏定理。学习方法方面介绍了虚拟对策(Fictitious Play)和非遗憾学习(No-regret Learning)。

07

第七章其他解法和进化博弈论 介绍了两个其他均衡:Stackelberg均衡和Correlated均衡 。另外还介绍了进化博弈论,以及其中涉及的Replicator模型等相关理论

最后张海峰副研究员将本节课涉及的所有知识点总结在一张图中,帮助同学们更清晰地理解《博弈论基础》课程脉络。

《博弈论基础》中文版 20周年纪念版上市

如果你认为博弈论有点高深?那么社科君告诉你,你的生活中每天都在应用博弈论,比如买东西砍价,比如网购计算打折金额。可如果,社科君请你系统的说清楚什么叫博弈论,你可能会表述不清。没关系,让社科君们在开始严肃的阅读之前,带你先从一个尽人皆知的话题“囚徒困境”开始了解博弈论。

“囚徒困境”是1950年美国兰德(Rand)公司的梅里尔·弗勒德(MerrillFlood)和梅尔文·德雷希尔(MelvinDresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(AlbertTucker)以囚徒方式阐述,并命名为“囚徒困境”。两个共谋犯罪的人被关入监狱,不能互相沟通情况。如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱十年;若互相揭发,则因证据确凿,二者都判刑八年。由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。最终导致纳什均衡仅落在非合作点上的博弈模型。

怎么让社科君想起了电影《少年的你》

什么叫纳什均衡?纳什平衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。在纳什平衡中,每个博弈者的平衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。

如果觉得理解纳什均衡有点困难,可以寓学于乐的看经典电影《美丽心灵》,里面有几段精彩的解释了纳什均衡理论。社科君们聊回来,囚徒困境(Prisoner'sDilemma)是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。或者说在一个群体中,个人做出理性选择却往往导致集体的非理性。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。

永攀科学高峰,需要一个好伴侣。社科君们就不看罗素·克劳了秀恩爱了,还是看本书 的作者 罗伯特·吉本斯

《博弈论基础》是一本相当经典的博弈论入门读物,进入中国20年成为了无数读者了解博弈论的首选读物,有时也是高校教材。作者罗伯特·吉本斯是美国麻省理工大学斯隆管理学院管理学特聘教授,兼经济学系组织经济学教授。他今天依然活跃在麻省理工的讲台上。今天重读1992年作者书写的前言段落,足可以中国读者心灵极大的冲击。作者提到的博弈论应用场景,在中国几十年剧烈的经济和社会变迁中,中国人全都遇见了。所以,我们有理由为我们的学习能力而自豪,而且我们也足够有信心在任何新的领域走出自己的道路。

找到一张作者Robert Gibbons授课照片,这个PPT简约不简单嘛

博弈论基础(当代经济学教科书译丛)

学者推荐

介绍博弈论的杰出之作:清晰、精确,并间以丰富的例证,此书将是尚未涉足博弈论的应用经济学者入门必读,亦为博弈论大师们讲授这门课的最好教材。

——戴维·克雷普斯David M.Kreps,期坦福大学

此书的力量在于从博弈论的最新发展中撷取了大量例证,吉本斯善于把抽象的问题讲得简单易懂。这方面他真是个天才,使人对这一理论兴味大增。绝大多数例子本身就妙趣横生——简直令人不忍释卷,这种理论和应用的完美结合正是读者希望此类书籍能够达到的。

——舍文·罗森Sherwin Rosen,芝加哥大学

这本书在理论和应用的结合方面是非常杰出的,例子已成为每章不可分割的组成部分,不仅为学习技术方法提供了可信的例证,同时还介绍了经济学应用领域的最新进展。此书对希望掌握博弈论应用的学生和研究人员都是必读之物。

——詹姆斯·波特巴 James Poterba,MIT

(曹潜 撰稿)

重磅推荐

博弈论基础(当代经济学教科书译丛)

【美】罗伯特·吉本斯 著

高峰 译

内容简介

本书是尚未涉足博弈论的应用经济学者入门必读,亦为博弈论大师们讲授这门课的最好教材。本书的力量在于从博弈论的最新发展中撷取了大量例证,本书善于把抽象的问题讲得简单易懂。这方面他真是个天才,使人对这一理论兴味大增。绝大多数例子本身就妙趣横生--简直令人不忍释卷,这种理论和应用的完美结合正是读者希望此类书籍能够达到的。本书在理论和应用的结合方面是非常杰出的,例子已成为每章不可分割的组成部分,不仅为学习技术方法提供了可信的例证,同时还介绍了经济学应用领域的最新进展。

目录

向上滑动阅览

第1章 完全信息静态博弈

1.1 基础理论:博弈的标准式和纳什均衡

1.1.A 博弈的标准式表述 [3]

1.1.B 重复剔除严格劣战略

1.1.C 纳什均衡的导出和定义

1.2 应用举例

1.2.A 古诺的双头垄断模型 [4]

1.2.B 贝特兰德的双头垄断模型

1.2.C 最后要价仲裁

1.2.D 公共财问题

1.3 理论发展:混合战略和均衡的存在性

1.3.A 混合战略

1.3.B 纳什均衡的存在性 [2]

1.4 进一步阅读

1.5 习题与练习

1.6 参考文献

第2章 完全信息动态博弈

2.1 完全且完美信息动态博弈

2.1.A 理论:逆向归纳法

2.1.B 斯塔克尔贝里双头垄断模型

2.1.C 有工会企业的工资和就业

2.1.D 序贯谈判

2.2 完全非完美信息两阶段博弈

2.2.A 理论:子博弈精炼

2.2.B 对银行的挤提

2.2.C 关税和国际市场的不完全竞争

2.2.D 工作竞赛

2.3 重复博弈

2.3.A 理论:两阶段重复博弈

2.3.B 理论:无限重复博弈

2.3.C 古诺双头垄断下的共谋

2.3.D 效率工资

2.3.E 时间一致性的货币政策

第3章非完全信息静态博弈

3.1理论:静态贝叶斯博弈和贝叶斯纳什均衡

3.1.A一个例子:非对称信息下的古诺竞争

3.1.B静态贝叶斯博弈的标准式表述

3.1.C贝叶斯纳什均衡的定义

3.2应用举例

3.2.A再谈混合战略

3.2.B拍卖的一种

3.2.C双向拍卖

3.3显示原理

3.4进一步阅读

3.5习题与练习

第3.1节

第3.2节

3.6参考文献

第4章 非完全信息动态博弈

4.1精炼贝叶斯均衡概述

4.2信号博弈

4.2.A信号博弈的精炼贝叶斯均衡

4.2.B就业市场信号

4.2.C公司投资的资本结构

4.2.D货币政策

4.3精炼贝叶斯均衡的其他应用

4.3.A空谈博弈

4.3.B非对称信息的序贯谈判

4.3.C有限重复囚徒困境中的声誉

4.4精炼贝叶斯均衡的再精炼

4.5进一步阅读

4.6习题

第4.1节

第4.2节

第4.3节

第4.4节

4.7参考文献

冷门甲骨,代有传承

《汉民族史记》:打破王朝史框架,建构汉民族专题史

一册天国志,半部近代史

疫情之下如何理解中国制造

新书推荐|疫情之下稳增长

The End

相关问答

博弈论基础 入门书籍?

《博弈论入门》是一本经典的博弈论入门书籍,该书通俗易懂,结构清晰,从博弈论的基本概念和模型入手,深入浅出地讲解了博弈的一些基本原理和解决方法,并通过丰...

博弈论 的理论 基础 应用 在经济学领域如此成熟的情况下还有研究空间吗?

经济学领域永远没有所谓的成熟的概念,因为经济学永远在成长,曾经远古时代经济学只跟食物有关,而后与日用品有关,后来又发展到奢侈品,甚至是今天的网络经济,...

博弈论 入门什么书比较好?

以下是几本博弈论入门的好书:1."GameTheory:AnIntroduction"bySimonKuznets:这是一本经典的博弈论教材,主要介绍了博弈论的基...

博弈论 最好的入门书是哪本?

博弈论是一门独特的学问,是从数学中发展出来的。对于初学者来说,推荐的入门书籍是《博弈论入门》。本书讲解详细,自由度高,容易理解。此外,书中展示了各种应...

博弈论 最好的十本书?

博弈论有哪些值得一看的经典书籍《策略思维》耶鲁大学教授奈尔伯夫和普林斯顿大学教授迪克西特的这本著作,用许多活生生的例子,向没有经济学基础的读者展示...

什么是 博弈论 ?

博弈论的英文名字是:gametheory。顾名思义,就是做游戏的理论。这个游戏可以是我们正常理解的棋牌类游戏,也可以是电脑游戏,甚至打篮球踢足球这样的游戏。简...

【学 博弈论 ,需要掌握多少数学知识?】作业帮

[最佳回答]不需要博弈论只是经济学的一个分支但实质内容却和心理学类似站在别人的角度去思考问题这就是博弈博弈需要的更多是思考不是数学不需要博弈论只是经...

学习“深度学习”的课程,需要有哪些技术 基础 ?

机器学习以数学理论为基础,要学好机器学习必须做好艰苦奋斗的准备,坚持对数学知识的追求。掌握机器学习至少需要微积分,线性代数,概率论,统计学,高等数学...4.统...

博弈论 技巧?

博弈论是一种用于研究决策过程的数学理论。以下是一些博弈论的技巧:了解对手:在博弈中,了解对手的策略和行为模式可以帮你做出更好的决策。通过观察对手的行...

考研考经济学专业课有什么书可以推荐一下?

要参加2019考研的小伙伴,无论你考的是微观经济学还是宏观经济学你都必须开始专业课的复习了!经济学考研的经典参考书,希望对你的复习有所帮助!曼昆《经济...