本文主要研究一类不连续条件更优回应保障下的n人非合作博弈良定性。首先在有限理性模型下给出良定性的一个新的充分条件。然后通过这个充分条件证明此类不连续博弈是良定的。更进一步得到了此类不连续博弈的Tykhonov良定性与Hadamard良定性。这些结果推广了已有文献的研究成果。 This paper mainly studies the well-posedness of n-person non-cooperative games under the better-reply security. Firstly, a new sufficient condition of well-posedness is obtained under the bounded rational model. Furthermore, the Tykhonov well-posedness and Hadamard well-posedness of the discontinuous non-cooperative games are obtained. These results generalize some findings in recent literature.
本文主要研究一类不连续条件更优回应保障下的n人非合作博弈良定性。首先在有限理性模型下给出良定性的一个新的充分条件。然后通过这个充分条件证明此类不连续博弈是良定的。更进一步得到了此类不连续博弈的Tykhonov良定性与Hadamard良定性。这些结果推广了已有文献的研究成果。
不连续非合作博弈,良定性,更佳回应保障
Wei Tian, Wensheng Jia*
College of Mathematics and Statistics, Guizhou University, Guiyang Guizhou
Received: Jan. 11th, 2024; accepted: Jan. 31st, 2024; published: Apr. 30th, 2024
This paper mainly studies the well-posedness of n-person non-cooperative games under the better-reply security. Firstly, a new sufficient condition of well-posedness is obtained under the bounded rational model. Furthermore, the Tykhonov well-posedness and Hadamard well-posedness of the discontinuous non-cooperative games are obtained. These results generalize some findings in recent literature.
Keywords:Discontinous Non-Cooperrative Games, Well-Posedness, Better-Reply Security
Copyright © 2024 by author(s) and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
Tykhonov [
近些年,博弈Nash均衡的良定性已经成为一个研究热点。Patrone [
另一方面,不连续博弈的研究也是一个热点,其主要研究目的是在支付函数不连续的情况下寻找更多的博弈均衡解存在的充分条件。Reny [
受上述研究工作的启发,本文给出了一个有限理性模型下博弈良定性新的充分条件,并证明了不连续条件更优回应保障下n人非合作博弈的良定性。我们的结果不仅减弱了良定性充分条件的连续性要求,而且也给出了不连续博弈良定性研究的新结果。
n人非合作博弈模型:设 λ = ( S i , u i ) i ∈ N 是一个n人非合作博弈,其中 N = { 1 , ⋅ ⋅ ⋅ , n } 是局中人的集合, ∀ i ∈ N ,局中人i的策略集为 S i , S = ∏ i ∈ N S i 。局中人i的支付由有界函数 u i : S → R 的确定。 ∀ i ∈ N 记 − i = N \ { i } 。如果存在 s * ∈ S ,使得 ∀ i ∈ N ,有
u i ( s i * , s − i * ) = max ω i ∈ S i u i ( ω i , s − i * ) ,
则称 s * 为此n人非合作博弈 λ = ( S i , u i ) i ∈ N 的Nash均衡。显然在博弈的Nash均衡处,每个局中人都不能通过单独改变自己的策略而使自己获得更大的利益。如果对于任意的局中人i,其策略空间 S i 是一个Hausdorff局部凸拓扑线性空间的非空紧子集则称博弈 λ 是紧的。另外,如果对于任意的局中人i,其策略空间 S i 是凸的,而且 ∀ s − i ∈ S − i , u i ( ⋅ , s − i ) 在 S i 上面是拟凹的,则称博弈 λ 是拟凹的。
定义1 [
u i ( s i ¯ , s ′ − i ) ≥ u i * + ε , ∀ s ′ − i ∈ O ( s − i * ) .
定义2 [
注1:设如果一个函数是下伪连续的而且包含0值,则其必是0-下伪连续的,反之不成立(参考如下反例)。
例1:设Q是全体有理数集合,定义如下 [ 0 , 1 ] 上的实值函数
u ( s ) = { 0 4 8 s = 0 s ∈ ( 0 , 1 ] ∩ Q 其 他 .
则对于任意的 s ∈ [ 0 , 1 ] 有 lim _ s ′ → s s ′ = 4 , lim ¯ s ′ → s s ′ = 8 。易知,此函数是0-下伪连续的但不是下伪连续的。
下面是有限理性模型下良定性的定义。
假设 M = { Λ , S , F , ϕ } 是一个有限理性模型,其中
(a) ∀ λ ∈ Λ , λ = ( F i ( λ ) , u i ) i ∈ N 是一个n人非合作博弈;
(b) S = ( S 1 , S 2 , ⋯ , S n ) 是博弈的策略集合, F ( λ ) = ( F 1 ( λ ) , F 2 ( λ ) , ⋯ , F n ( λ ) ) 是此博弈 λ 的可行策略集,由函数 F : Λ → P 0 ( S ) 所定义;
(c) ϕ : Λ × S → R 是有限理性函数,当 s ∈ F ( λ ) 时,则有 ϕ ( λ , s ) ≥ 0 。
假设 E ( λ , ε ) = { s ∈ S | ϕ ( λ , s ) < ε } 是博弈 λ 的 ε -平衡点集,其中 ε 是一个正实数。如果 ε = 0 ,设 E ( λ , 0 ) = E ( λ ) = { s ∈ S | ϕ ( λ , s ) = 0 } 是博弈 λ 的所有Nash均衡组成的集合。
定义3 [
定义4 [
定义5 [
性质1 [
首先给出良定性的一个充分条件。
引理1:假设 M = { Λ , S , F , ϕ } 是一个有限理性模型, ∀ λ ∈ Λ 有
(a) F : Λ → P 0 ( S ) 在 Λ 中是上半连续的且 F ( λ ) 是一个非空紧集;
(b) ϕ : Λ × S → R 在 Λ × S 上是0-下伪连续的。
则博弈 λ 是广义良定的。
证: ∀ λ n ∈ Λ ,满足 λ n → λ 与 ∀ s n ∈ E ( λ n , ε n ) ,当 ε n → 0 时,有 s n ∈ F ( λ n ) 。因为 F ( ⋅ ) 在 Λ 上是上半连续的且 F ( λ ) 是紧的。根据引理1.2 [
因为 ∀ s n ∈ E ( λ n , ε n ) 和 ε n → 0 ,显然
ϕ ( λ n k , s n k ) → 0.
利用反证法。如果 s ∉ E ( λ ) ,则有 ϕ ( λ , s ) > 0 。因为 ϕ ( ⋅ ) 是0-下伪连续的,有 lim _ n k → + ∞ ϕ ( λ n k , s n k ) > 0 。这与 ϕ ( λ n k , s n k ) → 0 是矛盾的,因此 s ∈ E ( λ ) ,即 s 是博弈 λ 的一个Nash均衡。(证毕)
注2:通过注1可知0-下伪连续是比下伪连续更弱的不连续条件,所有此引理推广了Yu [
假设 M A = { Λ , S , F , ϕ } 是更优回应保障博弈的一个有限理性模型,其中
(a) ∀ λ ∈ Λ , λ = ( F i ( λ ) , u i ) i ∈ N 是一个紧的,拟凹的与更优回应保障的n人非合作博弈,且 F ( ⋅ ) 在 Λ 上是上半连续的;
(b) 定义 ρ 为 Λ 上的距离,对于任意的 λ 1 = ( S i , u i 1 ) i ∈ N 与 λ 2 = ( S i , u i 2 ) i ∈ N 属于 Λ ,令
ρ ( λ 1 , λ 2 ) = ∑ i = 1 n sup s ∈ S | u i 1 ( s ) − u i 2 ( s ) | ; (1)
(c) ∀ λ ∈ Λ 与 ∀ s ∈ S ,理性函数 ϕ ( λ , s ) 定义为
ϕ ( λ , s ) = ∑ i = 1 n [ sup w i ∈ S i u i ( w i , s − i ) − u i ( s i , s − i ) ] . (2)
显然有 ϕ ( λ , s ) ≥ 0 且 ϕ ( λ , s ) = 0 当且仅当 s ∈ E ( λ ) 。通过给出更优回应保障n人非合作博弈的有限理性模型 M A = { Λ , S , F , ϕ } ,我们可以利用良定性去统一Hadamard良定性与Tykhonov良定性的研究。
定理1:假设有限理性模型 M A = { Λ , S , F , ϕ } 满足以上条件,则对于 ∀ λ ∈ Λ , λ 是广义良定的。
证:因为 ∀ λ ∈ Λ , F ( ⋅ ) 在 Λ 上是上半连续紧的,根据引理1只需要再证明理性函数 ϕ ( ⋅ ) 是0-下伪连续的即可。
对于任意的 ( λ , s ) ∈ Λ × S ,如果 ϕ ( λ , s ) > 0 ,且 { ( λ k , s k ) } 是博弈与策略的笛卡尔乘积 Λ × S 中满足的序列,有
ϕ ( λ k , s k ) = ∑ i = 1 n [ sup w i ∈ S i u i k ( w i , s − i k ) − u i k ( s i k , s − i k ) ] = ∑ i = 1 n [ sup w i ∈ S i u i k ( w i , s − i k ) − u i k ( s i k , s − i k ) ] − ∑ i = 1 n [ sup w i ∈ S i u i ( w i , s − i k ) − u i ( s i k , s − i k ) ] + ∑ i = 1 n [ sup w i ∈ S i u i ( w i , s − i k ) − u i ( s i k , s − i k ) ] = ∑ i = 1 n [ sup w i ∈ S i u i k ( w i , s − i k ) − sup w i ∈ S i u i ( w i , s − i k ) ] + ∑ i = 1 n [ u i k ( s i k , s − i k ) − u i ( s i k , s − i k ) ] + ∑ i = 1 n [ sup w i ∈ S i u i ( w i , s − i k ) − u i ( s i k , s − i k ) ] .
由于 u i k ( ⋅ ) 是有界的,可以找到一个策略 s ¯ i ∈ S i 使得 u i k ( s ¯ i , s − i k ) > sup w i ∈ S i u i k ( w i , s − i k ) − ρ ( λ k , λ ) 。根据 ρ ( λ k , λ ) 的定义,有
u i k ( s ¯ i , s − i k ) − ρ ( λ k , λ ) ≤ u i ( s ¯ i , s − i k ) ≤ sup w i ∈ S i u i ( w i , s − i k ) . 则有
sup w i ∈ S i u i k ( w i , s − i k ) − 2 ρ ( λ k , λ ) ≤ sup w i ∈ S i u i ( w i , s − i k ) . (3)
类似地,可得
sup w i ∈ S i u i ( w i , s − i k ) − 2 ρ ( λ k , λ ) ≤ sup w i ∈ S i u i k ( w i , s − i k ) . (4)
结合(3)与(4),可以推出
− 4 n ρ ( λ k , λ ) ≤ ∑ i = 1 n [ sup w i ∈ S i u i k ( w i , s − i k ) − sup w i ∈ S i u i ( w i , s − i k ) ] ≤ 4 n ρ ( λ k , λ ) .
由于 ρ ( λ k , λ ) → 0 ,可得
lim k → + ∞ ∑ i = 1 n [ sup w i ∈ S i u i k ( w i , s − i k ) − sup w i ∈ S i u i ( w i , s − i k ) ] = 0. (5)
因为 ρ ( λ k , λ ) → 0 且 − ρ ( λ k , λ ) ≤ ∑ i = 1 n [ u i k ( s i k , s − i k ) − u i ( s i k , s − i k ) ] ≤ ρ ( λ k , λ ) ,
可得
lim k → + ∞ ∑ i = 1 n [ u i k ( s i k , s − i k ) − u i ( s i k , s − i k ) ] = 0. (6)
令
φ ( s ) = ∑ i = 1 n [ sup w i ∈ S i u i ( w i , s − i ) − u i ( s i , s − i ) ] .
由于 ϕ ( λ , s ) > 0 ,则 s 不是博弈 λ 的Nash均衡。因 λ 是更优回应保障的,则 ∀ u ′ i ∈ { u ′ i | ( s , u ′ ) ∈ c g ( u ) } 其中 c g ( u ) 为支付函数的闭图,可以找到局中人 i , s ¯ i ∈ S i , s − i 的一个开邻域 O ( s − i ) 与一个正实数 ε 使得
u i ( s ¯ i , s ′ − i ) > u ′ i + ε , ∀ s ′ − i ∈ O ( s ′ − i ) . (7)
设 sup ( s , u ′ ) ∈ c g ( u i ) { u ′ i } = max ( s , u ′ i ) ∈ c g ( u i ) { u ′ i } = t 。根据(7)式,不妨设
u i ( s ¯ i , s ′ − i ) > t + ε , ∀ s ′ − i ∈ O ( s ′ − i ) .
因 sup x i ∈ S i u i ( x i , s ′ − i ) ≥ u i ( s ¯ i , s ′ − i ) ,有
sup w i ∈ S i u i ( w i , s ′ − i ) > t + ε , ∀ s ′ − i ∈ O ( s ′ − i ) .
因博弈 λ 是有界的,对于任意的 { s ′ } ,满足 s ′ → s ,不妨设 { s ′ } ⊂ O ( s ′ − i ) ,则有
lim _ s ′ → s sup w i ∈ S i u i ( w i , s ′ − i ) ≥ t + ε . (8)
由 φ ( s ) 的定义(2)式,有
lim _ s ′ → s φ ( s ′ ) ≥ lim _ s ′ → s { sup w i ∈ S i u i ( w i , s ′ − i ) − u i ( s ′ ) } ≥ lim _ s ′ → s sup w i ∈ S i u i ( w i , s ′ − i ) − lim ¯ s ′ → s u i ( s ′ ) . (9)
又有
lim ¯ s ′ → s u i ( s ′ ) ≤ sup ( s , u ′ ) ∈ c g ( u ) { u ′ } = max ( s , u ′ i ) ∈ c g ( u i ) { u ′ i } = t . (10)
结合(8)、(9)与(10),可得 lim _ s ′ → s φ ( s ′ ) > ε > 0 。由 { s ′ } 的任意性,则
lim _ k → + ∞ ∑ i = 1 n [ sup w i ∈ S i u i ( w i , s − i k ) − u i ( s i k , s − i k ) ] > 0. (11)
结合(5)、(6)与(11),可得 lim _ ( λ k , s k ) → ( λ , s ) ϕ ( λ k , s k ) > 0 。因此 ϕ ( ⋅ ) 是0-下伪连续的。(证毕)
由于一个伪连续n人非合作博弈也是更优回应保障的,则有如下推论。
推论1:对于满足上述条件的有限理性模型 M A = { Λ , S , F , ϕ } , ∀ λ ∈ Λ ,如果 λ 是一个伪连续的n人非合作博弈,则 λ 是广义良定的。
推论2 [
推论3:对于满足上述条件的有限理性模型 M A = { Λ , S , F , ϕ } , ∀ λ ∈ Λ , λ 是广义Tykhonov良定的。
本文通过不连续条件0-下伪连续,给出了博弈良定性的新的充分条件。然后利用这个充分条件证明了有限理性模型下更优回应保障博弈的良定性。由于一个博弈如果是广义良定的则其必定也是广义Tykhonov良定的与广义Hadamard良定的,也就得到更优回应保障条件下博弈的Tykhonov良定性与Hadamard良定性。
国家自然科学基金(12061020, 71961003),贵州省自然科学基金(20205016, 2021088, 20215640)。
田 魏,贾文生. 更优回应保障下n人非合作博弈Nash均衡解的良定性Well-Posedness of Nash Equilibrium for n-Person Non-Cooperative Games under the Better-Reply security[J]. 运筹与模糊学, 2024, 14(02): 1386-1392. https://doi.org/10.12677/orf.2024.142234
https://doi.org/10.1016/0041-5553(66)90003-6
https://doi.org/10.1007/BFb0084195
https://doi.org/10.1007/978-94-015-8472-2
https://doi.org/10.1007/978-94-015-8472-2_9
https://doi.org/10.1007/0-306-48026-3_15
https://doi.org/10.1016/j.na.2005.10.018
https://doi.org/10.1016/j.jmaa.2009.07.007
https://doi.org/10.1016/j.jmaa.2017.03.038
https://doi.org/10.1016/j.fss.2022.06.018
https://doi.org/10.1016/j.cam.2022.114917
https://doi.org/10.1111/1468-0262.00069
https://doi.org/10.1016/j.jmateco.2006.10.004
https://doi.org/10.1007/s00199-015-0921-8
https://doi.org/10.1016/j.jmateco.2019.02.008
https://doi.org/10.1111/1468-0262.00069
https://doi.org/10.22436/jnsa.010.04.46
https://doi.org/10.1080/00036811.2022.2147066
https://doi.org/10.23952/asvao.4.2022.1.08
https://doi.org/10.1007/s10898-008-9316-8