本文将在正相协相依样本下,利用分组经验似然比方法,构造分布函数的置信区间。 This paper studies distribution function by group empirical likelihood method under strongly sta-tionary PA random sample. And we develop empirical likelihood ratio method to construct ap-proximate confidence regions for distribution function.
黄娟
广东海洋大学,数学与计算机学院,广东 湛江
收稿日期:2019年1月2日;录用日期:2019年1月21日;发布日期:2019年1月28日
本文将在正相协相依样本下,利用分组经验似然比方法,构造分布函数的置信区间。
关键词 :正相协,分组经验似然,置信区间
Copyright © 2019 by author and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY).
http://creativecommons.org/licenses/by/4.0/
Joag-Dey和Proschan (1983, [
定义1: [
C o v ( f 1 ( X i , i ∈ A 1 ) , f 2 ( X j , j ∈ A 2 ) ) ≥ 0
此处, f 1 与 f 2 是任何两个使得协方差存在的对每个变量均非降(或非升)的函数。称随机变量序列 { X i , i ∈ N } 是PA序列,如果对任何 n ≥ 2 ,随机变量 X 1 , X 2 , ⋯ , X n ( n ≥ 2 )都是PA (正相协)的。
若 X 1 , X 2 , ⋯ , X n 为来自总体 X 的正相协样本,由于 E I { X i ≤ x } = F ( x ) ,
经验似然 R ( F ( x ) ) = sup { ∏ i = 1 n n w i , w i ≥ 0 , ∑ i = 1 n w i = 1 , ∑ i = 1 n w i I { X i ≤ x } = F ( x ) }
对数经验似然为 l ( F ( x ) ) = − 2 log R ( F ( x ) ) = 2 ∑ i = 1 n log ( 1 + s [ I { X i ≤ x } − F ( x ) ] ) 。
此处 s ∈ R 1 ,且满足 K ( s ) = 1 n ∑ i = 1 n I { X i ≤ x } − F ( x ) 1 + s [ I { X i ≤ x } − F ( x ) ] = 0 。
条件:
1) X 1 , X 2 , ⋯ , X n 是来自总体的强平稳PA样本;
2) 令 u n = sup k ∑ j : | j − k | ≥ n C o v [ ( I { X j ≤ x } − F ( x ) ) , ( I { X k ≤ x } − F ( x ) ) ] < ∞ ,若对某个 r > 2 ,满足 u n = O ( n − ( r − 2 ) 2 ) ,
3) ∑ i = 1 ∞ C o v [ ( I { X 1 ≤ x } − F ( x ) ) , ( I { X 1 + i ≤ x } − F ( x ) ) ] < ∞ ;
定理1:如果上述条件成立,我们有
l ( F ( x ) ) → d A 2 σ 2 χ ( 1 ) 2 , n → ∞ 。
此处 A 2 = V a r [ I { X ≤ x } − F ( x ) ] + 2 ∑ i = 1 ∞ C o v [ ( ( I { X 1 ≤ x } − F ( x ) ) , ( I { X 1 + i ≤ x } − F ( x ) ) ) ] , σ 2 = V a r ( I { X i ≤ x } − F ( x ) ) 。
然而 A 2 和 σ 2 未知,定理1的结果不能应用,为了攻克这一缺陷,下面利用分组经验似然方法,重新构造经验似然比函数。
记 m = [ n α ] , g = [ n 2 m ] ,其中 [ ⋅ ] 表示取整, 0 < α < 1 2 为简单起见,使 n = 2 m g 。
令 ξ i = ∑ j = 1 m [ I { X 2 ( i − 1 ) m + j ≤ x } − F ( x ) ] η i = ∑ j = 1 m [ I { X ( 2 i − 1 ) m + j ≤ x } − F ( x ) ] Y 2 i − 1 = ξ i m , Y 2 i = η i m (对任意的 i = 1 , 2 , ⋯ , g )
由于 { X i | i ≥ 1 } 的强平稳性, Y i ( i = 1 , ⋯ , 2 g ) 有共同分布函数 G ,对应经验分布函数 G 2 g 。分组经验似然比为 R ′ ( F ( x ) ) = sup { ∏ i = 1 2 g 2 g P ′ i | ∑ i = 1 2 g P ′ i = 1 , P ′ i ≥ 0 , ∑ i = 1 2 g P ′ i m Y i = 0 } 。
对数经验似然比为 l ′ ( F ( x ) ) = − 2 log R ′ ( F ( x ) ) = 2 ∑ i = 1 2 g log ( 1 + λ m Y i ) 。
此处 λ ∈ R 1 且满足 K ′ ( λ ) = 1 2 g ∑ i = 1 2 g m Y i 1 + λ m Y i = 0 。
定理2:在定理1的条件下,我们有 l ′ ( F ( x ) ) → d χ ( 1 ) 2 , n → ∞ 。
利用定理2,当样本 n 比较大时,可构造未知的分布函数 F ( x ) 的置信水平为 1 − α 的渐近置信区域: P ( F ( x ) | l ′ ( F ( x ) ) ≤ C α ) ≈ 1 − α ,其中 C α 为 χ ( 1 ) 2 分布的上 α 分位点,例如 α 取0.05或0.01。
引理1:记 Z n = max 1 ≤ i ≤ n | [ E I { X i ≤ x } − F ( x ) ] | ,有 Z n = ο p ( n 1 2 ) 。
证明:由于 [ E I { X i ≤ x } − F ( x ) ] 有界,易得
Z n = max 1 ≤ i ≤ n | [ E I { X i ≤ x } − F ( x ) ] | = ο p ( n 1 2 ) 。
引理2: [
sup m ∈ N ∪ { 0 } E | S m + n − S n | r ≤ C n r 2 。
引理3: [
sup − ∞ < x < ∞ | P ( 1 n ∑ i = 1 n X i A 0 < x ) − Φ ( x ) | → 0 ,其中 Φ ( x ) 为标准正态分布。
引理4:设 { X i | i ≥ 1 } 是强平稳PA序列,则有 1 2 g ∑ i = 1 2 g m ( Y i ) 2 = A 2 + ο p ( 1 ) 。
其中 A 2 = V a r [ I { X ≤ x } − F ( x ) ] + 2 ∑ i = 1 ∞ C o v [ ( I { X 1 ≤ x } − F ( x ) ) , ( I { X 1 + i ≤ x } − F ( x ) ) ] 。
证明:令 S 2 = 1 2 g ∑ i = 1 2 g m ( Y i ) 2 ,利用引理2和条件2有
E ( S 2 ′ − E S 2 ′ ) 2 = ( m 2 g ) 2 E [ ∑ i = 1 2 g ( ( Y i ′ ) 2 − E ( Y i ′ ) 2 ) ] 2 ≤ C ( m 2 2 g ) E ( Y i ) 4 ≤ C m 2 2 g E | I { X i ≤ x } − F ( x ) | 4 m 2 ≤ C 2 g E | I { X i ≤ x } − F ( x ) | 4 → 0
此处 C 为某个正常数,不同的地方 C 取值可不同。
因此有 S 2 = E S 2 + ο p ( 1 ) 。
由于 E S 2 = m 2 g ∑ i = 1 2 g E ( Y i ) 2 = m E ( Y i ) 2 = 1 m E ( ∑ i = 1 m I { X i £ x } − F ( x ) ) 2 = 1 m { m V a r ( I { X i ≤ x } − F ( x ) ) + 2 m ∑ i = 1 m − 1 C o v [ ( I { X 1 ≤ x } − F ( x ) ) , ( I { X 1 + i ≤ x } − F ( x ) ) ] − 2 ∑ i = 1 m − 1 i C o v [ ( I { X 1 ≤ x } − F ( x ) ) , ( I { X 1 + i ≤ x } − F ( x ) ) ] } = V a r ( I { X i ≤ x } − F ( x ) ) + 2 ∑ i = 1 m − 1 C o v [ ( I { X 1 ≤ x } − F ( x ) ) , ( I { X 1 + i ≤ x } − F ( x ) ) ] − 2 m ∑ i = 1 m − 1 i C o v [ ( I { X 1 ≤ x } − F ( x ) ) , ( I { X 1 + i ≤ x } − F ( x ) ) ]
利用引理3和文献 [
综上可得 S 2 = E S 2 + ο p ( 1 ) = A 2 + ο ( 1 ) + ο p ( 1 ) = A 2 + ο p ( 1 ) 。
定理1的证明:
由于
P { ( I { X i ≤ x } − F ( x ) ) < 0 } ≥ ε > 0 , P { ( I { X i ≤ x } − F ( x ) ) > 0 } ≥ ε > 0 , (3.1)
这表明0是集合 { I { X 1 ≤ x } − F ( x ) , 1 ≤ i ≤ n } 所构成的凸包的内点,
因此 R ( F ( x ) ) = sup { R ( F ) | ∫ I { X i ≤ x } − F ( x ) d F = 0 , F ≪ F n } 存在为正。 (3.2)
观察到 R ( F ( x ) ) = sup ∏ i = 1 n n w i , (3.3)
对上式右端对 w i 求上确界时,满足 w i ≥ 0 , ∑ i = 1 n w i = 1 , 且 ∑ i = 1 n w i [ I { X i ≤ x } − F ( x ) ] = 0 。
利用拉格朗日乘子法,可得 w i = 1 n ( 1 + s ( I { X i ≤ x } − F ( x ) ) ) , 1 ≤ i ≤ n 。 (3.4)
此处 s ∈ R 1 ,且满足
h ( s ) = 1 n ∑ i = 1 n I { X i ≤ x } − F ( x ) 1 + s ( I { X i ≤ x } − F ( x ) ) = 0
0 = | h ( s ) | = 1 n | ∑ i = 1 n ( I { X i i ≤ x } − F ( x ) ) − ∑ i = 1 n s ( I { X i ≤ x } − F ( x ) ) 2 1 + ( I { X i ≤ x } − F ( x ) ) | ≥ | s | 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 2 1 + | s | Z n − | 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) | (3.5)
再利用引理3知: | s | 1 + | s | Z n = Ο p ( 1 n ) ,利用引理2得 s = Ο p ( 1 n ) 。(3.6)
令 γ i = s ( I { X i ≤ x } − F ( x ) ) , s 满足 h ( s ) = 0 ,
利用(3.6)式及引理1知: max 1 ≤ i ≤ n | γ i | = Ο p ( 1 n ) ο p ( n ) = ο p ( 1 ) 。 (3.7)
则有 0 = h ( s ) = 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 1 + s ( I { X i ≤ x } − F ( x ) ) = 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 1 + γ i = 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) ( 1 − γ i + γ i 2 1 + γ i ) = 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) − s 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 2 + 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) γ i 2 1 + γ i 。
令 s = 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 2 + β , 利用(3.6),(3.7)式和引理4可得
β = 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 3 s 2 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 2 ( 1 + γ i ) = ο p ( n ) Ο p ( 1 n ) = ο p ( 1 n ) 。
借助Taylor展开,我们有 log ( 1 + γ i ) = γ i − γ i 2 2 + η i ,对某正数 G 有
P { | η i | ≤ G | γ i | 3 , 1 ≤ i ≤ n } → 1 , n → ∞ 。
则有
l ( F ( x ) ) = − 2 log R ( F ( x ) ) = 2 ∑ i = 1 n log ( 1 + γ i ) = 2 ∑ i = 1 n γ i − ∑ i = 1 n γ i 2 + 2 ∑ i = 1 n η i = 2 ∑ i = 1 n ( 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 2 + β ) ( ( I { X i ≤ x } − F ( x ) ) ) − ∑ i = 1 n ( 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 2 + β ) 2 ( I { X i ≤ x } − F ( x ) ) 2 + 2 ∑ i = 1 n η i = 2 n ( ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 2 ) 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 2 + 2 β ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) − 1 n ( ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) ) 2 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 2 − 2 β ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) − β 2 ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 2 + 2 ∑ i = 1 n η i
= n ( 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) ) 2 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 2 − n β 2 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 2 + 2 ∑ i = 1 n η i ≙ I 1 + I 2 + I 3 。 (3.8)
再利用引理3知: I 1 → d A 2 σ 2 χ ( 1 ) 2 , n → ∞ 。 (3.9)
由条件得: I 2 = ο p ( 1 ) 。 (3.10)
又由(3.6)和引理2得 | 2 ∑ i = 1 n η i | ≤ 2 B | s | 3 ∑ i = 1 n | ( I { X i ≤ x } − F ( x ) ) | 3 = ο p (1)
其中 B 为某个正数,故有 I 3 = ο p ( 1 ) 。 (3.11)
综合(3.9)~(3.11)式便得 l ( θ 0 ) → d A 2 σ 2 χ ( 1 ) 2 , n → ∞ 。 (3.12)
定理2的证明:
只需证明 l ′ ( F ( x ) ) = − 2 log R ′ ( F ( x ) ) → d χ ( 1 ) 2 n → ∞ 。 (3.13)
观察到 R ′ ( F ( x ) ) = sup ∏ i = 1 2 g 2 g P i ′ ,对上式右端对 P i ′ 求上确界时,
满足 P ′ i ≥ 0 , ∑ i = 1 2 g P i ′ = 1 , ∑ i = 1 2 g P i ′ m Y i = 0 。
借助拉格朗日乘子法得 P i = 1 2 g ( 1 + λ m Y i ) , 1 ≤ i ≤ 2 g , (3.14)
此处
利用引理1证明得
有
展开
此处
利用引理4得
利用(3.18)及(3.19)式得
又由引理1,引理2,(3.17)及(3.20)式知
利用(3.17)和(3.18)式得:
又展开
记
利用引理4和(3.18)式得
又利用(3.21),(3.22)和(3.24)式得
利用(3.23)式并利用Taylor展开式,则有
此处
利用引理3及引理4,得
利用(3.24)式得
利用(3.18)和(3.24)式得
从而可得
综上(3.25)~(3.28)式得
本论文得到广东省自然科学基金项目资助(2016A030313812; 2018A030307070)。
黄 娟. 正相协相依样本下分布函数的经验似然统计推断Empirical Likelihood Statistic Inference for Distribution Function for PA Dependent Samples[J]. 理论数学, 2019, 09(01): 89-97. https://doi.org/10.12677/PM.2019.91012