PM Pure Mathematics 2160-7583 Scientific Research Publishing 10.12677/PM.2019.91012 PM-28661 PM20190100000_76190516.pdf 数学与物理 正相协相依样本下分布函数的经验似然统计推断 Empirical Likelihood Statistic Inference for Distribution Function for PA Dependent Samples 1 2 null 广东海洋大学,数学与计算机学院,广东 湛江 29 12 2018 09 01 89 97 © Copyright 2014 by authors and Scientific Research Publishing Inc. 2014 This work is licensed under the Creative Commons Attribution International License (CC BY). http://creativecommons.org/licenses/by/4.0/

本文将在正相协相依样本下,利用分组经验似然比方法,构造分布函数的置信区间。 This paper studies distribution function by group empirical likelihood method under strongly sta-tionary PA random sample. And we develop empirical likelihood ratio method to construct ap-proximate confidence regions for distribution function.

正相协,分组经验似然,置信区间, Positive Associate Group Empirical Likelihood Confidence Intervals
正相协相依样本下分布函数的经验似然统计 推断<sup> </sup>

黄娟

广东海洋大学,数学与计算机学院,广东 湛江

收稿日期:2019年1月2日;录用日期:2019年1月21日;发布日期:2019年1月28日

摘 要

本文将在正相协相依样本下,利用分组经验似然比方法,构造分布函数的置信区间。

关键词 :正相协,分组经验似然,置信区间

Copyright © 2019 by author and beplay安卓登录

This work is licensed under the Creative Commons Attribution International License (CC BY).

http://creativecommons.org/licenses/by/4.0/

1. 引言

Joag-Dey和Proschan (1983, [ 1 ] )提出了PA (positive associate)随机变量在可靠性理论和多元统计分析中有广泛的应用。经验似然是由Owen (1988)提出的一种非参数推断方法 [ 2 ] [ 3 ] ,其有类似Bootstrap的抽样特性。这一方法与传统的统计方法比较有很多优点。比如:用经验似然方法构造置信区间拥有域保持性,变换不变性,置信域的形状由数据自行决定,以及Bartlett纠偏性和无需构造轴统计量等等。因而在相依情形下,经验似然方法研究成果少见 [ 4 ] - [ 10 ] ,尤其在PA相依样本见之甚少。目前,关于分布函数的研究多数局限于非参数核方法。本文将尝试在PA相依样本下,攻克普通经验似然方法的缺陷,重新利用分组经验似然方法,构造未知的分布函数置信区间。首先给出PA序列概念。

定义1: [ 1 ] 称随机变量 X 1 , X 2 , ⋯ , X n ( n ≥ 2 )是PA的,如果对于集合 { 1 , 2 , ⋯ , n } 的任何两个不相交的非空子集 A 1 和 A 2 ,都有

C o v ( f 1 ( X i , i ∈ A 1 ) , f 2 ( X j , j ∈ A 2 ) ) ≥ 0

此处, f 1 与 f 2 是任何两个使得协方差存在的对每个变量均非降(或非升)的函数。称随机变量序列 { X i , i ∈ N } 是PA序列,如果对任何 n ≥ 2 ,随机变量 X 1 , X 2 , ⋯ , X n ( n ≥ 2 )都是PA (正相协)的。

若 X 1 , X 2 , ⋯ , X n 为来自总体 X 的正相协样本,由于 E I { X i ≤ x } = F ( x ) ,

经验似然 R ( F ( x ) ) = sup { ∏ i = 1 n n w i , w i ≥ 0 , ∑ i = 1 n w i = 1 , ∑ i = 1 n w i I { X i ≤ x } = F ( x ) }

对数经验似然为 l ( F ( x ) ) = − 2 log R ( F ( x ) ) = 2 ∑ i = 1 n log ( 1 + s [ I { X i ≤ x } − F ( x ) ] ) 。

此处 s ∈ R 1 ,且满足 K ( s ) = 1 n ∑ i = 1 n I { X i ≤ x } − F ( x ) 1 + s [ I { X i ≤ x } − F ( x ) ] = 0 。

2. 主要的结论及其证明

条件:

1) X 1 , X 2 , ⋯ , X n 是来自总体的强平稳PA样本;

2) 令 u n = sup k ∑ j : | j − k | ≥ n C o v [ ( I { X j ≤ x } − F ( x ) ) , ( I { X k ≤ x } − F ( x ) ) ] < ∞ ,若对某个 r > 2 ,满足 u n = O ( n − ( r − 2 ) 2 ) ,

3) ∑ i = 1 ∞ C o v [ ( I { X 1 ≤ x } − F ( x ) ) , ( I { X 1 + i ≤ x } − F ( x ) ) ] < ∞ ;

定理1:如果上述条件成立,我们有

l ( F ( x ) ) → d A 2 σ 2 χ ( 1 ) 2 , n → ∞ 。

此处 A 2 = V a r [ I { X ≤ x } − F ( x ) ] + 2 ∑ i = 1 ∞ C o v [ ( ( I { X 1 ≤ x } − F ( x ) ) , ( I { X 1 + i ≤ x } − F ( x ) ) ) ] , σ 2 = V a r ( I { X i ≤ x } − F ( x ) ) 。

然而 A 2 和 σ 2 未知,定理1的结果不能应用,为了攻克这一缺陷,下面利用分组经验似然方法,重新构造经验似然比函数。

记 m = [ n α ] , g = [ n 2 m ] ,其中 [ ⋅ ] 表示取整, 0 < α < 1 2 为简单起见,使 n = 2 m g 。

令 ξ i = ∑ j = 1 m [ I { X 2 ( i − 1 ) m + j ≤ x } − F ( x ) ] η i = ∑ j = 1 m [ I { X ( 2 i − 1 ) m + j ≤ x } − F ( x ) ] Y 2 i − 1 = ξ i m , Y 2 i = η i m (对任意的 i = 1 , 2 , ⋯ , g )

由于 { X i | i ≥ 1 } 的强平稳性, Y i ( i = 1 , ⋯ , 2 g ) 有共同分布函数 G ,对应经验分布函数 G 2 g 。分组经验似然比为 R ′ ( F ( x ) ) = sup { ∏ i = 1 2 g 2 g P ′ i | ∑ i = 1 2 g P ′ i = 1 , P ′ i ≥ 0 , ∑ i = 1 2 g P ′ i m Y i = 0 } 。

对数经验似然比为 l ′ ( F ( x ) ) = − 2 log R ′ ( F ( x ) ) = 2 ∑ i = 1 2 g log ( 1 + λ m Y i ) 。

此处 λ ∈ R 1 且满足 K ′ ( λ ) = 1 2 g ∑ i = 1 2 g m Y i 1 + λ m Y i = 0 。

定理2:在定理1的条件下,我们有 l ′ ( F ( x ) ) → d χ ( 1 ) 2 , n → ∞ 。

利用定理2,当样本 n 比较大时,可构造未知的分布函数 F ( x ) 的置信水平为 1 − α 的渐近置信区域: P ( F ( x ) | l ′ ( F ( x ) ) ≤ C α ) ≈ 1 − α ,其中 C α 为 χ ( 1 ) 2 分布的上 α 分位点,例如 α 取0.05或0.01。

引理1:记 Z n = max 1 ≤ i ≤ n | [ E I { X i ≤ x } − F ( x ) ] | ,有 Z n = ο p ( n 1 2 ) 。

证明:由于 [ E I { X i ≤ x } − F ( x ) ] 有界,易得

Z n = max 1 ≤ i ≤ n | [ E I { X i ≤ x } − F ( x ) ] | = ο p ( n 1 2 ) 。

引理2: [ 7 ] 若 X 1 , X 2 , ⋯ , X n 为PA变量,有 | X j | ≤ C ,且 E X j = 0 , j = 1 , ⋯ , N 。令 S n = ∑ j = 1 n X j , u n = sup k ∑ j : | j − k | ≥ n C o v ( X j , X k ) ,假设对某个 r > 2 , u n = O ( n − ( r − 2 ) 2 ) ,则

sup m ∈ N ∪ { 0 } E | S m + n − S n | r ≤ C n r 2 。

引理3: [ 11 ] 设 { X i | i ≥ 1 } 是强平稳PA序列,并且 ∑ i = 1 ∞ C o v ( X 1 , X 1 + i ) < ∞ ,假定 E X 1 = 0 , E | X 1 | 2 < ∞ ,则 A 0 2 = E X 1 2 + 2 ∑ i = 1 ∞ E ( X 1 X 1 + i ) 收敛,且有

sup − ∞ < x < ∞ | P ( 1 n ∑ i = 1 n X i A 0 < x ) − Φ ( x ) | → 0 ,其中 Φ ( x ) 为标准正态分布。

引理4:设 { X i | i ≥ 1 } 是强平稳PA序列,则有 1 2 g ∑ i = 1 2 g m ( Y i ) 2 = A 2 + ο p ( 1 ) 。

其中 A 2 = V a r [ I { X ≤ x } − F ( x ) ] + 2 ∑ i = 1 ∞ C o v [ ( I { X 1 ≤ x } − F ( x ) ) , ( I { X 1 + i ≤ x } − F ( x ) ) ] 。

证明:令 S 2 = 1 2 g ∑ i = 1 2 g m ( Y i ) 2 ,利用引理2和条件2有

E ( S 2 ′ − E S 2 ′ ) 2 = ( m 2 g ) 2 E [ ∑ i = 1 2 g ( ( Y i ′ ) 2 − E ( Y i ′ ) 2 ) ] 2 ≤ C ( m 2 2 g ) E ( Y i ) 4 ≤ C m 2 2 g E | I { X i ≤ x } − F ( x ) | 4 m 2 ≤ C 2 g E | I { X i ≤ x } − F ( x ) | 4 → 0

此处 C 为某个正常数,不同的地方 C 取值可不同。

因此有 S 2 = E S 2 + ο p ( 1 ) 。

由于 E S 2 = m 2 g ∑ i = 1 2 g E ( Y i ) 2 = m E ( Y i ) 2 = 1 m E ( ∑ i = 1 m I { X i £ x } − F ( x ) ) 2 = 1 m { m V a r ( I { X i ≤ x } − F ( x ) ) + 2 m ∑ i = 1 m − 1 C o v [ ( I { X 1 ≤ x } − F ( x ) ) , ( I { X 1 + i ≤ x } − F ( x ) ) ] − 2 ∑ i = 1 m − 1 i C o v [ ( I { X 1 ≤ x } − F ( x ) ) , ( I { X 1 + i ≤ x } − F ( x ) ) ] } = V a r ( I { X i ≤ x } − F ( x ) ) + 2 ∑ i = 1 m − 1 C o v [ ( I { X 1 ≤ x } − F ( x ) ) , ( I { X 1 + i ≤ x } − F ( x ) ) ] − 2 m ∑ i = 1 m − 1 i C o v [ ( I { X 1 ≤ x } − F ( x ) ) , ( I { X 1 + i ≤ x } − F ( x ) ) ]

利用引理3和文献 [ 12 ] 知 E S 2 = A 2 + ο ( 1 ) 。

综上可得 S 2 = E S 2 + ο p ( 1 ) = A 2 + ο ( 1 ) + ο p ( 1 ) = A 2 + ο p ( 1 ) 。

定理1的证明:

由于

P { ( I { X i ≤ x } − F ( x ) ) < 0 } ≥ ε > 0 , P { ( I { X i ≤ x } − F ( x ) ) > 0 } ≥ ε > 0 , (3.1)

这表明0是集合 { I { X 1 ≤ x } − F ( x ) , 1 ≤ i ≤ n } 所构成的凸包的内点,

因此 R ( F ( x ) ) = sup { R ( F ) | ∫ I { X i ≤ x } − F ( x ) d F = 0 , F ≪ F n } 存在为正。 (3.2)

观察到 R ( F ( x ) ) = sup ∏ i = 1 n n w i , (3.3)

对上式右端对 w i 求上确界时,满足 w i ≥ 0 , ∑ i = 1 n w i = 1 , 且 ∑ i = 1 n w i [ I { X i ≤ x } − F ( x ) ] = 0 。

利用拉格朗日乘子法,可得 w i = 1 n ( 1 + s ( I { X i ≤ x } − F ( x ) ) ) , 1 ≤ i ≤ n 。 (3.4)

此处 s ∈ R 1 ,且满足

h ( s ) = 1 n ∑ i = 1 n I { X i ≤ x } − F ( x ) 1 + s ( I { X i ≤ x } − F ( x ) ) = 0

0 = | h ( s ) | = 1 n | ∑ i = 1 n ( I { X i i ≤ x } − F ( x ) ) − ∑ i = 1 n s ( I { X i ≤ x } − F ( x ) ) 2 1 + ( I { X i ≤ x } − F ( x ) ) | ≥ | s | 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 2 1 + | s | Z n − | 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) | (3.5)

再利用引理3知: | s | 1 + | s | Z n = Ο p ( 1 n ) ,利用引理2得 s = Ο p ( 1 n ) 。(3.6)

令 γ i = s ( I { X i ≤ x } − F ( x ) ) , s 满足 h ( s ) = 0 ,

利用(3.6)式及引理1知: max 1 ≤ i ≤ n | γ i | = Ο p ( 1 n ) ο p ( n ) = ο p ( 1 ) 。 (3.7)

则有 0 = h ( s ) = 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 1 + s ( I { X i ≤ x } − F ( x ) ) = 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 1 + γ i = 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) ( 1 − γ i + γ i 2 1 + γ i ) = 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) − s 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 2 + 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) γ i 2 1 + γ i 。

令 s = 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 2 + β , 利用(3.6),(3.7)式和引理4可得

β = 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 3 s 2 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 2 ( 1 + γ i ) = ο p ( n ) Ο p ( 1 n ) = ο p ( 1 n ) 。

借助Taylor展开,我们有 log ( 1 + γ i ) = γ i − γ i 2 2 + η i ,对某正数 G 有

P { | η i | ≤ G | γ i | 3 , 1 ≤ i ≤ n } → 1 , n → ∞ 。

则有

l ( F ( x ) ) = − 2 log R ( F ( x ) ) = 2 ∑ i = 1 n log ( 1 + γ i ) = 2 ∑ i = 1 n γ i − ∑ i = 1 n γ i 2 + 2 ∑ i = 1 n η i = 2 ∑ i = 1 n ( 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 2 + β ) ( ( I { X i ≤ x } − F ( x ) ) ) − ∑ i = 1 n ( 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 2 + β ) 2 ( I { X i ≤ x } − F ( x ) ) 2 + 2 ∑ i = 1 n η i = 2 n ( ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 2 ) 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 2 + 2 β ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) − 1 n ( ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) ) 2 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 2 − 2 β ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) − β 2 ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 2 + 2 ∑ i = 1 n η i

= n ( 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) ) 2 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 2 − n β 2 1 n ∑ i = 1 n ( I { X i ≤ x } − F ( x ) ) 2 + 2 ∑ i = 1 n η i ≙ I 1 + I 2 + I 3 。 (3.8)

再利用引理3知: I 1 → d A 2 σ 2 χ ( 1 ) 2 , n → ∞ 。 (3.9)

由条件得: I 2 = ο p ( 1 ) 。 (3.10)

又由(3.6)和引理2得 | 2 ∑ i = 1 n η i | ≤ 2 B | s | 3 ∑ i = 1 n | ( I { X i ≤ x } − F ( x ) ) | 3 = ο p (1)

其中 B 为某个正数,故有 I 3 = ο p ( 1 ) 。 (3.11)

综合(3.9)~(3.11)式便得 l ( θ 0 ) → d A 2 σ 2 χ ( 1 ) 2 , n → ∞ 。 (3.12)

定理2的证明:

只需证明 l ′ ( F ( x ) ) = − 2 log R ′ ( F ( x ) ) → d χ ( 1 ) 2 n → ∞ 。 (3.13)

观察到 R ′ ( F ( x ) ) = sup ∏ i = 1 2 g 2 g P i ′ ,对上式右端对 P i ′ 求上确界时,

满足 P ′ i ≥ 0 , ∑ i = 1 2 g P i ′ = 1 , ∑ i = 1 2 g P i ′ m Y i = 0 。

借助拉格朗日乘子法得 P i = 1 2 g ( 1 + λ m Y i ) , 1 ≤ i ≤ 2 g , (3.14)

此处 ,且满足

利用引理1证明得 。 (3.15)

。 (3.16)

。 (3.17)

展开 (3.18)

此处

利用引理4得 。 (3.19)

利用(3.18)及(3.19)式得 。 (3.20)

又由引理1,引理2,(3.17)及(3.20)式知 。记

利用(3.17)和(3.18)式得: 。 (3.21)

又展开 可得

,有 。 (3.22)

利用引理4和(3.18)式得

。 (3.23)

又利用(3.21),(3.22)和(3.24)式得

。 (3.24)

利用(3.23)式并利用Taylor展开式,则有

此处

利用引理3及引理4,得 。 (3.26)

利用(3.24)式得 。 (3.27)

利用(3.18)和(3.24)式得

从而可得 。 (3.28)

综上(3.25)~(3.28)式得 。 (3.29)

基金项目

本论文得到广东省自然科学基金项目资助(2016A030313812; 2018A030307070)。

文章引用

黄 娟. 正相协相依样本下分布函数的经验似然统计推断Empirical Likelihood Statistic Inference for Distribution Function for PA Dependent Samples[J]. 理论数学, 2019, 09(01): 89-97. https://doi.org/10.12677/PM.2019.91012

参考文献 References Joag-Dev, K. and Proschan, F. (1983) Negative Association of Random Variable with Application. The Annals of Statistics, 11, 286-295. Owen, A.B. (1988) Empirical Likelihood Ratio Confidence Intervals for a Single Function. Biometrika, 75, 237-249. https://doi.org/10.1093/biomet/75.2.237 Owen, A.B. (1990) Empirical Likelihood Confidence Regions. The Annals of Statistics, 18, 90 -120. https://doi.org/10.1214/aos/1176347494 张军舰, 王成名, 等. 相依样本情形下经验似然比置信区间[J]. 高校应用数学学报, 1999, 14(1): 63-72. Kitamura, Y. (1997) Empirical Likelihood Methods with Weakly Dependent Process. The Annals of Statistics, 25, 2084-2102. https://doi.org/10.1214/aos/1069362388 Lin, L. and Runchu, Z. (2001) Block Empirical Edulidean Likelihood for Weakly Dependent Process. Statistics & Probability Letters, 53, 143-152. https://doi.org/10.1016/S0167-7152(01)00066-9 Birkel, T. (1988) Moment Bounds for Dependent Associated Sequences. The Annals of Probability, 16, 1184-1193. https://doi.org/10.1214/aop/1176991684 Zhang, J.J. (2006) Empirical Likelihood for NA Series. Statistics & Probability Letters, 76, 153-160. https://doi.org/10.1016/j.spl.2005.07.019 Chen, S.X. and Wong, C.M. (2009) Smoothed Block Empirical Likelihood for Quantiles of Weakly Dependent Processes. Statistica Sinica, No. 19, 71-81. Zhang, J.J. (2007) Empirical Likelihood Ratio Confidence Interval for Positively Associated Series. Acta Mathematica Applicate Sinica-English Series, No. 23, 245-254. Newman, C.M. (1984) Asymptotic Independence and Limit Theorems for Positive and Negative Dependent Random Variable. Inequalities in statistics and Probability, Hayward, 127-140. 杨善朝. 随机变量部分和的矩不等式[J]. 中国科学, A辑, 2000, 30(3): 218-223.
Baidu
map