本文研究了单参数指数分布下参数 的区间估计方法,给出了单参指数分布中参数 的两种广义枢轴量、参数的广义置信区间的解析解及频率性质理论证明,同时给出了假设检验问题的广义p值,另外给出三种已有方法,即Bayes方法、大样本近似估计方法和Bootstrap重抽样方法,通过Monte Carlo方法对四种方法进行模拟,模拟结果表明:广义推断和Bayes方法的覆盖概率在样本量较小的情况下保持在给定置信水平附近,且平均置信长度较小,另外本文又比较了四种方法对于假设检验问题犯第一类错误概率与检验的势,模拟结果验证了广义推断方法的良好性能。 In this paper, we study the interval estimation method of parameter under single pa-rameter exponential distribution. Two kinds of generalized pivots of parameter in single parameter exponential distribution, analytical solutions of generalized confidence interval of parameter and theoretical proof of frequency property are given. At the same time, the generalized p value of hypothesis testing problem is given. In addition, three existing methods, namely Bayes method, approximate estimation method of large sample and Bootstrap resampling method are given. Four methods are simulated by Monte Carlo method. The simulation results show that the coverage probability of generalized inference and Bayes method remains near the confidence level when sample size is small, and the average confidence length is smaller. In addition, this paper compares the error 1 probability and the power for hypothesis testing. The simulation results verify the good performance of the generalized inference method.
魏秋月1,王春玲1,赵昕2
1北京建筑大学理学院,北京
2北京工商大学嘉华学院,北京
收稿日期:2019年9月1日;录用日期:2019年9月16日;发布日期:2019年9月23日
本文研究了单参数指数分布下参数 P ( X > Y ) 的区间估计方法,给出了单参指数分布中参数 P ( X > Y ) 的两种广义枢轴量、参数的广义置信区间的解析解及频率性质理论证明,同时给出了假设检验问题的广义p值,另外给出三种已有方法,即Bayes方法、大样本近似估计方法和Bootstrap重抽样方法,通过Monte Carlo方法对四种方法进行模拟,模拟结果表明:广义推断和Bayes方法的覆盖概率在样本量较小的情况下保持在给定置信水平附近,且平均置信长度较小,另外本文又比较了四种方法对于假设检验问题犯第一类错误概率与检验的势,模拟结果验证了广义推断方法的良好性能。
关键词 :指数分布,广义推断,Bootstrap,Bayes,大样本近似估计
Copyright © 2019 by author(s) and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY).
http://creativecommons.org/licenses/by/4.0/
关于随机变量Y小于随机变量X的概率的估计和推导问题,起源于应力强度模型,它是由Bimbaxmi于1956年提出来的,主要是讨论应力和强度相互作用的效果。应力定义为引起元件、装置和材料失效的载荷,强度定义为当承受外部载荷和环境时,元件装置或材料能满意地完成规定的任务而没有失效的能力。一般地,机械产品的强度和工作应力均为随机变量,可靠性定义为影响失效的应力没有超过控制失效的强度的概率,在使用中,当Y表示应力,X代表强度时,则装置的可靠性的数学形式可以描述为 P ( Y < X ) 。后来 P ( Y < X ) 也在其他领域有了不同的意义,例如在生物特征学中,若Y代表患者接受药物A治疗后的剩余寿命,X代表患者接受药物B治疗后的剩余寿命,如果让患者来选择药物,则患者主要通过 P ( Y < X ) 的值来选择使用何种药物。
指数分布作为一类典型的分布在工业生产、医学、机械工程、桥梁工程等领域常用来描述变量的分布,本文基于单参数和双参数指数分布来研究 P ( Y < X ) 。Owen,Craswell和Hanson (1964) [
当随机变量X与Y分别服从单参数指数分布且相互独立时,有:
T = P ( X > Y ) = ∫ 0 + ∞ λ 1 e − λ 1 y d x ∫ 0 x λ 2 e − λ 2 y d y = λ 2 λ 1 + λ 2 .
Tsui K. W.,Weerahandi [
设 X 1 , ⋯ , X m 与 Y 1 , ⋯ , Y n 分别为从指数分布总体 exp ( λ 1 ) 和 exp ( λ 2 ) 中抽取的样本,由于 ∑ i = 1 m X i 与 ∑ j = 1 n Y j 是独立的充分统计量,且有:
U = 2 λ 1 ∑ i = 1 m X i ~ χ 2 ( 2 m ) , V = 2 λ 2 ∑ j = 1 n Y j ~ χ 2 ( 2 n ) ,
因此可构造广义枢轴量:
R λ 1 = U 2 ∑ i = 1 m x i , R λ 2 = V 2 ∑ j = 1 n y j , (1)
其中: ∑ i = 1 m x i , ∑ j = 1 n y i 分别是 ∑ i = 1 m X i 和 ∑ j = 1 n Y j 的样本观测值,因此可以得到参数T的广义枢轴量:
R T = R λ 2 R λ 1 + R λ 2 , (2)
容易证明 R T 确实是T的广义枢轴量。
考虑假设检验问题:
H 0 : T ≤ T 0 , H 1 : T > T 0 (3)
其中 T 0 为已知常数,则对于假设检验问题(3)可给出广义p值为:
p = P r ( R T ( X , Y , x , y , λ 1 , λ 2 ) ≤ r ( x , y , x , y , λ 1 , λ 2 ) | T = T 0 ) = P r ( V / ( 2 ∑ j = 1 n y j ) U / ( 2 ∑ i = 1 m x i ) + V / ( 2 ∑ j = 1 n y i ) ≤ T 0 ) = P r ( V ≤ T 0 ⋅ U ⋅ ∑ j = 1 n y i ( 1 − T 0 ) ⋅ ∑ i = 1 m x i ) = E U ( F V ( T 0 ⋅ U ⋅ ∑ j = 1 n y i ( 1 − T 0 ) ∑ i = 1 m x i ) ) ,
其中 r ( x , y , x , y , λ 1 , λ 2 ) 是给定样本下参数的广义枢轴量的观测值, F V ( ⋅ ) 自由度为2n的卡方分布的分布函数。根据假设检验与区间估计的一一对应关系,我们可以得到T的置信系数为 γ 单侧置信下限:
P ( R T ( X , Y , x , y , λ 2 , λ 2 ) ≥ c ) = P r ( U ≤ V ∑ i = 1 m x i ( 1 / c − 1 ) ∑ j = 1 n y i ) = E V ( F U ( V ∑ i = 1 m x i ( 1 / c − 1 ) ∑ j = 1 n y i ) ) = γ ,
其中 F U ( ⋅ ) 是自由度为2m的卡方分布的分布函数。因此,T的置信系数为 γ 的置信区间为 ( − ∞ , c γ ) ,其中 c γ 满足:
E V ( F U ( V ∑ i = 1 m x i ( 1 / c γ − 1 ) ∑ j = 1 n y i ) ) = γ .
另外,由于 ∑ i = 1 m X i 与 ∑ j = 1 n Y j 是独立的充分统计量,且有:
λ 1 m ∑ i = 1 m X i λ 2 n ∑ j = 1 n Y i ~ F ( 2 m ,2 n ) ,
即:
λ 1 X ¯ λ 2 Y ¯ ~ F ( 2 m ,2 n ) ,
其中 X ¯ = ∑ i = 1 m X i m 、 Y ¯ = ∑ j = 1 n Y j n ,则可以得到 λ 1 λ 2 的广义枢轴量为:
R λ 1 λ 2 = W y ¯ x ¯ ,
其中W是服从自由度为2m和2n的F分布, x ¯ 与 y ¯ 分别是 X ¯ , Y ¯ 的观测值,由此有:
R T = 1 1 + R λ 1 / λ 2 .
下面给出关于假设检验问题(3)的广义p值检验犯第一类错误的概率以及参数的双侧置信区间覆盖概率的算法。我们通过Monte Carlo方法来实现。
i) 分别从两个指数分布总体中抽取样本量分别为m和n的样本,得到观测值 { ( x 1 , ⋯ , x m ) , ( y 1 , ⋯ , y n ) } :
ii) 计算 ∑ i = 1 m x i ; ∑ j = 1 n y j :
iii) 产生 U ~ χ 2 ( 2 m ) 与 V ~ χ 2 ( 2 n ) 的实现值;
iv) 按(1)和(2)给出的公式计算 R T ;
v) 重复步骤(iii)-(iv) M次,得到M个 R T 的值,将这一系列 R T 从小到大排列,取其 α / 2 分位点与 1 − α / 2 分位点,分别记为 g ^ L , g ^ U ,得到参数T的一个双侧广义置信区间。计算M个 R T 中小于等于真值T的比率,作为假设检验问题(3)的广义p值;
vi) 重复步骤i)~v) L次,计算这L次得到的T的广义置信区间中包含真实值的个数,作为置信区间的覆盖概率,计算广义p值小于0.05的概率,作为检验犯第一类错误的概率。
频率性质下面给出可靠性参数广义置信区间的频率性质。根据文献 [
引理1:设 X ~ P θ , θ ∈ Θ , θ ^ x ( E ) , E ~ Q 是 θ 的Fiducial模型, g ( θ ) 是 θ 的正规参数函数,在Q下 g ( θ ^ x ( E ) ) 的分布是 g ( θ ) 的Fiducial分布。记 F ( G ) x ( g ) 为 g ( θ ) 的Fiducial分布函数,若
g ^ α ( x ) = i n f { g : F ( G ) x ( g ) ≥ α }
是Fiducial分布的 α 分位数, α ∈ ( 0,1 ) ,则有:
P θ ( g ( θ ) < g ^ α ( X ) ) = α
对所有 θ ∈ Θ 成立,即作为 g ( θ ) 的置信下限, g ^ α ( x ) 具有频率意义下的实际置信水平 1 − α 。
定理1:单参数指数分布可靠性参数 T = λ 2 λ 1 + λ 2 的广义置信区间具有频率意义下的实际置信水平 1 − α ,即 P ( g ^ L < λ 2 λ 1 + λ 2 < g ^ U ) = 1 − α 。
证明:
P ( g ^ L < λ 2 λ 1 + λ 2 < g ^ U ) = P ( λ 2 λ 1 + λ 2 < g ^ U ) − P ( λ 2 λ 1 + λ 2 < g ^ L ) = P ( F R T ( λ 2 λ 1 + λ 2 ) < 1 − α 2 ) − P ( F R T ( λ 2 λ 1 + λ 2 ) < α 2 ) ,
其中, F R T 表示 R T 的分布函数。由于:
P ( F R T ( λ 2 λ 1 + λ 2 ) < 1 − α 2 ) = P ( P ( U / 2 ∑ i = 1 m x i U / 2 ∑ i = 1 m x i + V / 2 ∑ j = 1 n y i ≤ λ 2 λ 1 + λ 2 ) < 1 − α 2 )
根据枢轴方程 U = 2 λ 1 ∑ i = 1 m X i , V = 2 λ 2 ∑ j = 1 n Y j ,设 2 ∑ i = 1 m X i = U * λ 1 , 2 ∑ j = 1 n Y j = V * λ 2 ,其中 ( U * , V * ) 分别与 ( U , V ) 独立同分布。根据引理1,上式可表示为:
P ( P ( U * V * ≤ U V ) < 1 − α ) = P U * / V * ( F U / V ( U * V * ) > α / 2 ) = 1 − α / 2 ,
其中, F U / V ( ⋅ ) 是 U V 的分布函数。同理
P ( F T ( λ 2 λ 1 + λ 2 ) < α / 2 ) = α / 2
因此 P ( g ^ L < λ 2 λ 1 + λ 2 < g ^ U ) = 1 − α 。得证。
设 X 1 , ⋯ , X m 与 Y 1 , ⋯ , Y n 分别为从指数分布总体 exp ( λ 1 ) 和 exp ( λ 2 ) 中抽取的样本,由于 λ 1 , λ 2 的极大似然估计分别为:
λ ^ 1 = 1 X ¯ , λ ^ 2 = 1 Y ¯ ,
则根据极大似然估计的不变性得到T的极大似然估计为:
T ^ = X ¯ X ¯ + Y ¯ . (4)
下面考虑在大样本情况下T的极大似然估计的渐近分布,根据D. S. Bai和Y. W. Hong (1992),令 n = n 1 + n 2 ,其中 n 1 和 n 2 分别表示从两个指数分布总体抽取的样本数。令 b = n 1 n ,当 n → ∞ 时,有 n ( T ^ − T ) → L N ( 0, T 2 ( 1 − T ) 2 b ( 1 − b ) ) ,因此, n b ( 1 − b ) T ( 1 − T ) ( T ^ − T ) → L N ( 0,1 ) 。这样,我们可以得到参数T的近似置信区间
[ T ^ − U 1 − α / 2 ⋅ T ^ ( 1 − T ^ ) n b ( 1 − b ) , T ^ + U 1 − α / 2 ⋅ T ^ ( 1 − T ^ ) n b ( 1 − b ) ] ,
其中 U 1 − α / 2 是标准正态分布的 1 − α / 2 分位点。
对于假设检验问题(3),得到检验的p值为:
p = 1 − Φ ( n b ( 1 − b ) T 0 ( 1 − T 0 ) ( T ^ − T 0 ) ) ,
其中, Φ 是标准正态分布的累积分布函数。
Bootstrap方法最早是由斯坦福大学教授Efron于1977年提出的,该方法认为经验分布函数能够较好地拟合总体分布,下面给出基于bootstrap方法的指数分布可靠性参数的区间估计中较常用的一种方法,Bootstrap-t区间估计 [
记 T ^ 是T的极大似然估计, V ^ ( T ^ ) 是 T ^ 的方差估计, T ^ * 是通过Boostrap样本得到的T的极大似然估计, V ^ ( T ^ * ) 是 T ^ 的方差的Bootstrap估计。
i) 分别从两个指数分布总体抽取样本量为 n 1 和 n 2 的样本集合,记为 W 1 、 W 2 ;
ii) 通过样本 W 1 、 W 2 利用公式(4)求出 T ^ ;
iii) 分别从 W 1 与 W 2 中再抽取样本量为 n 1 和 n 2 的Bootstrap样本,记为 Q 1 和 Q 2 ;
iv) 通过样本 Q 1 和 Q 2 求出 Z * = T ^ * − T ^ V ^ ( T ^ * ) 1 / 2 ;
v) 重复步骤(iii)-(iv) M次,得到M个 T ^ ,从小到大排序,取其 α 分位点 z α / 2 与 1 − α 分位点 z 1 − α / 2 ,得到参数T的一个双侧Bootstrap置信区间 ( T ^ − z 1 − α / 2 * V ^ ( T ^ ) 1 / 2 , T ^ − z α / 2 * V ^ ( T ^ ) 1 / 2 ) ;
vi) 重复步骤i)~v) L次,计算这L次得到的T的置信区间中包含真实值的概率,作为置信区间的覆盖概率。
通过抽取的样本 X = ( X 1 , ⋯ , X m ) , Y = ( Y 1 , ⋯ , Y n ) 可以得到似然方程为:
L ( λ 1 , λ 2 | x , y ) = λ 1 m λ 2 n e − λ 1 ∑ i = 1 m x i − λ 2 ∑ j = 1 n y i , λ 1 > 0 , λ 2 > 0 ,
取 λ 1 、 λ 2 的先验分布为非信息先验分布: π ( λ i ) = 1 λ i , λ i > 0 , i = 1 , 2
因此在给定X、Y下, λ 1 和 λ 2 的后验分布函数为:
Π 1 ( λ 1 | x ) = λ 1 m − 1 exp ( − λ 1 ∑ i = 1 m x i ) ∫ 0 + ∞ λ 1 m − 1 exp ( − λ 1 ∑ i = 1 m x i ) d λ 1 = λ 1 m − 1 ( ∑ i = 1 m x i ) m exp ( − λ 1 ∑ i = 1 m x i ) Γ ( m ) , (5)
Π 2 ( λ 2 | y ) = λ 2 n − 1 exp ( − λ 2 ∑ j = 1 n y i ) ∫ 0 + ∞ λ 2 n − 1 exp ( − λ 2 ∑ j = 1 n y i ) d λ 1 = λ 2 n − 1 ( ∑ j = 1 n y i ) n exp ( − λ 2 ∑ j = 1 n y i ) Γ ( n ) , (6)
得到 λ 1 和 λ 2 的后验分布分别是参数为 ( m , ∑ i = 1 m x i ) 和 ( n , ∑ j = 1 n y j ) 的伽玛分布。
我们通过Monte Carlo模拟来确定T的置信区间,下面给出具体算法:
i) 通过公式(5)和(6)产生 λ 1 和 λ 2 ;
ii) 通过得到的 ( λ 1 , λ 2 ) ,计算得到T;
iv) 重复步骤(i)-(ii) M次,得到 T 1 , ⋯ , T M ,并将它们从小到大排序;
v) 取其 α / 2 分位点与 1 − α / 2 分位点,得到参数T的一个置信区间;
vi) 重复步骤i)~v) L次,计算这L次得到的置信区间中包含真实值T的概率作为置信区间的覆盖概率。
我们通过模拟研究来比较四种方法所得到的置信区间和假设检验的表现。在模拟设计中,分别取两样本量为(5,5),(15,10),(20,15),(0,30)。M取5000,L取2000,相关参数的选定在表格中给出。其中,CP表示覆盖概率,IL表示区间长度,GV代表文章所提出的广义枢轴量方法,LS代表基于大样本近似估计方法,TIR表示检验犯第一类错误的概率。从表1~表3的模拟结果可以看出,对于单参数指数分布,广义推断、大样本方法和Bayes方法的覆盖概率在样本量较小的情况下具有好的表现,且广义推断方法和Bayes方法得到的平均置信长度较小,二者的效果更好,Bootstrap方法随着样本量的增加,覆盖概率会逐渐接近名义水平。同时对于单参数指数分布情况下的假设检验问题,给出了不同方法的检验犯第一类错误的概率以及检验的功效,从表4和表5的模拟结果可以看出,广义推断方法和Bayes方法的检验犯第一类错误的概率在名义水平附近,且当样本量较小时,效果也很令人满意。观察表6与表7的结果发现,广义推断方法检验的功效与渐进正态的大样本方法和Bayes方法的功效没有显著差异,小于Bootstrap方法的功效,原因是在这些情况下Bootstrap方法犯第一类错误的概率大于名义水平。另外,当效应的真值原理原假设时,广义p值检验的功效趋于1的速度与其他三种方法的速度是相近的。
( m , n ) = ( 5 , 5 ) | ( m , n ) = ( 15 , 10 ) | ( m , n ) = ( 20 , 15 ) | ( m , n ) = ( 30 , 30 ) | ||||||
---|---|---|---|---|---|---|---|---|---|
( λ 1 , λ 2 ) ) | 方法 | CP | IL | CP | IL | CP | IL | CP | IL |
(1,2) | GV | 0.942 | 0.5018 | 0.951 | 0.3441 | 0.939 | 0.2893 | 0.958 | 0.2218 |
LS | 0.941 | 0.4493 | 0.956 | 0.3215 | 0.954 | 0.2783 | 0.951 | 0.2115 | |
Bayes | 0.948 | 0.5035 | 0.948 | 0.3433 | 0.945 | 0.2899 | 0.950 | 0.2211 | |
Bootstrap-t | 0.925 | 0.6413 | 0.944 | 0.3708 | 0.937 | 0.3084 | 0.947 | 0.2150 | |
(3,2) | GV | 0.952 | 0.5246 | 0.956 | 0.3619 | 0.954 | 0.3082 | 0.952 | 0.2373 |
LS | 0.961 | 0.4573 | 0.949 | 0.3369 | 0.955 | 0.2915 | 0.962 | 0.2292 | |
Bayes | 0.945 | 0.524 | 0.948 | 0.3613 | 0.957 | 0.3086 | 0.955 | 0.2374 | |
Bootstrap-t | 0.898 | 0.7050 | 0.936 | 0.3889 | 0.924 | 0.2930 | 0.963 | 0.2438 |
(5,2) | GV | 0.953 | 0.4750 | 0.953 | 0.3163 | 0.948 | 0.2681 | 0.954 | 0.2055 |
---|---|---|---|---|---|---|---|---|---|
LS | 0.953 | 0.4360 | 0.941 | 0.3101 | 0.954 | 0.2915 | 0.948 | 0.2032 | |
Bayes | 0.949 | 0.4765 | 0.950 | 0.3167 | 0.952 | 0.2682 | 0.943 | 0.2046 | |
Bootstrap-t | 0.918 | 0.6316 | 0.933 | 0.3331 | 0.939 | 0.2544 | 0.942 | 0.2086 | |
(7,2) | GV | 0.946 | 0.4287 | 0.963 | 0.2756 | 0.948 | 0.2320 | 0.943 | 0.1762 |
LS | 0.949 | 0.4190 | 0.955 | 0.3097 | 0.951 | 0.2641 | 0.959 | 0.1786 | |
Bayes | 0.951 | 0.4286 | 0.949 | 0.2769 | 0.952 | 0.2319 | 0.948 | 0.1753 | |
Bootstrap-t | 0.907 | 0.5267 | 0.928 | 0.2664 | 0.939 | 0.2132 | 0.955 | 0.1775 |
表1. 单参数指数分布的参数T的95%双侧置信区间的主要覆盖概率和平均置信长度
( m , n ) = ( 5 , 5 ) | ( m , n ) = ( 15 , 10 ) | ( m , n ) = ( 20 , 15 ) | ( m , n ) = ( 30 , 30 ) | ||||||
---|---|---|---|---|---|---|---|---|---|
( λ 1 , λ 2 ) | 方法 | CP | IL | CP | IL | CP | IL | CP | IL |
(1,4) | GV | 0.959 | 0.4101 | 0.948 | 0.2619 | 0.951 | 0.2200 | 0.952 | 0.1631 |
LS | 0.916 | 0.4129 | 0.944 | 0.2696 | 0.952 | 0.2150 | 0.956 | 0.1684 | |
Bayes | 0.945 | 0.4108 | 0.946 | 0.2647 | 0.953 | 0.2202 | 0.950 | 0.1632 | |
Bootstrap-t | 0.908 | 0.4900 | 0.928 | 0.2638 | 0.946 | 0.2225 | 0.947 | 0.1684 | |
(3,4) | GV | 0.947 | 0.5307 | 0.952 | 0.3710 | 0.957 | 0.3147 | 0.95 | 0.2414 |
LS | 0.968 | 0.4613 | 0.965 | 0.3390 | 0.954 | 0.2942 | 0.948 | 0.2320 | |
Bayes | 0.951 | 0.5315 | 0.956 | 0.3704 | 0.946 | 0.3143 | 0.952 | 0.2418 | |
Bootstrap-t | 0.918 | 0.6899 | 0.937 | 0.3778 | 0.956 | 0.3327 | 0.945 | 0.2336 | |
(5,4) | GV | 0.942 | 0.5334 | 0.941 | 0.3702 | 0.943 | 0.3156 | 0.950 | 0.2432 |
LS | 0.977 | 0.4625 | 0.946 | 0.3405 | 0.952 | 0.2962 | 0.948 | 0.2333 | |
Bayes | 0.952 | 0.5322 | 0.951 | 0.3710 | 0.955 | 0.3162 | 0.952 | 0.2432 | |
Bootstrap-t | 0.913 | 0.6955 | 0.925 | 0.3667 | 0.933 | 0.3316 | 0.937 | 0.2495 | |
(7,4) | GV | 0.944 | 0.5124 | 0.948 | 0.3511 | 0.947 | 0.2992 | 0.945 | 0.2294 |
LS | 0.956 | 0.4520 | 0.955 | 0.3303 | 0.946 | 0.2848 | 0.947 | 0.2226 | |
Bayes | 0.952 | 0.5151 | 0.948 | 0.3510 | 0.953 | 0.2982 | 0.950 | 0.2295 | |
Bootstrap-t | 0.933 | 0.7028 | 0.942 | 0.3738 | 0.945 | 0.3143 | 0.951 | 0.2209 |
表2. 单参数指数分布的参数T的95%双侧置信区间的主要覆盖概率和平均置信长度
( m , n ) = ( 5 , 5 ) | ( m , n ) = ( 15 , 10 ) | ( m , n ) = ( 20 , 15 ) | ( m , n ) = ( 30 , 30 ) | ||||||
---|---|---|---|---|---|---|---|---|---|
( λ 1 , λ 2 ) | 方法 | CP | IL | CP | IL | CP | IL | CP | IL |
(1,8) | GV | 0.952 | 0.2867 | 0.954 | 0.1760 | 0.943 | 0.1410 | 0.947 | 0.1040 |
LS | 0.945 | 0.4356 | 0.942 | 0.2040 | 0.945 | 0.4356 | 0.947 | 0.1132 | |
Bayes | 0.949 | 0.2935 | 0.949 | 0.1764 | 0.955 | 0.1419 | 0.947 | 0.1037 | |
Bootstrap-t | 0.898 | 0.3349 | 0.919 | 0.1553 | 0.932 | 0.1311 | 0.943 | 0.1030 |
(3,8) | GV | 0.945 | 0.4677 | 0.946 | 0.3142 | 0.948 | 0.2630 | 0.946 | 0.1995 |
---|---|---|---|---|---|---|---|---|---|
LS | 0.948 | 0.4347 | 0.952 | 0.3028 | 0.957 | 0.4541 | 0.962 | 0.2266 | |
Bayes | 0.954 | 0.4704 | 0.948 | 0.3138 | 0.951 | 0.2633 | 0.943 | 0.1995 | |
Bootstrap-t | 0.912 | 0.5974 | 0.946 | 0.3340 | 0.945 | 0.2454 | 0.954 | 0.1934 | |
(5,8) | GV | 0.947 | 0.5204 | 0.952 | 0.3607 | 0.955 | 0.3051 | 0.958 | 0.2342 |
LS | 0.959 | 0.4541 | 0.963 | 0.3329 | 0.954 | 0.2885 | 0.962 | 0.2266 | |
Bayes | 0.950 | 0.5204 | 0.947 | 0.3609 | 0.945 | 0.3053 | 0.952 | 0.2343 | |
Bootstrap-t | 0.903 | 0.6790 | 0.937 | 0.3911 | 0.944 | 0.2468 | 0.946 | 0.2387 | |
(7,8) | GV | 0.949 | 0.5362 | 0.949 | 0.3738 | 0.956 | 0.3191 | 0.956 | 0.2453 |
LS | 0.976 | 0.4637 | 0.954 | 0.3418 | 0.954 | 0.2973 | 0.953 | 0.2347 | |
Bayes | 0.949 | 0.5363 | 0.951 | 0.3743 | 0.952 | 0.3186 | 0.951 | 0.2451 | |
Bootstrap-t | 0.908 | 0.7121 | 0.942 | 0.4132 | 0.946 | 0.2958 | 0.954 | 0.5204 |
表3. 单参数指数分布的参数T的95%双侧置信区间的主要覆盖概率和平均置信长度
( m , n ) = ( 5 , 5 ) | ( m , n ) = ( 15 , 10 ) | ( m , n ) = ( 20 , 15 ) | ( m , n ) = ( 30 , 30 ) | ||
---|---|---|---|---|---|
( λ 1 , λ 2 ) | TIR | ||||
(1,2) | GV | 0.041 | 0.043 | 0.047 | 0.049 |
LS | 0.011 | 0.032 | 0.038 | 0.036 | |
Bayes | 0.041 | 0.043 | 0.047 | 0.049 | |
Bootstrap | 0.089 | 0.062 | 0.059 | 0.054 | |
(3,2) | GV | 0.0475 | 0.061 | 0.058 | 0.0525 |
LS | 0.065 | 0.07 | 0.063 | 0.056 | |
Bayes | 0.046 | 0.048 | 0.049 | 0.050 | |
Bootstrap | 0.081 | 0.69 | 0.063 | 0.057 | |
(5,2) | GV | 0.05 | 0.043 | 0.056 | 0.044 |
LS | 0.083 | 0.073 | 0.074 | 0.062 | |
Bayes | 0.048 | 0.049 | 0.052 | 0.051 | |
Bootstrap | 0.085 | 0.079 | 0.069 | 0.059 | |
(7,2) | GV | 0.054 | 0.047 | 0.059 | 0.047 |
LS | 0.099 | 0.086 | 0.081 | 0.071 | |
Bayes | 0.046 | 0.047 | 0.054 | 0.052 | |
Bootstrap | 0.087 | 0.089 | 0.091 | 0.062 |
表4. 检验犯第一类错误的概率
( m , n ) = ( 5 , 5 ) | ( m , n ) = ( 15 , 10 ) | ( m , n ) = ( 20 , 15 ) | ( m , n ) = ( 30 , 30 ) | ||
---|---|---|---|---|---|
( λ 1 , λ 2 ) | TIR | ||||
(1,8) | GV | 0.055 | 0.037 | 0.049 | 0.051 |
LS | 0 | 0.014 | 0.015 | 0.027 | |
Bayes | 0.056 | 0.052 | 0.049 | 0.051 | |
Bootstrap | 0.083 | 0.081 | 0.075 | 0.053 | |
(3,8) | GV | 0.045 | 0.051 | 0.055 | 0.046 |
LS | 0.072 | 0.029 | 0.037 | 0.033 | |
Bayes | 0.044 | 0.046 | 0.052 | 0.051 | |
Bootstrap | 0.083 | 0.079 | 0.071 | 0.059 | |
(5,8) | GV | 0.056 | 0.046 | 0.051 | 0.052 |
LS | 0.020 | 0.046 | 0.041 | 0.045 | |
Bayes | 0.053 | 0.052 | 0.048 | 0.049 | |
Bootstrap | 0.085 | 0.078 | 0.066 | 0.052 | |
(7,8) | GV | 0.057 | 0.047 | 0.051 | 0.054 |
LS | 0.032 | 0.048 | 0.046 | 0.049 | |
Bayes | 0.046 | 0.047 | 0.048 | 0.053 | |
Bootstrap | 0.087 | 0.078 | 0.072 | 0.060 |
表5. 检验犯第一类错误的概率
( m , n ) = ( 5 , 5 ) | ( m , n ) = ( 15 , 10 ) | ( m , n ) = ( 20 , 15 ) | ( m , n ) = ( 30 , 30 ) | ||
---|---|---|---|---|---|
( λ 1 , λ 2 ) | TIR | ||||
(1,2) | GV | 0.129 | 0.199 | 0.264 | 0.415 |
LS | 0.074 | 0.184 | 0.247 | 0.351 | |
Bayes | 0.135 | 0.211 | 0.256 | 0.395 | |
Bootstrap | 0.201 | 0.272 | 0.322 | 0.706 | |
(3,2) | GV | 0.434 | 0.765 | 0.891 | 0.991 |
LS | 0.590 | 0.856 | 0.931 | 0.986 | |
Bayes | 0.441 | 0.747 | 0.883 | 0.984 | |
Bootstrap | 0.765 | 0.909 | 0.950 | 0.991 | |
(5,2) | GV | 0.361 | 0.662 | 0.805 | 0.952 |
LS | 0.535 | 0.796 | 0.0876 | 0.973 | |
Bayes | 0.374 | 0.658 | 0.800 | 0.959 | |
Bootstrap | 0.736 | 0.0865 | 0.919 | 0.978 | |
(7,2) | GV | 0.354 | 0.589 | 0.762 | 0.942 |
LS | 0.52560.761 | 0.854 | 0.961 | ||
Bayes | 0.334 | 0.625 | 0.755 | 0.934 | |
Bootstrap | 0.716 | 0.854 | 0.907 | 0.973 |
表6. 检验的功效
( m , n ) = ( 5 , 5 ) | ( m , n ) = ( 15 , 10 ) | ( m , n ) = ( 20 , 15 ) | ( m , n ) = ( 30 , 30 ) | ||
---|---|---|---|---|---|
( λ 1 , λ 2 ) | TIR | ||||
(1,8) | GV | 0.055 | 0.626 | 0.774 | 0.932 |
LS | 0.059 | 0.460 | 0.667 | 0.900 | |
Bayes | 0.336 | 0.614 | 0.765 | 0.932 | |
Bootstrap | 0.727 | 0.865 | 0.907 | 0.978 | |
(3,8) | GV | 0.326 | 0.607 | 0.754 | 0.929 |
LS | 0.257 | 0.585 | 0.735 | 0.916 | |
Bayes | 0.323 | 0.588 | 0.745 | 0.927 | |
Bootstrap | 0.706 | 0.839 | 0.935 | 0.965 | |
(5,8) | GV | 0.408 | 0.713 | 0.849 | 0.978 |
LS | 0.471 | 0.775 | 0.874 | 0.975 | |
Bayes | 0.405 | 0.721 | 0.863 | 0.974 | |
Bootstrap | 0.765 | 0.899 | 0.945 | 0.989 | |
(7,8) | GV | 0.546 | 0.867 | 0.952 | 0.995 |
LS | 0.652 | 0.914 | 0.973 | 0.998 | |
Bayes | 0.529 | 0.951 | 0.946 | 0.996 | |
Bootstrap | 0.528 | 0.867 | 0.977 | 0.998 |
表7. 检验的功效
根据上述结果可以发现,广义推断方法在可靠性参数推断的区间估计与假设检验方面的表现都很好,此优点在样本量很小的情况下更为显著,另外广义枢轴量法可以用于构造讨厌参数存在时兴趣参数的置信区间以及解决带讨厌参数的假设检验问题,因此当传统频率学派方法无法给出精确方法且大样本难以获取时,广义推断方法可以有效地解决这类问题。
魏秋月,王春玲,赵 昕. 指数分布下可靠性参数的推断Inference of Reliability Parameters under Exponential Distribution[J]. 应用数学进展, 2019, 08(09): 1562-1573. https://doi.org/10.12677/AAM.2019.89183
https://doi.org/10.1080/01621459.1964.10480739
https://doi.org/10.1080/01621459.1971.10482238
https://doi.org/10.2307/1267617
https://doi.org/10.1109/TR.1982.5221387
https://doi.org/10.1080/03610929208830777
https://doi.org/10.1080/01621459.1989.10478810
https://doi.org/10.1080/01621459.1993.10476355
https://doi.org/10.22237/jmasm/1067645220