PM Pure Mathematics 2160-7583 Scientific Research Publishing 10.12677/PM.2020.109099 PM-37735 PM20200900000_88993274.pdf 数学与物理 t分布的渐进正态性证明及其特点分析 Proof of Asymptotic Normality of t Distribution and Analysis of Its Characteristics 欣童 1 * 东北大学秦皇岛分校数学与统计学院,河北 秦皇岛 09 09 2020 10 09 852 861 © Copyright 2014 by authors and Scientific Research Publishing Inc. 2014 This work is licensed under the Creative Commons Attribution International License (CC BY). http://creativecommons.org/licenses/by/4.0/

前人的研究已经证明t分布函数具有渐进正态的特性。我们改进了前人的研究,应用差函数的特性再次证明了t分布的渐进正态性,并结合MATLAB,直观验证了t分布的这一特性。之后,我们借助直观图形进一步分析了t函数的特性。 Previous studies have proved that the t distribution function has the characteristics of asymptotic normality. This paper applies the characteristics of the difference function to prove the asymptotic normality of the t distribution again, improving the previous research. And with the use of MATLAB software, the asymptotic normality is verified intuitively. After that, we further analyze the char-acteristics of the t function with the help of intuitive graphics.

t分布,正态性,证明,MATLAB, t Distribution Normality Proof MATLAB
摘要

前人的研究已经证明t分布函数具有渐进正态的特性。我们改进了前人的研究,应用差函数的特性再次证明了t分布的渐进正态性,并结合MATLAB,直观验证了t分布的这一特性。之后,我们借助直观图形进一步分析了t函数的特性。

关键词

t分布,正态性,证明,MATLAB

Proof of Asymptotic Normality of t Distribution and Analysis of Its Characteristics<sup> </sup>

Xintong Yang

School of Mathematics and Statistics, Northeastern University at Qinhuangdao, Qinhuangdao Hebei

Received: Aug. 24th, 2020; accepted: Sep. 15th, 2020; published: Sep. 22nd, 2020

ABSTRACT

Previous studies have proved that the t distribution function has the characteristics of asymptotic normality. This paper applies the characteristics of the difference function to prove the asymptotic normality of the t distribution again, improving the previous research. And with the use of MATLAB software, the asymptotic normality is verified intuitively. After that, we further analyze the characteristics of the t function with the help of intuitive graphics.

Keywords:t Distribution, Normality, Proof, MATLAB

Copyright © 2020 by author(s) and beplay安卓登录

This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).

http://creativecommons.org/licenses/by/4.0/

1. 引言

在概率统计学中,t分布函数是一种十分重要的分布函数,这种分布函数具有渐进正态性,即当自由度n趋于无穷大时,t分布函数趋近于标准正态分布。前人已经用求极限的方法证明了此结论 [ 1 ] - [ 9 ],但是证明过程比较复杂,并且前人没有给出这个过程的细致描述。因此,对于这个逼近过程具有什么样的具体特点不是很清楚。本文拟引进t分布函数与标准正态分布的差函数,首先分析差函数的性质,利用差函数的性质简明地证明t分布的极限分布为标准正态分布,然后,通过利用MATLAB绘制其函数图像来细致分析其逼近过程的具体特点。

2. t分布及其性质 2.1. t分布的定义

若两个独立的随机变量 ξ ~ N ( 0 , 1 ) , ζ ~ χ 2 ( n ) ,那么随机变量 X = ξ ζ / n 服从自由度为n的t分布 [ 10 ]。

其概率密度函数为

f t ( x , n ) = Γ ( n + 1 2 ) n π Γ ( n 2 ) ( 1 + x 2 n ) − n + 1 2 , ( − ∞ < x < + ∞ ) (1)

2.2. t分布的性质

性质1 (t分布的等价定义):若 n + 1 个独立的随机变量 ξ ~ N ( 0 , 1 ) ,

ζ 1 ~ N ( 0 , 1 ) , ζ 2 ~ N ( 0 , 1 ) , ⋯ , ζ n ~ N ( 0 , 1 ) ,那么随机变量 X = ξ ∑ i = 1 n ζ i / n ,服从自由度为n的t分布;

性质2 (对称性):由t分布的概率密度函数可得 f t ( x , n ) = − f ( − x , n ) 成立,因此t分布的概率密度函数关于x轴对称;

性质3 (均值和方差):若随机变量 X ~ t ( n ) ,则X的方差与均值为 E ( X ) = 0 , D ( X ) = n n − 2 ;

性质4 (有界性):若随机变量 ,因为 D ( X ) = n n − 2 ,所以当 n > 2 时X的方差有界,因此X的概率密度函数有界。

3. 利用差函数分析证明渐进正态性

t分布函数与标准正态分布的差函数的意义为两者在y轴方向的距离,若当n趋于无穷时,差函数在其各极值点的取值均趋于0,则可间接证明当n趋于无穷时,t分布趋于标准正态分布,即

若 lim n → ∞ sup φ ( x , n ) = 0 ,则 t ( n ) 趋近标准正态分布 N ( 0 , 1 ) 。

因此,下面首先分析差函数的性质,再利用差函数的性质证明t分布的极限分布为标准正态分布。

3.1. 差函数的定义

设随机变量的取值为x,则有标准正态分布的概率密度函数为 f N ( x ) = 1 2 π e − x 2 2 ,自由度为n的t分

布的概率密度函数为

f t ( x , n ) = Γ ( n + 1 2 ) n π Γ ( n 2 ) ( 1 + x 2 n ) − n + 1 2 (2)

这样,自由度为n的t分布与标准正态分布的差函数表达式为:

f t ( x , n ) = Γ ( n + 1 2 ) n π Γ ( n 2 ) ( 1 + x 2 n ) − n + 1 2 (3)

3.2. 差函数的基本性质

性质1 (对称性):已知标准正态分布和t分布的概率密度函数均关于x轴对称,因此差函数也关于x轴对称;

性质2 (极值点):对 φ ( x , n ) 关于x求导数,得到

d φ ( x , n ) d x = x [ n + 1 n Γ ( n + 1 2 ) n π Γ ( n 2 ) ( 1 + x 2 n ) − n + 3 2 − 1 2 π e − x 2 2 ] (4)

令 d φ ( x , n ) d x = 0 得到极值点 x 0 = 0 ,另有极值点 x k 满足方程

n + 1 n Γ ( n + 1 2 ) n π Γ ( n 2 ) ( 1 + x 2 n ) − n + 3 2 = 1 2 π e − x 2 2 (5)

利用上式方程得到差函数的极值

φ ( x k , n ) = Γ ( n + 1 n ) n π Γ ( n 2 ) ( 1 + x k n ) − n + 1 2 [ 1 − n + 1 n ( 1 + x k 2 n ) − 1 ] (6)

3.3. t分布的正态渐进性证明

引理1 (瓦里斯公式推论):

lim n → ∞ [ ( 2 n − 1 ) ! ! ( 2 n ) ! ! ] n π = 1       ( n ∈ N ) (7)

证明:

已知瓦里斯公式为

∏ n = 1 ∞ 2 n 2 n − 1 × 2 n 2 n + 1 = π 2       ( n ∈ N ) (8)

公式左端变形后为

lim n → ∞ [ ( 2 n ) ! ! ( 2 n − 1 ) ! ! ] 2 1 2 n − 1 = π 2 (9)

再次变形得到

lim n → ∞ [ ( 2 n ) ! ! ( 2 n − 1 ) ! ! ] 2 ( 2 n − 1 ) π = 1 ∴ lim n → ∞ [ ( 2 n ) ! ! ( 2 n − 1 ) ! ! ] 1 n π = 1 (10)

证毕

定理1:当 n → ∞ 时,差函数的极值均趋于0。

证明:

首先,带入极值点 x 0 = 0 得到

lim n → ∞ φ ( x 0 , n ) = Γ ( n + 1 n ) n π Γ ( n 2 ) − 1 2 π (11)

当n为偶数时,不妨令 n = 2 k

当n为奇数时同理可证明 lim k → ∞ φ ( x 0 , n ) = 0 。

下面,考虑其他极值点的极值

又由于t分布的概率密度函数的有界性得到

lim n → ∞ f t ( x k , n ) = p , (p为一有限数) (14)

另外因为

lim n → ∞ [ 1 − n + 1 n ( 1 + x k 2 n ) − 1 ] = 0 (15)

所以

lim n → ∞ φ ( x k , n ) = 0 (16)

综上,当 n → ∞ 时,差函数的极值趋于0。

因此,t分布的极限分布为标准正态分布。

4. t分布函数的渐进正态性直观验证

前文已经证明了t分布函数具有渐进正态性,但没有给出直观描述。下面首先利用MATLAB对其渐进正态性进行分析。在MATLAB中,输入下列代码,绘制标准正态分布以及自由度从1到100的t分布的概率密度函数。

clear all;clc;

x=-4:0.1:4;

n=linspace(1,100,100);

axis([-4 4 0 0.41]);

ylabel('$t(n)$','interpreter','latex', 'FontSize', 18);

xlabel('x')

for i=1:100

A(i,:)=tpdf(x,n(i));

end

plot(x,A);

hold on;

z=normpdf(x,0,1)

plot(x,z,'color','r','linewidth',2.3);

title('自由度从1到100的t分布密度函数和标准正态分布');

legend('n从1变化到100');

结果如图1所示。有图1可知,当t分布函数的自由度n增大的时,其概率分布函数在0附近的部分上升,其余两边的部分下降,总体趋近于标准正态分布曲线。t分布函数确实具有渐进正态性。

图1. t分布的渐进正态性

5. 利用差函数分析其具体特点 5.1. 差函数的变化图像

输入如下代码,绘制此函数当参数n 从1变化到100的函数图像。

clc;clear all;

x=-4:0.01:4;

n=linspace(1,100);

axis([-4 4 -0.2 0.41]);

ylabel('$t(n)-N(0,1)$','interpreter','latex', 'FontSize', 18);

xlabel('x')

z=normpdf(x,0,1)

for i=1:100

A(i,:)=tpdf(x,n(i))-z;

end

plot(x,A);

title('自由度从1到100的t分布密度函数与标准正态分布的差函数');

legend('n从1变化到100');

结果如图2所示。从图2中可以看出,当参数n固定时,差函数是一个关于y轴对称的函数,这表明标准正态分布和t分布都是关于y轴对称的函数。

另外,当参数n固定时,很容易看出,一条差函数曲线具有5个极值点。由于其对称性,其中一个极值点为 x = 0 ,但它不是最值点。因此,虽然t分布和标准正态分布的最大值点都在 x = 0 处取得,但是他们的差的最大值并不是在 x = 0 处取得,而是在其他的极值点处取得。

当参数n从1增加到100时,差函数图像逐渐趋于x轴,整体变得平阔,函数范围越来越小,这直观地反映了当n增加时,t分布逐渐趋近于标准正态分布。

图2. 差函数的变化图像

5.2. 差函数的最值

为了进一步分析差函数的性质,输入如下代码,求其当参数n从1变化到100时的差函数的最值。

clc;clear all;

MAX=[ ];MIN=[ ];a=zeros(1,5)

x=-4:0.01:4;

n=linspace(1,100);

axis([-4 4 -0.2 0.41]);

z=normpdf(x,0,1)

for i=1:100

A(i,:)=tpdf(x,n(i))-z;

MAX(i)=max(A(i,:));

MIN(i)=min(A(i,:));

end

ma=vpa(MAX,3);

ma1=[ma a]

ma2=reshape(ma1,7,[ ])

ma3=vpa(ma2.',4)

mi=vpa(MIN,5)

mi1=[mi a]

mi2=reshape(mi1,7,[ ])

mi3=vpa(mi2.',3)

结果为:

从表1、表2所得数据可以看出,当差函数的参数从1变化到100时,差函数最大值从0.028099变化到0.001139,最小值从−0.099264变化到−0.0013572,显然,他们的绝对值都减小了很多。

The maximum of difference function
[0.0281, 0.025, 0.02118, 0.01815, 0.0158, 0.01397, 0.0125]
[0.01131, 0.01032, 0.009487, 0.008778, 0.008167, 0.007634, 0.007167]
[0.006753, 0.006384, 0.006053, 0.005755, 0.005484, 0.005238, 0.005013]
[0.004806, 0.004616, 0.00444, 0.004277, 0.004126, 0.003985, 0.003853]
[0.00373, 0.003614, 0.003505, 0.003403, 0.003306, 0.003215, 0.003129]
[0.003047, 0.002969, 0.002895, 0.002825, 0.002758, 0.002694, 0.002633]
[0.002575, 0.002519, 0.002466, 0.002415, 0.002366, 0.002319, 0.002274]
[0.00223, 0.002188, 0.002148, 0.002109, 0.002071, 0.002035, 0.002]
[0.001966, 0.001934, 0.001902, 0.001872, 0.001842, 0.001813, 0.001785]
[0.001758, 0.001732, 0.001707, 0.001682, 0.001658, 0.001635, 0.001612]
[0.00159, 0.001569, 0.001548, 0.001528, 0.001508, 0.001489, 0.00147]
[0.001451, 0.001434, 0.001416, 0.001399, 0.001382, 0.001366, 0.00135]
[0.001335, 0.00132, 0.001305,0.00129, 0.001276, 0.001263, 0.001249]
[0.001236, 0.001223, 0.00121, 0.001198, 0.001185, 0.001173, 0.001162]
[0.00115, 0.001139]

表1. 差函数最大值

The minimum of difference function
[−0.0993, −0.0578, −0.0407, −0.0313, −0.0255, −0.0215, −0.0186]
[−0.0163, −0.0146, −0.0132, −0.012, −0.011, −0.0102, −0.0095]
[−0.00888, −0.00834, −0.00786, −0.00743, −0.00704, −0.0067, −0.00638]
[−0.0061, −0.00584, −0.0056, −0.00538, −0.00517, −0.00498, −0.00481]
[−0.00464, −0.00449, −0.00435, −0.00421, −0.00409, −0.00397, −0.00385]
[−0.00375, −0.00365, −0.00355, −0.00346, −0.00338, −0.00329, −0.00322]
[−0.00314, −0.00307, −0.003, −0.00294, −0.00288, −0.00282, −0.00276]
[−0.00271, −0.00265, −0.0026, −0.00255, −0.00251, −0.00246, −0.00242]
[−0.00238, −0.00233, −0.0023, −0.00226, −0.00222, −0.00218, −0.00215]
[−0.00212, −0.00208, −0.00205, −0.00202, −0.00199, −0.00196, −0.00194]
[−0.00191, −0.00188, −0.00186, −0.00183, −0.00181, −0.00178, −0.00176]
[−0.00174, −0.00172, −0.0017, −0.00167, −0.00165, −0.00163, −0.00161]
[−0.0016, −0.00158, −0.00156, −0.00154, −0.00152, −0.00151, −0.00149]
[−0.00147, −0.00146, −0.00144, −0.00143, −0.00141, −0.0014, −0.00138]
[−0.00137, −0.00136]

表2. 差函数最小值

5.3. 差函数最值的直观表示

为了使差函数最值随n的变化更直观,输入如下代码,绘制其当n从1变化到100函数的图像。

clc;clear all;

syms E F;

X1=[ ];X2=[ ];SUP=[ ];INF=[ ];

x=-4:0.001:4;

n=linspace(1,100);

z=normpdf(x,0,1)

for i=1:100

A(i,:)=tpdf(x,n(i))-z;

SUP(i)=max(A(i,:));

INF(i)=min(A(i,:));

E=find(A(i,:)==SUP(i))

X1(i)=(E(:,2)-4000)*0.01

F=find(A(i,:)==INF(i))

X2(i)=(F(:,2)-4000)*0.01

end

plot(n,SUP,'o-','color','r','linewidth',2);

hold on;

plot(n,INF,'s-','color','b','linewidth',2);

title('参数从1到100的的差函数最值');

legend('差函数最大值','差函数最小值');

ylabel('$t(n)-N(0,1)最值$','interpreter','latex', 'FontSize', 18);

xlabel('n')

grid on;

图3. 差函数最值随n的变化

结果如图3所示。从图3可以看出差函数的最大值和最小值随参数n的增大都趋于0。当n增加时,函数的变化速度减慢,因此看出,自由度n增加时,t分布渐进于标准正态分布的速度减慢。

6. 结论

1) 当自由度n趋于无穷的时,t分布总体趋近于标准正态分布曲线,可通过构造的差函数比较简单地证明;

2) 趋近方式为其概率分布函数在0附近的部分上升,其余两边的部分下降;

3) 当自由度n趋于无穷的时,t分布趋近于标准正态分布,但是速度越来越慢;

4) 当自由度n趋于无穷的时,t分布在不同点与标准正态分布的差值不相同;

5) 当自由度n趋于无穷的时,t分布不同点趋近于标准正态分布的速度不相同。

文章引用

杨欣童. t分布的渐进正态性证明及其特点分析Proof of Asymptotic Normality of t Distribution and Analysis of Its Characteristics[J]. 理论数学, 2020, 10(09): 852-861. https://doi.org/10.12677/PM.2020.109099

参考文献 References 杨洁, 李兆庚. 关于t分布的极限分布为标准正态分布的证明[J]. 石油化工高等学校学报, 1994(3): 78-80. 严琴, 唐贺, 李开灿. 中心多元t分布的一致渐近正态性[J]. 湖北文理学院学报, 2013, 34(2): 9-13. 李开灿, 孟赵玲. x~2分布、t分布和F分布的一致渐近正态性[J]. 北京印刷学院学报, 2004(3): 30-33. 梁琼. X~2•T•F分布的正态逼近[J]. 湖北民族学院学报(自然科学版), 1995(2): 33-38. 王娟. t分布密度函数之性质[J]. 淮阴工学院学报, 2007(5): 15-21. 彭定忠, 张映辉, 刘朝才. t分布概率密度的分析[J]. 湖南城市学院学报(自然科学版), 2012, 21(4): 50-52. 张光远. 关于多元t分布的一些讨论[J]. 新疆大学学报(自然科学版), 1996(3): 33-38. Li, R. and Saralees, N. (2020) A Review of Student’s t Distribution and Its Generalizations. Empirical Economics, 58, 1461-1490.
https://doi.org/10.1007/s00181-018-1570-0
Chen, C.P. (2018) Complete As-ymptotic Expansions for the Density Function of t -Distribution. Statistics and Probability Letters, 141.
https://doi.org/10.1016/j.spl.2018.05.014
魏宗舒. 概率论与数理统计教程[M]. 北京: 高等教育出版社, 2008: 145-146.
Baidu
map