前人的研究已经证明t分布函数具有渐进正态的特性。我们改进了前人的研究,应用差函数的特性再次证明了t分布的渐进正态性,并结合MATLAB,直观验证了t分布的这一特性。之后,我们借助直观图形进一步分析了t函数的特性。 Previous studies have proved that the t distribution function has the characteristics of asymptotic normality. This paper applies the characteristics of the difference function to prove the asymptotic normality of the t distribution again, improving the previous research. And with the use of MATLAB software, the asymptotic normality is verified intuitively. After that, we further analyze the char-acteristics of the t function with the help of intuitive graphics.
前人的研究已经证明t分布函数具有渐进正态的特性。我们改进了前人的研究,应用差函数的特性再次证明了t分布的渐进正态性,并结合MATLAB,直观验证了t分布的这一特性。之后,我们借助直观图形进一步分析了t函数的特性。
t分布,正态性,证明,MATLAB
Xintong Yang
School of Mathematics and Statistics, Northeastern University at Qinhuangdao, Qinhuangdao Hebei
Received: Aug. 24th, 2020; accepted: Sep. 15th, 2020; published: Sep. 22nd, 2020
Previous studies have proved that the t distribution function has the characteristics of asymptotic normality. This paper applies the characteristics of the difference function to prove the asymptotic normality of the t distribution again, improving the previous research. And with the use of MATLAB software, the asymptotic normality is verified intuitively. After that, we further analyze the characteristics of the t function with the help of intuitive graphics.
Keywords:t Distribution, Normality, Proof, MATLAB
Copyright © 2020 by author(s) and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
在概率统计学中,t分布函数是一种十分重要的分布函数,这种分布函数具有渐进正态性,即当自由度n趋于无穷大时,t分布函数趋近于标准正态分布。前人已经用求极限的方法证明了此结论 [
若两个独立的随机变量 ξ ~ N ( 0 , 1 ) , ζ ~ χ 2 ( n ) ,那么随机变量 X = ξ ζ / n 服从自由度为n的t分布 [
其概率密度函数为
f t ( x , n ) = Γ ( n + 1 2 ) n π Γ ( n 2 ) ( 1 + x 2 n ) − n + 1 2 , ( − ∞ < x < + ∞ ) (1)
性质1 (t分布的等价定义):若 n + 1 个独立的随机变量 ξ ~ N ( 0 , 1 ) ,
ζ 1 ~ N ( 0 , 1 ) , ζ 2 ~ N ( 0 , 1 ) , ⋯ , ζ n ~ N ( 0 , 1 ) ,那么随机变量 X = ξ ∑ i = 1 n ζ i / n ,服从自由度为n的t分布;
性质2 (对称性):由t分布的概率密度函数可得 f t ( x , n ) = − f ( − x , n ) 成立,因此t分布的概率密度函数关于x轴对称;
性质3 (均值和方差):若随机变量 X ~ t ( n ) ,则X的方差与均值为 E ( X ) = 0 , D ( X ) = n n − 2 ;
性质4 (有界性):若随机变量
t分布函数与标准正态分布的差函数的意义为两者在y轴方向的距离,若当n趋于无穷时,差函数在其各极值点的取值均趋于0,则可间接证明当n趋于无穷时,t分布趋于标准正态分布,即
若 lim n → ∞ sup φ ( x , n ) = 0 ,则 t ( n ) 趋近标准正态分布 N ( 0 , 1 ) 。
因此,下面首先分析差函数的性质,再利用差函数的性质证明t分布的极限分布为标准正态分布。
设随机变量的取值为x,则有标准正态分布的概率密度函数为 f N ( x ) = 1 2 π e − x 2 2 ,自由度为n的t分
布的概率密度函数为
f t ( x , n ) = Γ ( n + 1 2 ) n π Γ ( n 2 ) ( 1 + x 2 n ) − n + 1 2 (2)
这样,自由度为n的t分布与标准正态分布的差函数表达式为:
f t ( x , n ) = Γ ( n + 1 2 ) n π Γ ( n 2 ) ( 1 + x 2 n ) − n + 1 2 (3)
性质1 (对称性):已知标准正态分布和t分布的概率密度函数均关于x轴对称,因此差函数也关于x轴对称;
性质2 (极值点):对 φ ( x , n ) 关于x求导数,得到
d φ ( x , n ) d x = x [ n + 1 n Γ ( n + 1 2 ) n π Γ ( n 2 ) ( 1 + x 2 n ) − n + 3 2 − 1 2 π e − x 2 2 ] (4)
令 d φ ( x , n ) d x = 0 得到极值点 x 0 = 0 ,另有极值点 x k 满足方程
n + 1 n Γ ( n + 1 2 ) n π Γ ( n 2 ) ( 1 + x 2 n ) − n + 3 2 = 1 2 π e − x 2 2 (5)
利用上式方程得到差函数的极值
φ ( x k , n ) = Γ ( n + 1 n ) n π Γ ( n 2 ) ( 1 + x k n ) − n + 1 2 [ 1 − n + 1 n ( 1 + x k 2 n ) − 1 ] (6)
引理1 (瓦里斯公式推论):
lim n → ∞ [ ( 2 n − 1 ) ! ! ( 2 n ) ! ! ] n π = 1 ( n ∈ N ) (7)
证明:
已知瓦里斯公式为
∏ n = 1 ∞ 2 n 2 n − 1 × 2 n 2 n + 1 = π 2 ( n ∈ N ) (8)
公式左端变形后为
lim n → ∞ [ ( 2 n ) ! ! ( 2 n − 1 ) ! ! ] 2 1 2 n − 1 = π 2 (9)
再次变形得到
lim n → ∞ [ ( 2 n ) ! ! ( 2 n − 1 ) ! ! ] 2 ( 2 n − 1 ) π = 1 ∴ lim n → ∞ [ ( 2 n ) ! ! ( 2 n − 1 ) ! ! ] 1 n π = 1 (10)
证毕
定理1:当 n → ∞ 时,差函数的极值均趋于0。
证明:
首先,带入极值点 x 0 = 0 得到
lim n → ∞ φ ( x 0 , n ) = Γ ( n + 1 n ) n π Γ ( n 2 ) − 1 2 π (11)
当n为偶数时,不妨令 n = 2 k
当n为奇数时同理可证明 lim k → ∞ φ ( x 0 , n ) = 0 。
下面,考虑其他极值点的极值
又由于t分布的概率密度函数的有界性得到
lim n → ∞ f t ( x k , n ) = p , (p为一有限数) (14)
另外因为
lim n → ∞ [ 1 − n + 1 n ( 1 + x k 2 n ) − 1 ] = 0 (15)
所以
lim n → ∞ φ ( x k , n ) = 0 (16)
综上,当 n → ∞ 时,差函数的极值趋于0。
因此,t分布的极限分布为标准正态分布。
前文已经证明了t分布函数具有渐进正态性,但没有给出直观描述。下面首先利用MATLAB对其渐进正态性进行分析。在MATLAB中,输入下列代码,绘制标准正态分布以及自由度从1到100的t分布的概率密度函数。
clear all;clc;
x=-4:0.1:4;
n=linspace(1,100,100);
axis([-4 4 0 0.41]);
ylabel('$t(n)$','interpreter','latex', 'FontSize', 18);
xlabel('x')
for i=1:100
A(i,:)=tpdf(x,n(i));
end
plot(x,A);
hold on;
z=normpdf(x,0,1)
plot(x,z,'color','r','linewidth',2.3);
title('自由度从1到100的t分布密度函数和标准正态分布');
legend('n从1变化到100');
结果如图1所示。有图1可知,当t分布函数的自由度n增大的时,其概率分布函数在0附近的部分上升,其余两边的部分下降,总体趋近于标准正态分布曲线。t分布函数确实具有渐进正态性。
图1. t分布的渐进正态性
输入如下代码,绘制此函数当参数n 从1变化到100的函数图像。
clc;clear all;
x=-4:0.01:4;
n=linspace(1,100);
axis([-4 4 -0.2 0.41]);
ylabel('$t(n)-N(0,1)$','interpreter','latex', 'FontSize', 18);
xlabel('x')
z=normpdf(x,0,1)
for i=1:100
A(i,:)=tpdf(x,n(i))-z;
end
plot(x,A);
title('自由度从1到100的t分布密度函数与标准正态分布的差函数');
legend('n从1变化到100');
结果如图2所示。从图2中可以看出,当参数n固定时,差函数是一个关于y轴对称的函数,这表明标准正态分布和t分布都是关于y轴对称的函数。
另外,当参数n固定时,很容易看出,一条差函数曲线具有5个极值点。由于其对称性,其中一个极值点为 x = 0 ,但它不是最值点。因此,虽然t分布和标准正态分布的最大值点都在 x = 0 处取得,但是他们的差的最大值并不是在 x = 0 处取得,而是在其他的极值点处取得。
当参数n从1增加到100时,差函数图像逐渐趋于x轴,整体变得平阔,函数范围越来越小,这直观地反映了当n增加时,t分布逐渐趋近于标准正态分布。
图2. 差函数的变化图像
为了进一步分析差函数的性质,输入如下代码,求其当参数n从1变化到100时的差函数的最值。
clc;clear all;
MAX=[
x=-4:0.01:4;
n=linspace(1,100);
axis([-4 4 -0.2 0.41]);
z=normpdf(x,0,1)
for i=1:100
A(i,:)=tpdf(x,n(i))-z;
MAX(i)=max(A(i,:));
MIN(i)=min(A(i,:));
end
ma=vpa(MAX,3);
ma1=[ma a]
ma2=reshape(ma1,7,[
ma3=vpa(ma2.',4)
mi=vpa(MIN,5)
mi1=[mi a]
mi2=reshape(mi1,7,[
mi3=vpa(mi2.',3)
结果为:
从表1、表2所得数据可以看出,当差函数的参数从1变化到100时,差函数最大值从0.028099变化到0.001139,最小值从−0.099264变化到−0.0013572,显然,他们的绝对值都减小了很多。
[0.0281, 0.025, 0.02118, 0.01815, 0.0158, 0.01397, 0.0125] |
---|
[0.01131, 0.01032, 0.009487, 0.008778, 0.008167, 0.007634, 0.007167] |
[0.006753, 0.006384, 0.006053, 0.005755, 0.005484, 0.005238, 0.005013] |
[0.004806, 0.004616, 0.00444, 0.004277, 0.004126, 0.003985, 0.003853] |
[0.00373, 0.003614, 0.003505, 0.003403, 0.003306, 0.003215, 0.003129] |
[0.003047, 0.002969, 0.002895, 0.002825, 0.002758, 0.002694, 0.002633] |
[0.002575, 0.002519, 0.002466, 0.002415, 0.002366, 0.002319, 0.002274] |
[0.00223, 0.002188, 0.002148, 0.002109, 0.002071, 0.002035, 0.002] |
[0.001966, 0.001934, 0.001902, 0.001872, 0.001842, 0.001813, 0.001785] |
[0.001758, 0.001732, 0.001707, 0.001682, 0.001658, 0.001635, 0.001612] |
[0.00159, 0.001569, 0.001548, 0.001528, 0.001508, 0.001489, 0.00147] |
[0.001451, 0.001434, 0.001416, 0.001399, 0.001382, 0.001366, 0.00135] |
[0.001335, 0.00132, 0.001305,0.00129, 0.001276, 0.001263, 0.001249] |
[0.001236, 0.001223, 0.00121, 0.001198, 0.001185, 0.001173, 0.001162] |
[0.00115, 0.001139] |
表1. 差函数最大值
[−0.0993, −0.0578, −0.0407, −0.0313, −0.0255, −0.0215, −0.0186] |
---|
[−0.0163, −0.0146, −0.0132, −0.012, −0.011, −0.0102, −0.0095] |
[−0.00888, −0.00834, −0.00786, −0.00743, −0.00704, −0.0067, −0.00638] |
[−0.0061, −0.00584, −0.0056, −0.00538, −0.00517, −0.00498, −0.00481] |
[−0.00464, −0.00449, −0.00435, −0.00421, −0.00409, −0.00397, −0.00385] |
[−0.00375, −0.00365, −0.00355, −0.00346, −0.00338, −0.00329, −0.00322] |
[−0.00314, −0.00307, −0.003, −0.00294, −0.00288, −0.00282, −0.00276] |
[−0.00271, −0.00265, −0.0026, −0.00255, −0.00251, −0.00246, −0.00242] |
[−0.00238, −0.00233, −0.0023, −0.00226, −0.00222, −0.00218, −0.00215] |
[−0.00212, −0.00208, −0.00205, −0.00202, −0.00199, −0.00196, −0.00194] |
[−0.00191, −0.00188, −0.00186, −0.00183, −0.00181, −0.00178, −0.00176] |
[−0.00174, −0.00172, −0.0017, −0.00167, −0.00165, −0.00163, −0.00161] |
[−0.0016, −0.00158, −0.00156, −0.00154, −0.00152, −0.00151, −0.00149] |
[−0.00147, −0.00146, −0.00144, −0.00143, −0.00141, −0.0014, −0.00138] |
[−0.00137, −0.00136] |
表2. 差函数最小值
为了使差函数最值随n的变化更直观,输入如下代码,绘制其当n从1变化到100函数的图像。
clc;clear all;
syms E F;
X1=[
x=-4:0.001:4;
n=linspace(1,100);
z=normpdf(x,0,1)
for i=1:100
A(i,:)=tpdf(x,n(i))-z;
SUP(i)=max(A(i,:));
INF(i)=min(A(i,:));
E=find(A(i,:)==SUP(i))
X1(i)=(E(:,2)-4000)*0.01
F=find(A(i,:)==INF(i))
X2(i)=(F(:,2)-4000)*0.01
end
plot(n,SUP,'o-','color','r','linewidth',2);
hold on;
plot(n,INF,'s-','color','b','linewidth',2);
title('参数从1到100的的差函数最值');
legend('差函数最大值','差函数最小值');
ylabel('$t(n)-N(0,1)最值$','interpreter','latex', 'FontSize', 18);
xlabel('n')
grid on;
图3. 差函数最值随n的变化
结果如图3所示。从图3可以看出差函数的最大值和最小值随参数n的增大都趋于0。当n增加时,函数的变化速度减慢,因此看出,自由度n增加时,t分布渐进于标准正态分布的速度减慢。
1) 当自由度n趋于无穷的时,t分布总体趋近于标准正态分布曲线,可通过构造的差函数比较简单地证明;
2) 趋近方式为其概率分布函数在0附近的部分上升,其余两边的部分下降;
3) 当自由度n趋于无穷的时,t分布趋近于标准正态分布,但是速度越来越慢;
4) 当自由度n趋于无穷的时,t分布在不同点与标准正态分布的差值不相同;
5) 当自由度n趋于无穷的时,t分布不同点趋近于标准正态分布的速度不相同。
杨欣童. t分布的渐进正态性证明及其特点分析Proof of Asymptotic Normality of t Distribution and Analysis of Its Characteristics[J]. 理论数学, 2020, 10(09): 852-861. https://doi.org/10.12677/PM.2020.109099
https://doi.org/10.1007/s00181-018-1570-0
https://doi.org/10.1016/j.spl.2018.05.014