混合高斯模型在描述数据方面应用较多,但它易受离群点的影响,其参数的极大似然估计不是稳健估计。混合t-分布模型由于其重尾分布的特性,相对于混合高斯分布,在分析重尾数据上更具稳健性。文章首先研究一元混合t-分布模型,利用标准EM算法给出了该模型参数极大似然估计的迭代步骤,并分别在三类模拟数据下与混合高斯模型进行了对比分析,验证了该模型的有效性以及在拟合重尾数据上的优势。算法初始化采用k-means方法。 The normal mixture model has more applications in describing data. But it is easily influenced by the outlier, and the maximum likelihood estimation of parameters is not robust estimation. T-distribution mixture model has better robustness than Gauss mixture model to analyze data with longer time than normal tails because of its heavy-tails. In this paper, we studied a univariate t mixture model primarily. Based on EM algorithm, we derived the iteration steps of maximum li-kelihood estimation of the model’s unknown parameters. Furthermore, we did a comparative analysis by three types of simulated data. Simulation study shows that this model has an advantage in fitting data with longer time than normal tails. The initial value is given by k-means method.
王小英,李迎华,杨雪梅
华北电力大学数理学院,北京
收稿日期:2017年10月8日;录用日期:2017年10月23日;发布日期:2017年10月30日
混合高斯模型在描述数据方面应用较多,但它易受离群点的影响,其参数的极大似然估计不是稳健估计。混合t-分布模型由于其重尾分布的特性,相对于混合高斯分布,在分析重尾数据上更具稳健性。文章首先研究一元混合t-分布模型,利用标准EM算法给出了该模型参数极大似然估计的迭代步骤,并分别在三类模拟数据下与混合高斯模型进行了对比分析,验证了该模型的有效性以及在拟合重尾数据上的优势。算法初始化采用k-means方法。
关键词 :EM算法,混合t-分布模型,k-Means初始化
Copyright © 2017 by authors and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY).
http://creativecommons.org/licenses/by/4.0/
混合分布模型是一种基于概率和统计的建模工具,它提供了一个用简单结构模拟复杂密度的灵活有效的方法,从而受到了统计学界、模式识别、图像处理等诸多领域的广泛关注。它的基本策略是,把研究数据看作是从很大的单个或多个总体上抽取出的一部分,通过潜在的分布或密度函数来描述。混合高斯模型应用的较多,但通常我们收集到的很多数据并不是严格的服从正态分布,而是较明显的服从重尾分布。混合t-分布模型由于其具有较长的尾巴,可对重尾点和异常点有效的降低权值,因此,相对于混合高斯分布模型,可以获得较强的精度和稳健性。
对于模型参数的求解,1977年Dempster等人在文献 [
在前人研究的基础上,本文研究了基于EM算法的三总体一元混合t-分布模型参数的极大似然估计,克服了多元混合t-分布模型中协方差矩阵向一元混合t-分布模型中尺度参数转变的困难,并首次将k-means方法用于该模型下算法初值的选取。此外,我们引进了混合高斯模型,并分别在三种不同类型数据下进行了对比仿真实验,验证了本文研究的模型和方法的有效性及其在处理重尾数据上的优势。
设随机变量y服从一元学生t-分布,记做 y ∼ t ( y | μ , σ , ν ) ,概率密度函数定义为 [
t ( y | μ , σ , ν ) = Γ ( 1 + ν 2 ) Γ ( ν 2 ) ( 1 π σ 2 ν ) 1 2 [ 1 + ( y − μ ) 2 σ 2 ν ] − ( 1 + ν 2 ) (1)
其中参数 μ 和 σ 分别表示t-分布的位置参数和尺度参数, Γ ( · ) 表示伽马函数,参数 ν 称为t-分布的自由度。
设随机向量服从一元t-分布且由m个子分布混合而成,混合比例为 π k 且满足 ∑ k = 1 m π k = 1 , t ( y | θ k ) 为第
k个子分布的概率密度函数, θ k = { μ k , σ k , ν k } 为对应的子分布的概率密度函数参数, Ψ = { π 1 , ⋯ , π m , θ 1 , ⋯ θ m } 为参数空间。因此,有限混合t-分布模型可以表示为
t ( y | θ ) = ∑ k = 1 m π k t ( y | θ k ) (2)
本文研究三个子分布的情况,即取 m = 3 ,则式(2)化为
t ( y | θ ) = π 1 t ( y | θ 1 ) + π 2 t ( y | θ 2 ) + ( 1 − π 1 − π 2 ) t ( y | θ 3 ) (3)
其中, t ( y | θ k ) 为第k个子分布的概率密度函数,具体形式见式(1)。
本文要研究的模型为上文所提到的式(3),并假设三个子分布的自由度相同,即 ν 1 = ν 2 = ν 3 = ν 。我们采用标准EM算法来求解模型参数,它提供了一种近似计算含有隐变量概率模型的极大似然估计的方法。在EM算法的基本框架下,我们引入隐变量以得到完整数据集。完整数据集定义为 Y c = { Y , Z , U } ,
其中, Z 为标签变量 Z = { z 1 , z 2 , ⋯ , z N } ,且 z i k = { 1 , 第 i 个 样 本 来 自 第 k 个 子 分 布 0 , 其 他 ( i = 1 , 2 , ⋯ , N , k = 1 , 2 , 3 );
U 为引进的另一个隐变量 U = { u 1 , u 2 , ⋯ , u N } ,给定 z i k = 1 时, u i 是独立同分布的,且满足
u i | z i k = 1 ∼ G ( ν 2 , ν 2 ) ; Y 为可观测数据集 Y = { y 1 , ⋯ , y N } ,且有 y i | u i , z i k = 1 ∼ N ( μ k , σ k 2 / u i ) 。由(1) (3)两式
建立完整数据的似然函数为:
p ( Y , Z , U | Ψ ) = ∏ i = 1 N p ( y i , z i 1 , z i 2 , u i | Ψ ) = ∏ i = 1 N ∏ k = 1 3 { u i 2 π σ k e − u i ( y i − μ k ) 2 2 σ k 2 [ ( ν 2 ) ν 2 Γ ( ν 2 ) e − ν 2 u i u i ν 2 − 1 ] π k } z i k (4)
则完整数据的对数似然函数为:
log p ( Y , Z , U | ψ ) = ∑ k = 1 3 ∑ i = 1 N z i k { 1 2 log u i − 1 2 log 2 π − log σ k − u i 2 σ k 2 ( y i − μ k ) 2 + ν 2 log ν 2 − log Γ ( ν 2 ) − ν 2 u i + log π k } = ∑ k = 1 3 ∑ i = 1 N z i k log π k + ∑ k = 1 3 ∑ i = 1 N z i k { − log Γ ( ν 2 ) + ν 2 log ( ν 2 ) + ν 2 ( log u i − u i ) } + ∑ k = 1 3 ∑ i = 1 N z i k { − 1 2 log 2 π − 1 2 log u i − log σ k − u i ( y i − μ k ) 2 2 σ k 2 } (5)
EM算法是一种迭代近似求解算法,它主要分两步进行:E步是对对数似然函数求期望,M步是最大化对数似然函数以获得新的参数值。
应用EM算法于上式,求解第 j 次各参数的极大似然更新表达式。
E步: Q ( Ψ | Ψ ( j ) ) = E Z , U [ log p ( Y , Z , U | Ψ ) | Y , Ψ ( j ) ]
首先计算关于隐变量 Z , U 的条件分布的期望:
E Z , U [ z i k | Y , Ψ ( j ) ] = τ i k ( j ) = π k ( j ) f k ( y i | θ k ( j ) ) ∑ k = 1 3 π k ( j ) f k ( y i | θ k ( j ) ) (6)
E Z , U [ u i k | y , Ψ ( j ) ] = u i k ( j ) = ν ( j ) + 1 ν ( j ) + ( y i − μ k ( j ) ) 2 / σ k 2 ( j ) (7)
E Z , U [ log u i k | y , Ψ ( j ) ] = l i k ( j ) = log u i k ( j ) + { ψ ( ν ( j ) + 1 2 ) − log ( ν ( j ) + 1 2 ) } (8)
其中, ψ ( x ) = d ( log Γ ( x ) ) d x = Γ ′ ( x ) Γ ( x ) ,于是
Q ( Ψ | Ψ ( j ) ) = ∑ k = 1 3 ∑ i = 1 N τ i k ( j ) log π k + ∑ k = 1 3 ∑ i = 1 N τ i k ( j ) { − log Γ ( ν 2 ) + ν 2 log ( ν 2 ) + ν 2 ( log u i k ( j ) + Ψ ( ν ( j ) + 1 2 ) − log ( ν ( j ) + 1 2 ) − u i k ( j ) ) } + ∑ k = 1 3 ∑ i = 1 N τ i k ( j ) { − 1 2 log 2 π − log σ k − u i k ( j ) ( y i − μ k ) 2 2 σ k 2 − 1 2 [ log u i k ( j ) + Ψ ( ν ( j ) + 1 2 ) − log ( ν ( j ) + 1 2 ) ] } (9)
M步: θ ( j + 1 ) = arg max θ Q ( θ , θ (j))
利用Q函数对各参数求偏导数并令其等于零,求解得到各参数的第 j + 1 次迭代更新表达式:
π k ( j + 1 ) = ∑ i = 1 N τ i k ( j ) / N (10)
μ k ( j + 1 ) = ∑ i = 1 N τ i k ( j ) u i k ( j ) y i ∑ i = 1 N τ i k ( j ) u i k ( j ) (11)
σ k ( j + 1 ) = sqrt ( ∑ i = 1 N τ i k ( j ) u i k ( j ) ( y i − μ k ( j + 1 ) ) 2 ∑ i = 1 N τ i k ( j ) u i k ( j ) ) (12)
自由度 ν ( j + 1 ) 是非线性方程
log ν 2 − ψ ( ν 2 ) + 1 + 1 ∑ i = 1 N τ i k ( j ) ∑ i = 1 N τ i k ( j ) ( l i k ( j ) − u i k ( j ) ) = 0 (13)
的解。上式是关于 ν 的非线性方程,文献 [
为了验证上述参数估计方法的有效性,我们共采用三种不同类型数据进行模拟研究,并引进混合高
斯分布模型 [
数估计结果中的尺度参数 σ 转化为标准差 υ ,再与混合高斯分布EM算法估计的参数 υ 作比较。算法的初始化均采用k-means方法。参数估计的精确度采用均方误差来衡量,如混合比例 π 1 的均方误差定义为:
M S E ( π 1 ) = 1 n ∑ i = 1 n ( π 1 i − π 1 ( 0 ) ) 2
其中, π 1 ( 0 ) 是 π 1 的真值,n为模拟次数。
给定真值 π 1 ( 0 ) = 0.5 和 π 2 ( 0 ) = 0.3 , μ 1 ( 0 ) = 2 、 μ 2 ( 0 ) = 7 、 、 υ 1 ( 0 ) = υ 2 ( 0 ) = υ 3 ( 0 ) = 1 ,分别取样本量 N = 500 ,1000,共产生2组混合高斯分布数据。对混合t-分布模型,分别取自由度 ν = 3 [
由表1、表2、表3知:
ν = 3 时,混合高斯模型参数估计的均方误差均比混合t-分布模型参数估计的均方误差小,这一点在 υ 1 、 υ 2 、 υ 3 上更为明显;在 ν = 15 , 30 时,除了对 υ 1 、 υ 2 、 υ 3 的估计结果混合高斯模型略好于混合t-分布模型外,两种方法对其他参数的估计的均方误差,几乎无差。此外还有,随着自由度的增大,混合t-分布模型参数估计的均方误差变小;整体来看,样本量越大,MSE越小。
给定真值 π 1 ( 0 ) = 0.5 和 π 2 ( 0 ) = 0.3 , μ 1 ( 0 ) = 2 、 μ 2 ( 0 ) = 7 、 μ 3 ( 0 ) = 11 、 υ 1 ( 0 ) = υ 2 ( 0 ) = υ 3 ( 0 ) = 1 ,取 ν = 3 [
由表4、表5、表6知:
混合t-分布模型可以较好地拟合该数据,参数估计值与真值十分接近。当 ν = 3 时,对所有参数的估计,混合t-分布模型参数估计的均方误差均比混合高斯分布模型参数估计的均方误差小; ν = 15 时,除 μ 2 、
参数 | N | EST1 | EST2 | MSE1 | MSE2 |
---|---|---|---|---|---|
π 1 ( 0 ) = 0.5 | 500 1000 | 0.4974 0.4976 | 0.5011 0.5014 | 0.0000 0.0000 | 0.0000 0.0000 |
π 2 ( 0 ) = 0.3 | 500 1000 | 0.2984 0.2979 | 0.3063 0.3057 | 0.0001 0.0001 | 0.0002 0.0001 |
μ 1 ( 0 ) = 2 | 500 1000 | 1.9840 1.9881 | 1.9974 2.0033 | 0.0045 0.0025 | 0.0050 0.0026 |
μ 2 ( 0 ) = 7 | 500 1000 | 6.9485 6.9493 | 7.0348 7.0357 | 0.0119 0.0084 | 0.0120 0.0072 |
μ 3 ( 0 ) = 11 | 500 1000 | 10.9590 10.9515 | 11.0208 11.0123 | 0.0174 0.0124 | 0.0178 0.0092 |
υ 1 ( 0 ) = 1 | 500 1000 | 0.9816 0.9855 | 1.4078 1.4043 | 0.0022 0.0013 | 0.1730 0.1723 |
υ 2 ( 0 ) = 1 | 500 1000 | 0.9921 0.9917 | 1.5314 1.5311 | 0.0053 0.0036 | 0.3081 0.2960 |
υ 3 ( 0 ) = 1 | 500 1000 | 1.0230 1.0279 | 1.3980 1.4030 | 0.0061 0.0049 | 0.1803 0.1750 |
表1. ν = 3 的模拟结果
参数 | N | EST1 | EST2 | MSE1 | MSE2 |
---|---|---|---|---|---|
π 1 ( 0 ) = 0.5 | 500 1000 | 0.4974 0.4976 | 0.4998 0.5001 | 0.0000 0.0000 | 0.0000 0.0000 |
π 2 ( 0 ) = 0.3 | 500 1000 | 0.2984 0.2979 | 0.3019 0.3013 | 0.0001 0.0001 | 0.0001 0.0001 |
μ 1 ( 0 ) = 2 | 500 1000 | 1.9840 1.9881 | 1.9967 2.0018 | 0.0045 0.0025 | 0.0044 0.0023 |
μ 2 ( 0 ) = 7 | 500 1000 | 6.9485 6.9493 | 7.0102 7.0114 | 0.0119 0.0084 | 0.0100 0.0056 |
μ 3 ( 0 ) = 11 | 500 1000 | 10.9590 10.9515 | 11.0054 10.9984 | 0.0174 0.0124 | 0.0171 0.0088 |
υ 1 ( 0 ) = 1 | 500 1000 | 0.9816 0.9855 | 1.0127 1.0172 | 0.0022 0.0013 | 0.0029 0.0015 |
υ 2 ( 0 ) = 1 | 500 1000 | 0.9921 0.9917 | 1.0407 1.0391 | 0.0053 0.0036 | 0.0124 0.0042 |
υ 3 ( 0 ) = 1 | 500 1000 | 1.0230 1.0279 | 1.0116 1.0158 | 0.0061 0.0049 | 0.0099 0.0059 |
表2. ν = 15 的模拟结果
参数 | N | EST1 | EST2 | MSE1 | MSE2 |
---|---|---|---|---|---|
π 1 ( 0 ) = 0.5 | 500 1000 | 0.4974 0.4976 | 0.4998 0.5001 | 0.0000 0.0000 | 0.0000 0.0000 |
π 2 ( 0 ) = 0.3 | 500 1000 | 0.2984 0.2979 | 0.3011 0.3005 | 0.0001 0.0001 | 0.0001 0.0001 |
μ 1 ( 0 ) = 2 | 500 1000 | 1.9840 1.9881 | 1.9965 2.0013 | 0.0045 0.0025 | 0.0043 0.0023 |
μ 2 ( 0 ) = 7 | 500 1000 | 6.9485 6.9493 | 7.0044 7.0059 | 0.0119 0.0084 | 0.0098 0.0054 |
μ 3 ( 0 ) = 11 | 500 1000 | 10.9590 10.9515 | 11.0012 10.9949 | 0.0174 0.0124 | 0.0168 0.0088 |
υ 1 ( 0 ) = 1 | 500 1000 | 0.9816 0.9855 | 1.0008 1.0053 | 0.0022 0.0013 | 0.0027 0.0013 |
υ 2 ( 0 ) = 1 | 500 1000 | 0.9921 0.9917 | 1.0161 1.0150 | 0.0053 0.0036 | 0.0098 0.0047 |
υ 3 ( 0 ) = 1 | 500 1000 | 1.0230 1.0279 | 1.0000 1.0040 | 0.0061 0.0049 | 0.0094 0.0054 |
表3. ν = 30 的模拟结果
注:EST1:混合高斯分布模型下的平均估计值。EST2:混合t-分布模型下的平均估计值。MSE1:混合高斯分布模型参数估计的均方误差。MSE2:混合t-分布模型参数估计的均方误差。
参数 | N | EST1 | EST2 | MSE1 | MSE2 |
---|---|---|---|---|---|
π 1 ( 0 ) = 0.5 | 500 1000 | 0.4742 0.4792 | 0.4888 0.4952 | 0.0047 0.0024 | 0.0047 0.0019 |
π 2 ( 0 ) = 0.3 | 500 1000 | 0.3119 0.3099 | 0.3021 0.3015 | 0.0018 0.0010 | 0.0013 0.0006 |
μ 1 ( 0 ) = 2 | 500 1000 | 1.7448 1.7567 | 1.9529 1.9369 | 0.5765 1.0027 | 0.2529 0.2239 |
μ 2 ( 0 ) = 7 | 500 1000 | 6.7244 6.7962 | 6.8751 6.9595 | 0.5162 0.2137 | 0.4994 0.2074 |
μ 3 ( 0 ) = 11 | 500 1000 | 11.1080 11.1236 | 10.9223 10.9733 | 0.3646 0.1072 | 0.2360 0.0816 |
υ 1 ( 0 ) = 1.7321 ( σ 1 ( 0 ) = 1 ) | 500 1000 | 1.3999 1.4025 | 1.7257 1.7216 | 0.2390 0.1964 | 0.0497 0.0184 |
υ 2 ( 0 ) = 1.7321 ( σ 2 ( 0 ) = 1 ) | 500 1000 | 1.2354 1.2257 | 1.7236 1.7178 | 0.5135 0.4336 | 0.0814 0.0352 |
υ 3 ( 0 ) = 1.7321 ( σ 3 ( 0 ) = 1 ) | 500 1000 | 1.4238 1.4863 | 1.7759 1.7539 | 0.2652 0.4228 | 0.1942 0.0740 |
表4. ν = 3 的模拟结果
参数 | N | EST1 | EST2 | MSE1 | MSE2 |
---|---|---|---|---|---|
π 1 ( 0 ) = 0.5 | 500 1000 | 0.4953 0.4964 | 0.4995 0.5007 | 0.0006 0.0003 | 0.0006 0.0003 |
π 2 ( 0 ) = 0.3 | 500 1000 | 0.2979 0.2987 | 0.2995 0.2996 | 0.0005 0.0003 | 0.0006 0.0003 |
μ 1 ( 0 ) = 2 | 500 1000 | 1.9711 1.9724 | 2.0004 1.9369 | 0.0056 0.0031 | 0.0047 0.0022 |
μ 2 ( 0 ) = 7 | 500 1000 | 6.9158 6.9216 | 6.9948 6.9982 | 0.0356 0.0121 | 0.0326 0.0058 |
μ 3 ( 0 ) = 11 | 500 1000 | 10.9621 10.9658 | 10.9958 10.9935 | 0.0270 0.0118 | 0.0291 0.0101 |
υ 1 ( 0 ) = 1.0742 ( σ 1 ( 0 ) = 1 ) | 500 1000 | 1.0343 1.0337 | 1.0716 1.0717 | 0.0041 0.0030 | 0.0036 0.0019 |
υ 2 ( 0 ) = 1.0742 ( σ 2 ( 0 ) = 1 ) | 500 1000 | 1.0198 1.0250 | 1.0700 1.0720 | 0.0085 0.0060 | 0.0132 0.0062 |
υ 3 ( 0 ) = 1.0742 ( σ 3 ( 0 ) = 1 ) | 500 1000 | 1.0713 1.0702 | 1.0715 1.0753 | 0.0079 0.0041 | 0.0156 0.0068 |
表5. ν = 15 的模拟结果
参数 | N | EST1 | EST2 | MSE1 | MSE2 |
---|---|---|---|---|---|
π 1 ( 0 ) = 0.5 | 500 1000 | 0.4954 0.4969 | 0.4992 0.5002 | 0.0009 0.0003 | 0.0006 0.0003 |
π 2 ( 0 ) = 0.3 | 500 1000 | 0.2988 0.2980 | 0.2999 0.2999 | 0.0006 0.0003 | 0.0006 0.0003 |
μ 1 ( 0 ) = 2 | 500 1000 | 1.9782 1.9820 | 1.9990 2.0005 | 0.0071 0.0031 | 0.0056 0.0029 |
μ 2 ( 0 ) = 7 | 500 1000 | 6.9239 6.9310 | 6.9908 6.9984 | 0.0825 0.0121 | 0.0800 0.0166 |
μ 3 ( 0 ) = 11 | 500 1000 | 10.9558 10.9549 | 10.9939 10.9908 | 0.0354 0.0118 | 0.0350 0.0116 |
υ 1 ( 0 ) = 1.0351 ( σ 1 ( 0 ) = 1 ) | 500 1000 | 1.0085 1.0098 | 1.0313 1.0331 | 0.0042 0.0030 | 0.0033 0.0024 |
υ 2 ( 0 ) = 1.0351 ( σ 2 ( 0 ) = 1 ) | 500 1000 | 1.0116 1.0066 | 1.0309 1.0284 | 0.0113 0.0060 | 0.0110 0.0047 |
υ 3 ( 0 ) = 1.0351 ( σ 3 ( 0 ) = 1 ) | 500 1000 | 1.0484 1.0487 | 1.0317 1.0337 | 0.0102 0.0041 | 0.0168 0.0053 |
表6. ν = 30 的模拟结果
υ 2 、 υ 3 外,混合t-分布模型参数估计的均方误差比混合高斯分布模型参数估计的均方误差小;在 ν = 30 时,除 υ 3 外,混合t-分布模型参数估计的均方误差均比混合高斯分布模型参数估计的均方误差小。此外,随着自由度的增大,混合t-分布模型参数估计的均方误差变小;整体来看,样本量越大,MSE越小,估计结果越好。
混合t-分布模型相对于混合高斯模型有着较好的稳健性,这种稳健性尤其体现在对重尾数据(含噪声点、异常点数据)的处理。而处理重尾数据的另一种方法是在高斯分布的基础上添加一个均匀分布的成分 [
由表7、表8知:
通过比较两种模型下参数的估计结果和均方误差我们可以得到,混合t-分布模型对该类型数据拟合的较好,尤其对混合比例、位置参数的估计都较混合高斯分布模型估计的效果好。而对于尺度参数的估计,混合高斯模型拟合下得到的参数的均方误差略小,但相差不大。因此相对于混合高斯分布,混合t-分布模型可以更好的拟合含噪声的混合高斯数据,这也正说明了混合t-分布模型较于混合高斯模型能够更好地处理重尾数据。
参数 | EST1 | EST2 | MSE1 | MSE2 |
---|---|---|---|---|
π 1 = 0.5 | 0.4911 | 0.4944 | 0.0001 | 0.0001 |
π 2 = 0.3 | 0.2988 | 0.3001 | 0.0001 | 0.0001 |
μ 1 = 2 | 1.9774 | 1.9960 | 0.0031 | 0.0026 |
σ 1 = 1 | 1.0187 | 1.0426 | 0.0019 | 0.0038 |
μ 2 = 7 | 6.9379 | 7.0000 | 0.0100 | 0.0057 |
σ 2 = 1 | 1.0246 | 1.0412 | 0.0046 | 0.0075 |
μ 3 = 11 | 10.9821 | 11.0173 | 0.0118 | 0.0101 |
σ 3 = 1 | 1.0699 | 1.0543 | 0.0098 | 0.0110 |
表7. 含噪声5%的混合高斯数据
参数 | EST1 | EST2 | MSE1 | MSE2 |
---|---|---|---|---|
π 1 = 0.5 | 0.4841 | 0.4885 | 0.0003 | 0.0002 |
π 2 = 0.3 | 0.3005 | 0.2994 | 0.0001 | 0.0001 |
μ 1 = 2 | 1.9663 | 1.9914 | 0.0044 | 0.0030 |
σ 1 = 1 | 1.0483 | 1.0776 | 0.0042 | 0.0086 |
μ 2 = 7 | 6.9231 | 6.9857 | 0.0122 | 0.0062 |
σ 2 = 1 | 1.0624 | 1.0674 | 0.0086 | 0.0111 |
μ 3 = 11 | 11.0148 | 11.0341 | 0.0144 | 0.0120 |
σ 3 = 1 | 1.1078 | 1.1083 | 0.0172 | 0.0226 |
表8. 含噪声10%的混合高斯数据
本文主要研究了一元混合t-分布模型,给出了EM算法下该模型参数的极大似然估计,并在模拟的三种类型的数据下与混合高斯模型进行了对比分析。从前两类数据的模型参数估计结果中可以看出,每个子分布的自由度固定且取相同的值的情况下,对于混合高斯数据,当自由度的取值足够大时,基于混合t-分布模型的EM算法的参数估计结果并不比基于混合高斯模型的EM算法差;对于混合t-分布数据,基于混合t-分布模型的EM算法能够得到较好的估计结果并优于基于混合高斯模型的EM算法的估计结果,且随着自由度的增大,效果会更好;而在第三类含噪声的混合高斯分布数据下,整体而言,混合t-分布模型比混合高斯分布模型拟合效果更好,说明了混合t-分布模型在处理重尾数据上更具优势。以上结果验证了本文研究的模型和方法的有效性。
国家自然科学基金(11601150);国家自然科学基金(U1430103);中央高校基本科研业务费专项资金资助(2016MS62)。
王小英,李迎华,杨雪梅. 不同类型数据下混合模型参数估计效果的对比研究 Comparative Study on Effects of Parameter Estimation of Mixture Models under Different Types of Data[J]. 统计学与应用, 2017, 06(04): 482-491. http://dx.doi.org/10.12677/SA.2017.64054
https://doi.org/10.1093/biomet/80.2.267
https://doi.org/10.1023/A:1008981510081
https://doi.org/10.1016/S0031-3203(01)00080-2
https://doi.org/10.1007/s11634-010-0065-4