方差分析中的贝叶斯估计问题研究

doi:10.12677/SA.2017.65057

期刊菜单

方差分析中的贝叶斯估计问题研究
Bayesian Estimation Study in Variance Analysis Model

DOI: 10.12677/SA.2017.65057, PDF, HTML, XML, 下载: 1,782 浏览: 5,036
作者: 孙舒曼^*, 腾德雄, 胡锡健：新疆大学数学与系统科学学院，新疆乌鲁木齐
关键词: 方差分析模型；贝叶斯估计；无信息先验分布；后验分布；Variance Analysis Model； Bayesian Estimation； No Prior Distribution of Information； Posterior Distribution

摘要: 贝叶斯估计是一种简单的参数估计方法，是通过已经知道的数据来估计未知参数的先验分布的方法，这使得贝叶斯估计能充分的利用先验信息得到更合理的估计结果。本文先介绍贝叶斯估计方法的背景和思路，再用贝叶斯估计方法得到方差分析模型中参数估计的具体表达式，通过编程进行数值模拟求解，并进行实例分析。

Abstract: Bayesian estimation is a simple parameter estimation method through the already known data to estimate the unknown parameters of the prior distribution method, which makes the bayesian estimation can make full use of prior information to get a more reasonable estimate results. This paper first introduces the background of the bayesian estimation method and train of thought, and then uses bayesian estimation method to get the concrete expression of the parameter estimation in the analysis of variance model, numerical simulations by programming to solve. At the same time, applying bayesian estimation method is analyzed in the analysis of variance model.

文章引用：孙舒曼, 腾德雄, 胡锡健. 方差分析中的贝叶斯估计问题研究[J]. 统计学与应用, 2017, 6(5): 508-515. https://doi.org/10.12677/SA.2017.65057

1. 引言

1.1. 研究背景及现状

贝叶斯理论，是由英国数学家贝叶斯(Thomas Bayes，1701年~1761年)通过一篇论文“有关随机问题的求解”开始出现的，但开始时它的思想并没有得到重视，直到数学家拉普拉斯(Laplace)用贝叶斯方法重新发现了贝叶斯定理，并导出重要的“相继律”，贝叶斯思想才慢慢地受到人们的重视，形成今天的贝叶斯理论，并广泛应用于数学、工程等领域 [1] 。其中在数学领域里，贝叶斯估计是贝叶斯理论的一个重要组成部分，并广泛的应用于参数估计问题中，其中1992年廖文等 [2] 就写出了书籍《贝叶斯统计学、原理、模型及应用》；1995年，未来生 [3] 写了《方差分析中参数的经验贝叶斯估计及其优良性问题》的论文，介绍经验贝叶斯方法用在了贝叶斯估计中；2007年，王松桂 [4] 等出书《线性模型引论》，介绍线性模型的基础估计研究，并有细致推导；2010年，李琪琪，未来生等 [5] 发表论文《半参数回归模型中参数的贝叶斯估计》，将贝叶斯估计运用到了半参数回归模型。

由于贝叶斯估计是先通过分析已知的过去数据得到先验分布，再通过先验分布得到参数的后验分布，因此，通过贝叶斯估计得到的参数估计值会比一般估计值更精确、更合理，这一理论已经被很多统计学者通过模拟比较得到证实，2007年，霍涉云，张伟平等 [6] 发表论文《一类线性模型参数的贝叶斯估计及其优良性》。因此在本文就不做比较论证。本文主要是将贝叶斯估计运用到方差分析模型的参数估计中，并将理论与Gibbs抽样方法结合通过数值模拟得到相对精确是贝叶斯估计值。同时，将此方法运用到实际问题中进行实例分析。

1.2. 贝叶斯估计的预备知识

贝叶斯估计运用在参数估计中的思路如下：

思路：假设有一组数据 $x = (x_{1}, x_{2}, \dots, x_{n})$ ，其样本的似然函数为 $f (x | θ)$ ，其中参数是 $θ = (θ_{1}, θ_{2}, \dots, θ_{k})$ ，经典统计学派的思想是：假设 $θ$ 是可由 $x$ 估计的参数向量；而对于贝叶斯学派的观点是：认为参数向量 $θ$ 本身就服从先验分布 $π (θ | η)$ 且 $η$ 被称为是超参数，得到：

$π (θ | x, η) = \frac{f (x | θ) π (θ | η)}{\int f (x | v) π (v | η) d v} = \frac{f (x | θ) π (θ | η)}{m (x | η)}$

其中 $m (x | η)$ 是 $x$ 的边际分布， $π (θ | x, η)$ 是后验分布。

这时作为 $θ$ 的估计可选用后验分布 $π (θ | x, η)$ 的某个位置特征量(即：最大值，中位数和期望值)。其中，由后验分布的任意一个位置特征量求得的估计都被称为是 $θ$ 的贝叶斯估计，记为 ${\hat{θ}}_{B}$ ，有时也被记为 $\hat{θ}$ 。(注：在一般情况下这三种贝叶斯估计是不同的，所以使用时是按照实际情况选择其中更合适的估计，但是由于正态分布的对称性可以知道，对于正态分布来说， $θ$ 的三种贝叶斯估计值都是相等的)。

2. 模型系数的贝叶斯估计

将线性模型矩阵化如下：

$(\begin{matrix} y_{11} \\ ⋮ \\ y_{1 n} \\ ⋮ \\ y_{r 1} \\ ⋮ \\ y_{r n} \end{matrix}) = (\begin{matrix} 1_{n_{1}} \\ 1_{n_{2}} \\ ⋮ \\ ⋮ \\ ⋮ \\ 1_{n_{r - 1}} \\ 1_{n_{r}} \end{matrix}) * μ + (\begin{matrix} 1_{n} & 0 & \dots & \dots & \dots & 0 & 0 \\ 0 & 1_{n} & 0 & \dots & \dots & 0 & ⋮ \\ 0 & 0 & ⋱ & ⋱ & ⋮ & ⋮ \\ ⋮ & ⋮ & ⋱ & ⋱ & ⋱ & ⋮ & ⋮ \\ ⋮ & ⋮ & ⋱ & ⋱ & 0 & ⋮ \\ 0 & 0 & \dots & \dots & 0 & 1_{n} & 0 \\ 0 & 0 & \dots & \dots & \dots & 0 & 1_{n} \end{matrix}) * (\begin{matrix} α_{1} \\ α_{2} \\ ⋮ \\ ⋮ \\ ⋮ \\ α_{r - 1} \\ α_{r} \end{matrix}) + (\begin{matrix} ε_{11} \\ ⋮ \\ ε_{1 n} \\ ⋮ \\ ε_{r 1} \\ ⋮ \\ ε_{r n} \end{matrix})$

其中 $1_{i} = {(1, 1, \dots, 1)}^{'}$ 是一个 $i \times 1$ 的全 $1$ 列向量，且 $n_{1} = n_{2} = \dots = n_{r - 1} = n_{r} = r$

设 $N = r * n$ 。

故将单因素方差分析模型表示成了线性模型的一般形式：

$y = x μ + A α + ε$

其中 $ε ~ N (0, σ_{ε}^{2} I_{N})$ ， $α ~ N (0, σ_{α}^{2} I_{r})$ 且 $μ$ 和 $α = (α_{1}, α_{2}, \dots, α_{r})$ 为参数，则 $y ~ N (x μ + A α, σ_{ε}^{2} I_{N})$ 。

故 $y$ 在参数 $μ, α, σ_{ε}^{2}$ 下的似然函数为：

$L (y | μ, α, σ_{ε}^{2}) = \frac{1}{{(\sqrt{2 π} σ_{ε})}^{N}} * \exp {- \frac{1}{2 σ_{ε}^{2}} {(y - x μ - A α)}^{'} (y - x μ - A α)}$

假设参数 $σ_{ε}^{2}, μ, α$ 相互独立，且参数的先验分布函数为：

$π (μ) = c_{1}$ , $π (α) = c_{2}$ , $π (σ_{ε}^{2}) = \frac{1}{σ_{ε}^{2}}$

其中 $c_{1}$ 和 $c_{2}$ 为常数。

则参数 $σ_{ε}^{2}$ 的联合密度函数为：

$\begin{matrix} h (y, μ, α | σ_{ε}^{2}) = \frac{1}{σ_{ε}^{2}} * L (y | μ, α, σ_{ε}^{2}) \\ = \frac{1}{σ_{ε}^{2}} * \frac{1}{{(\sqrt{2π} σ_{ε})}^{N}} * \exp {- \frac{1}{2 σ_{ε}^{2}} {(y - x μ - A α)}^{'} (y - x μ - A α)} \end{matrix}$

由贝叶斯公式可求得参数 $σ_{ε}^{2}$ 的联合后验分布为：

$\begin{matrix} π (σ_{ε}^{2} | y, μ, α) = \frac{h (y, μ, α | σ_{ε}^{2})}{\int h (y, μ, α | σ_{ε}^{2}) d σ_{ε}^{2}} \\ \propto {(σ_{ε}^{2})}^{- (\frac{N}{2} + 1)} * \exp {- \frac{1}{σ_{ε}^{2}} [\frac{{(y - x μ - A α)}^{'} (y - x μ - A α)}{2}]} \end{matrix}$ (1-1)

(1-1)式恰好为倒Gamma分布密度函数 $\frac{1}{σ_{ε}^{2}} * \frac{1}{{(\sqrt{2π} σ_{ε})}^{N}} * \exp {- \frac{1}{2 σ_{ε}^{2}} {(y - x μ - A α)}^{'} (y - x μ - A α)}$ 的核即：

$π (σ_{ε}^{2} | y, μ, α) ~ I G (\frac{N}{2}, \frac{1}{2} {(y - x μ - A α)}^{'} (y - x μ - A α))$

又由正态变量的二次型可知有：

$μ^{'} x^{'} {(σ_{ε}^{2} I_{n})}^{- 1} x μ = μ^{'} Σ_{μ}^{- 1} μ$

$\Rightarrow Σ_{μ} = σ_{ε}^{2} {(x^{'} x)}^{- 1}$

将 $Σ_{μ}$ 代入下式：

$μ^{'} x^{'} {(σ_{ε}^{2} I_{n + r})}^{- 1} (y - A α) = μ^{'} Σ_{μ}^{- 1} α_{μ}$

$\Rightarrow α_{μ} = {(x^{'} x)}^{- 1} x^{'} (y - A α)$

得到参数 $μ$ 的满条件后验分布为：

$π (μ | y, α, σ_{ε}^{2}) ~ N ({(x^{'} x)}^{- 1} x^{'} (y - A α), σ_{ε}^{2} {(x^{'} x)}^{- 1})$ (1-2)

又由正态变量的二次型可知有：

$α^{'} A^{'} {(σ_{ε}^{2} I_{n})}^{- 1} A α + α^{'} {(σ_{α}^{2} I_{r})}^{- 1} α = α^{'} Σ_{α}^{- 1} α$

$\Rightarrow Σ_{α} = {(\frac{1}{σ_{ε}^{2}} A^{'} A + \frac{1}{σ_{α}^{2}} I_{r})}^{- 1}$

将 $Σ_{α}$ 代入下式：

$α^{'} A^{'} {(σ_{ε}^{2} I_{n + r})}^{- 1} (y - x μ) = α^{'} Σ_{α}^{- 1} v$

$\Rightarrow v = {(A^{'} A + \frac{σ_{ε}^{2}}{σ_{α}^{2}} I_{r})}^{- 1} A^{'} (y - x μ)$

其中 $v = D α$ ，且 $0 < D α < 1$ 。

得到参数 $α$ 的满条件后验分布为：

$π (α | y, σ_{ε}^{2}, σ_{α}^{2}) ~ N ({(A^{'} A + \frac{σ_{ε}^{2}}{σ_{α}^{2}} I_{r})}^{- 1} A^{'} (y - x μ), {(\frac{1}{σ_{ε}^{2}} A^{'} A + \frac{1}{σ_{ε}^{2}} I_{r})}^{- 1})$ (1-3)

从上面的结果得到，参数和 $α$ 的满条件后验分布都是不常见的概率分布，本文采用Gibbs抽样的方法来抽取。

又 $α$ 在参数 $σ_{α}^{2}$ 下的似然函数为：

$L (α | σ_{α}^{2}) = \frac{1}{{(\sqrt{2 π} σ_{α})}^{r}} * \exp {- \frac{1}{2 σ_{α}^{2}} (α^{'} α)}$

假设参数 $σ_{α}^{2}$ 的先验分布函数为：

$π (σ_{α}^{2}) = \frac{1}{σ_{α}^{2}}$

则参数 $α$ 的联合密度函数为：

$h (α | σ_{α}^{2}) = \frac{1}{σ_{α}^{2}} * L (α | σ_{α}^{2}) = \frac{1}{σ_{α}^{2}} * \frac{1}{{(\sqrt{2π} σ_{α})}^{r}} * \exp {- \frac{1}{2 σ_{α}^{2}} (α^{'} α)}$

又由贝叶斯估计的公式可求得参数 $σ_{α}^{2}$ 的联合后验分布函数为：

$\begin{matrix} π (σ_{α}^{2} | α) = \frac{h (α | σ_{α}^{2})}{\int h (α | σ_{α}^{2}) d σ_{α}^{2}} \\ \propto \frac{1}{σ_{α}^{2}} * \frac{1}{{(\sqrt{2π} σ_{α})}^{r}} * \exp {- \frac{1}{2 σ_{α}^{2}} (α^{'} α)} \\ \propto {(σ_{α}^{2})}^{- (\frac{r}{2} + 1)} * \exp {- \frac{1}{σ_{α}^{2}} (\frac{α^{'} α}{2})} \end{matrix}$ (1-4)

(1-4)式恰好为倒Gamma分布密度函数的核即：

$π (σ_{α}^{2} | α) ~ I G (\frac{r}{2}, \frac{1}{2} α^{'} α)$

故由上可得方差分析模型中参数的后验分布函数为：

$π (σ_{α}^{2} | α) ~ I G (\frac{r}{2}, \frac{1}{2} α^{'} α)$

$π (σ_{ε}^{2} | y, μ, α) ~ I G (\frac{N}{2}, \frac{1}{2} {(y - x μ - A α)}^{'} (y - x μ - A α))$

$π (μ | y, α, σ_{ε}^{2}) ~ N ({(x^{'} x)}^{- 1} x^{'} (y - A α), σ_{ε}^{2} {(x^{'} x)}^{- 1})$

$π (α | y, σ_{ε}^{2}, σ_{α}^{2}) ~ N ({(A^{'} A + \frac{σ_{ε}^{2}}{σ_{α}^{2}} I_{r})}^{- 1} A^{'} (y - x μ), {(\frac{1}{σ_{ε}^{2}} A^{'} A + \frac{1}{σ_{α}^{2}} I_{r})}^{- 1})$

3. 方差分析中的贝叶斯估计的数值模拟

3.1. 算法步骤

1) 分别给定参数 $μ$ 和 $α$ 的初值，以及参数假定 $ε ~ N (0, σ_{ε}^{2} I_{n})$ ；

2) 随机生成一组随机误差的值 $ε ~ N (0, 1)$ ；

3) 通过单因素方差分析模型： $y = x μ + A α + ε$ ，得到1组随机生成的 $y$ 值；

4) 此时，在方差分析模型中我们已随机生成一组样本 $y$ ，下面通过样本求解参数 $μ, α$ 和 $σ_{ε}^{2}$ 的估计值；

5) 用MCMC方法求解贝叶斯的参数估计问题，其中用Gibbs抽样方法从参数 $σ_{α}^{2}$ 和 $σ_{α}^{2}$ 的满条件分布核中抽样，不断更新参数 $μ, α, σ_{α}^{2}$ 和 $σ_{e}^{2}$ ，重复此步骤 $n$ 次，得到 $n$ 组参数的抽样值，取出后面 $n - m$ 项并分别对其求均值输出，此处 $n$ 和 $m$ 分别取5000和2500；

6) 将(2)~(5)步骤重复 $s$ 次，则可得到 $s$ 组有关参数的抽样均值；

7) 将这 $s$ 组参数的抽样均值再求期望，并与原假设数据做均方差矩阵MSEM的值；

8) 分别取 $s$ 等于10和50求解参数估计的值。

3.2. 模拟的结果及分析

设定单因素方差分析模型： $y = x μ + A α + ε$ 中的参数的真值分别为： $α = {(α_{1}, α_{2}, α_{3}, α_{4})}^{'} = {(1, 0.2, 2, 0.6, 0, 0.8, 0.1, 1, 2, 0, - 2, - 0.6, - 0.1, 0, - 0.02, - 0.8, - 1, - 1, 0, - 2)}^{'}$ ， $μ = 5$ 设 $x_{(i)}$ 是 $i * 1$ 的全1列向量，则 $x$ 为 $x_{(2000)}$ 即为 $2000 * 1$ 的全1列向量， $A$ 是 $2000 * 20$ 的矩阵有A = kronecker(diag(20)， $x_{(2000)}$ )，再随机生成1个 $ε = (ε_{1}, ε_{2}, \dots, ε_{2000})$ 其中有 $ε_{i} ~ N (0, 1)$ ，循环上面过程 $s$ 次，得到 $s$ 组 $y$ 值，再用每组 $y$ 值经过5000次抽样求解参数 $μ, α$ 和 $σ_{e}$ 的贝叶斯估计，最后求得估计均值见表1。

表1充分的显示出贝叶斯估计与真值的近似程度很高，并且具有很好的优良性和有效性。

4. 实例分析

为研究人们在催眠状态下对各种情绪的反应是否有差异，选取了8个受试者。在催眠状态下，要求每人按任意次序做出恐惧，愉快，忧虑和平静4种反应。表2给出了各受试者在处于这4种情绪状态下皮肤的电位变化值。试在 $α = 0.05$ 下，检验受试者在催眠状态下对这4种情绪的反应力是否有显著差异。

Table 1. The simulated results of bayesian estimation are obtained from a random generated value with 50 and 100

表1. 对50和100个随机生成的 $y$ 值求解贝叶斯估计的模拟结果

Table 2. The potential change value of skin under four emotional states (mV)

表2. 4种情绪状态下皮肤的电位变化值(mV)

对于上面的问题建立方差分析模型：

$y = x μ + A α + ε$

其中：

$\begin{matrix} y = (23.1, 57.6, 10.5, 23.6, 11.9, 54.6, 21.0, 20.3, 22.7, 53.2, 9.7, 19.6, 13.8, 47.1, 13.6, 23.6, \\ 22.5, 53.7, 10.8, 21.1, 13.7, 39.2, 13.7, 16.3, 22.6, 53.1, 8.3, 21.6, 13.3, 37.0, 14.8, 14.8) \end{matrix}$

$x$ 为32 × 1的全1列向量，A为kronecker(diag(4),array(d,dim=c(8,1)))一个32 × 4的矩阵，则下面通过R程序得以下结果：

$μ = 25.1489461$ , $σ_{ε}^{2} = 15.7876821$

$α_{1} = 0.05077693$ , $α_{2} = - 0.011519118$ , $α_{3} = - 0.005867851$ , $α_{4} = - 0.008307687$

下面检验受试者在催眠状态下对这4种情绪的反应力是否有显著差异， $α = 0.05$

假设原假设为： $H_{0} : α_{1} - α_{2} = α_{1} - α_{3} = α_{1} - α_{4} = 0$

则可知：

$p (α_{1}, α_{2}) = 0.01513101 < 0.025$

$p (α_{1}, α_{3}) = 0.04791839 < 0.025$

$p (α_{1}, α_{4}) = 0.06331945 > 0.025$

由上式可知在 $α = 0.05$ 的拒绝区间下，应拒绝原假设，得到结论是受试者在催眠状态下对这4种情绪的反应力有显著差异。

5. 总结及展望

通过将贝叶斯估计运用到单因素方差分析模型中的数值模拟，可以发现贝叶斯估计的优良性和高度的近似性，用在实例分析中也简单易懂。再通过对单因素方差分析模型的研究，可以将贝叶斯估计推广到多因素方差分析模型的研究中。同时也可以经验贝叶斯估计运用在单因素方差分析和多因素方差分析模型的研究，也将是一个新的挑战。

map

参考文献

[1]	Hsu, J.C. (1992) Simultaneous Inference with Respect to the Best Treatment in Block Designs. Journal of the American Statistical, 6, 107-125.
[2]	Press, S.J. 贝叶斯统计学, 原理, 模型及应用[M]. 廖文, 陈安贵, 等, 译. 北京: 中国统计出版社, 1992: 187-242.
[3]	韦来生. 方差分析模型中参数的经验Bayes估计及其优良性问题[N]. 高校应用数学学报, 1995, 12(2): 163-174.
[4]	王松桂, 史建红, 尹素菊, 吴密霞. 线性模型引论[M]. 北京: 科学出版社, 2007: 55-74.
[5]	李琪琪, 韦来生. 半参数回归模型中参数的Bayes估计[J]. 中国科学技术大学学报, 2010(9): 881-886.
[6]	霍涉云, 张伟平, 韦来生. 一类线性模型参数的Bayes估计及其优良性[J]. 中国科学技术大学学报, 2007(7): 773-776, 802.

为你推荐

友情链接