2. 基于SPAC-Lasso变量选择过程
假设模型(1.1)中的回归系数
是稀疏的,即与响应变量相关的重要协变量很少,其对应的系数不为零。进一步设重要协变量的个数为q,则当
时
,当
时
。类似XUE和QU
[6]
,定义响应变量Y与第k个协变量
之间的SPAC如下:
(2.1)
其中
是矩阵
的第k个对角线元素,
表示
的协方差矩阵。注意到
当且仅当
,
,所以我们可以通过识别
是否为零来进行选择模型的重要协变量。由(2.1)可知
,
,进而再由模型(1.1)可得:
(2.2)
记
,则
的惩罚估计
可以通过最小化如下带惩罚的目标函数得到:
(2.3)
其中
是
的相合估计量。注意到
以及
,则可以利用矩估计方法给出
的估计,进而得到
的估计。进一步,如果惩罚函数
取为Lasso惩罚,则
的Lasso惩罚估计量定义为:
(2.4)
进一步记
,
,则(2.3)式中的惩罚似然函数可进一步改写为:
并且结合(2.4)式可得
SPAC-Lasso估计量如下:
3. 渐进性质及证明
为表述方便,设
的前q个元素为模型的重要协变量,记为
,并且
的后
个元素为不重要协变量,记为
。进一步,记
,
,且矩阵
可以划分为以下块结构:
(3.1)
类似XUE和QU
[6]
,
假定满足如下条件,即存在一个正常向量
使得:
(3.2)
其中
,
,1是1的
向量,
表示取每个元素的绝对值。Bunea
[7]
和Blazere
[8]
在设计矩阵上提出了如下Stabil条件:对于
,记限制集为
,那么对于任何
,则存在
使得协方差矩阵满足:
(3.3)
另外为了得到SPAC-Lasso的变量选择相合性和正则估计的收敛速度,还需要一些正则性条件。
(C1) 存在常数
使得:
(C2) 存在一个常数
使得
。
(C3)
的特征值有界且均大于零。
(C4) 存在一个常数
和一个包含
的开子集
,使得
对所有
和几乎所有
都成立,其中
表示
的三阶导数。
(C5) 当
,假设
和
。
(C6) 对于任何常数
,存在常数
使得:
条件(C1)~(C4)是广义线性模型的正则性条件
[3]
-
[5]
,详见WANG和TIAN
[2]
、CUI
[5]
、Bunea
[7]
、Blazere
[8]
、FAN和PENG
[9]
。条件(C5)是证明主要定理所必需的,在其它文献中也很常见,如PENG
[10]
和VandeGeer
[11]
等人的条件(C6)假定了精度矩阵元素的估计量
的收敛速度,该条也类似XUE和QU
[6]
和PENG
[8]
的情况。如下定理3.1表明所提出的SPAC-Lasso方法可以得到参数
的相合估计,并给出了正则估计的收敛速度。
定理3.1假设正则性条件(C1)~(C6)成立,那么在条件(3.2)和(3.3)下,估计量
满足:
其中
且
。
证明:根据
的定义和文献
[8]
,我们有:
通过将
加到上述不等式的两侧并重新排列,我们得到:
(3.4)
根据文献
[3]
引理3.2,我们可以证明:
在事件
上成立。然后,可以将不等式(3.4)重写为:
(3.5)
请注意,
。否则,
基于三角不等式成立。因此,(3.5)式的不等式界可以是:
(3.6)
根据第二节中
的定义,我们有
,并且:
通过简单的代数,我们有:
(3.7)
也就是说,
。
接下来,我们将给出
的下界。结合二阶泰勒展开式和文献
[5]
中
的定义,以及条件(C6),我们得到了:
其中
是
和
之间的中间点,
,
。
我们得到了:
(3.8)
结合对于所有
的
的事实,(3.8)更进一步展示:
(3.9)
在(3.9)式中用
替换t,我们有:
(3.10)
根据条件(C2)、(C5)和(C6),存在常数
使得
,则:
至此,我们完成了定理3.1的证明。
如下定理3.2表明所提出的SPAC-Lasso方法可以依概率趋于1,正确地选择出真模型。
定理3.2 假设正则性条件(C1)~(C6)成立,那在(3.2)式和(3.3)式中,则以至少
的概率有:
。
证明:以至少
的概率存在下列受限问题的解
。
(3.11)
其中
。
事实上,对任意常数
和向量
,
,最后
个元素
。
设
和
分别是h和
的第q元素。根据伯恩斯坦不等式,存在一个常数
使得:
因此,通过文献
[7]
引理6.3和条件(C3)和(C6),存在常数
,使得:
如果我们取上述不等式的
,其中
,则:
保持概率至少为
,也就是说,存在
的局部极小值。
接下来证明以至少
的概率有:
,据定理3.2和条件(C5),我们有:
在定理3.2相同的条件下,则(3.11)式的解满足:
我们有:
(3.12)
保持概率至少为
。根据条件(C3)~(C6)和三角不等式,存在一个常数
,使得(3.12)式中第三项的绝对值在
上有界,概率至少为
。
至此,我们完成了定理3.2的证明。