sa
Statistics and Application
2325-2251
2325-226X
beplay体育官网网页版等您来挑战!
10.12677/sa.2024.134128
sa-94388
Articles
数学与物理
POT-SGEL模型在金融极端尾部风险中的应用
Application of the POT-SGEL Model to Financial Extreme Tail Risk
周晓娅
重庆对外经贸学院,数学与计算机学院,重庆
05
08
2024
13
04
1265
1273
15
7
:2024
6
7
:2024
6
8
:2024
Copyright © 2024 beplay安卓登录 All rights reserved.
2024
This work is licensed under the Creative Commons Attribution International License (CC BY). http://creativecommons.org/licenses/by/4.0/
在金融市场中,极端事件往往会对投资者造成较大的损失,建立有效的极端值模型可以降低极端风险对投资者产生的影响。本文考虑了极端尾部风险的情况,基于极值理论和SGEL分布,将POT模型中的超额分布用SGEL分布近似,提出了POT-SGEL模型;应用POT-SGEL模型来估计标普100指数日对数收益率的极端VaR值;通过与POT模型进行对比发现,POT-SGEL模型能够对极端VaR值进行估计,且在一定程度上比POT模型更优。
In financial markets, extreme events tend to cause large losses to investors, and modelling effective extremes can reduce the impact of extreme risks on investors. This article considers the case of extreme tail risk, and based on the extreme value theory and SGEL distribution, the excess distribution in the POT model is approximated by the SGEL distribution, and the POT-SGEL model is proposed; the POT-SGEL model is applied to estimate the extreme VaR values of the daily log returns of the S&P 100 index; through comparison with the POT model, it is found that the POT-SGEL model is able to estimate the extreme VaR values and is to some extent better than the POT model.
尖峰厚尾,广义误差分布,风险度量,极端值模型
Leptokurtosis
Generalized Error Distribution
Risk Measures
Extreme Value Models
1. 引言
在金融市场中,极端事件往往会对投资者造成较大的损失。2008年的金融危机使得大量的金融机构倒闭,政府陷入破产风险之中,对全球金融危机造成了不可磨灭的负面影响;2020年突然爆发的新冠疫情使得全球各地经济都受到了重创,由于部分国家的政府监管不到位,金融市场的股票价格不断下滑,大量的金融机构陷入危机之中。虽然造成此类极端破坏性的事件并不常见,但其造成的影响却是不可忽视的。而风险价值(Value at Risk, VaR)并不能度量此类极端风险,人们引入极值理论来度量极端风险。而在极值理论中,POT模型普遍被用来估计极端风险,其优良性与金融资产超额分布的累积分布函数选取息息相关,因此选择能够更好地拟合超出门限值的分布意义深远。一般而言,人们选取广义帕累托分布来近似超额分布,但也有学者认为超额分布服从偏广义误差分布等非对称分布。选择灵活的分布来拟合超额分布,建立有效的极端值模型可以帮助我们更好地度量极端风险,从而降低极端风险对投资者产生的影响。
金融风险中极端事件的发生使得极值理论的研究越来越重要,其无需对资产收益率的分布进行假设。Lauridsen (2000)
[1]
为了对金融时间序列尾部进行描述,建立了基于GRACH的极值方法,并将其应用于金融数据中,比较了目前各种估计VaR的方法与各种极值方法的优缺点。Araújo等人(2013)
[2]
提出了一种POT方法,将DPOT模型预测的VaR与其他模型进行比较,与全球股票市场指数的对比结果表明,该模型在无条件覆盖方面、违规聚集的要求下表现良好且优于广泛使用的RiskMetrics模型。为了对极端事件进行合理的估计,Yi等人(2014)
[3]
结合分位数自回归和极值理论(EVT)建立了一种估计极值VaR的半参数方法,并详细介绍了其步骤,得到了估计量的渐近分布,研究表明,该方法能够为金融投资组合提供更精确的VaR估计。Jiang等人(2014)
[4]
基于极值理论和条件方差构建了一种新的极端风险模型(GARCH-EVT-VaR)来对欧盟排放交易计划的碳现货市场进行度量,将其应用于EUA的现货市场并与传统的GARCH-VaR模型进行比较,实证表明,与传统的基于GARCH的模型相比,该模型能够将极端跳变纳入风险估计中。邵腾伟等人(2011)
[5]
利用极值理论中的POT模型对历史观测值的超门限值数据进行建模,利用GPD模型对农业自然灾害损失数据进行拟合,计算其VaR值。
为了刻画金融收益率分布尾部的特征,本文基于极值理论和SGEL分布构建了POT-SGEL模型。用SGEL来近似传统的POT模型中的超额分布,得到新的风险度量模型POT-SGEL模型,该模型能够更加灵活地刻画金融数据的特征。通过实证将新的POT-SGEL模型与传统的POT模型进行对比,用来刻画收益率的极端风险。
2. POT-SGEL模型构建
风险度量是为了防止金融资产出现大的损失,但无法刻画极端风险事件的发生,而极值理论(Extreme Value Theory, EVT)能够刻画此类情形。极值理论通过选择特定的分布来建立极端风险度量模型,进而对金融资产收益率分布的尾部风险进行精确的刻画。
目前应用较广泛的极值建模方法是BMM模型和POT模型。但BMM模型主要用来处理存在明显波动聚集数据的极端值问题且不能充分使用损失数据,无法满足参数估计所需要的大量样本量,产生偏倚估计,而POT模型能够更好地利用损失样本数据,因此POT模型在金融尾部风险度量中的应用更加广泛。
POT模型与门限值及超额(超过门限值的收益率数据与门限值的差值)分布的选取息息相关。选取一个合适的门限值并不简单,人们通常主观地根据均值超额图来选取。
超出门限的峰值(POT)模型的基本思想:
假设
x
1
,
x
2
,
⋯
,
x
n
是来自总体分布函数为
F
(
x
)
的样本观测值,给定一个门限值u,样本的超额Y表示为
y
t
=
x
t
−
u
,
t
=
1
,
2
,
⋯
,
n
u
,在
x
t
≥
u
的条件下,超额分布函数为:
F
u
(
y
)
=
Pr
(
X
≤
y
+
u
|
X
>
u
)
=
Pr
(
X
≤
y
+
u
|
X
>
u
)
−
Pr
(
X
≤
u
)
1
−
Pr
(
X
≤
u
)
=
F
(
u
+
y
)
−
F
(
u
)
1
−
F
(
u
)
=
F
(
x
)
−
F
(
u
)
1
−
F
(
u
)
.
(1)
Pickands III (1975)
[6]
指出,在一定条件下,广义帕累托分布(GPD)可以用来拟合超额分布函数,即
F
u
(
y
)
≈
G
ξ
,
β
(
u
)
(
y
)
。这里
ξ
表示GPD分布的形状参数,
β
(
u
)
表示GPD分布的尺度参数,其数学表达式如下:
G
ξ
,
β
(
u
)
(
y
)
=
{
1
−
(
ξ
y
β
(
u
)
)
−
1
/
ξ
,
ξ
≠
0
,
1
−
exp
(
−
y
β
(
u
)
)
,
ξ
=
0
,
其中,
β
(
u
)
=
σ
+
ξ
(
β
−
μ
)
。当
ξ
≥
0
时,
β
(
u
)
>
0
,
y
≥
0
;当
ξ
<
0
时,
0
≤
y
≤
−
β
(
u
)
/
ξ
。
当估计金融资产收益率的损失分布
F
(
u
)
时,利用经验分布函数,可以得到:
F
(
u
)
=
n
−
n
u
n
,
其中,
n
u
为超出门限值
(
x
>
u
)
的个数。将
F
(
u
)
和
G
ξ
,
β
(
u
)
(
y
)
代入式(1),得到
F
(
x
)
的表达式为:
F
(
x
)
=
[
1
−
F
(
u
)
]
G
ξ
,
β
(
u
)
(
y
)
+
F
(
u
)
≈
1
−
n
u
n
[
1
+
ξ
(
x
−
u
)
β
(
u
)
]
−
1
/
ξ
.
一般地,将POT模型应用于刻画极端风险。在给定尾概率
p
>
F
(
u
)
,且
0.9
≤
p
≤
1
的条件下,有:
VaR
p
P
O
T
=
u
+
β
(
u
)
ξ
[
(
n
n
u
(
1
−
p
)
)
−
ξ
−
1
]
.
SGEL分布可以通过变化参数来获得不同的分布,这表明该分布具有一定的灵活性,因此可以更好地度量极端风险。将POT模型中的近似超额分布用SGEL分布近似,构造出POT-SGEL模型来刻画尾部极端风险。新的极端值模型不仅包含了POT模型能够度量金融数据尾部的极端风险的优点,而且包含了SGEL分布灵活性的优点。
3. 基于POT-SGEL模型的VaR度量
下面给出基于POT-SGEL模型进行VaR度量的具体步骤。
1) 选取门限值u。门限值的选取是决定POT模型能否有效地刻画未知总体尾部的关键之一,它直接影响了SGEL参数的精度及POT模型用于VaR的效果。若选取过大,会导致超过门限值的个数太少,导致模型参数估计方差过大;若选取过小,无法对收益率的分布做出可靠的拟合。因此,门限值的选取是偏差和估计误差之间的一个平衡问题。目前最广泛的方法是通过绘制超额均值图来选取门限值。
假定金融资产负收益率
X
1
,
X
2
,
⋯
,
X
n
为相互独立且来自分布函数
F
(
x
)
的随机变量,选取一个门限值
u
0
,
Y
=
X
−
u
0
为超过门限值的超额收益率,则超额收益率的均值是随机变量Y的条件期望
E
(
X
−
u
0
|
X
>
u
0
)
。
若Y服从形状参数为
ξ
(
0
<
ξ
<
1
)
、尺度参数为
β
(
u
0
)
的GPD分布,其相应的条件期望为:
E
(
X
−
u
0
|
X
>
u
0
)
=
β
(
u
0
)
1
−
ξ
,
0
<
ξ
<
1.
当门限值为比
u
0
更大的u时,定义平均超额函数
e
(
u
)
为:
e
(
u
)
=
E
(
X
−
u
|
X
>
u
)
=
β
(
u
)
1
−
ξ
=
β
(
u
0
)
+
ξ
(
u
−
u
0
)
1
−
ξ
,
0
<
ξ
<
1.
也即是说,对于任意
Y
>
0
,有:
e
(
u
0
+
Y
)
=
E
(
X
−
(
u
0
+
Y
)
|
X
>
u
0
+
Y
)
=
β
(
u
0
)
+
ξ
y
1
−
ξ
,
0
<
ξ
<
1.
从上述我们可以看到,当
ξ
固定时,平均超额函数关于门限值u是线性的。此性质可以帮我们选取合适的门限值。
在未假定超额分布为GPD分布时,通过样本观测值的平均超额函数来代替总体的平均超额函数,其思路如下:
给定样本观测值
x
1
,
x
2
,
⋯
,
x
n
,定义样本的平均超额函数为:
e
(
u
)
=
1
n
u
∑
i
=
1
n
u
(
x
i
−
u
)
.
式中,
n
u
为样本超过门限值u出现的次数,
x
i
为样本超过门限值u时的观测值。
e
(
u
)
对u的散点图称为均值超额图。我们只需要选取合适的门限值u使得均值超额图为近似线性的且斜率为正值。
2) 基于门限值,得到超额分布
F
u
(
y
)
。假设
X
1
,
X
2
,
⋯
,
X
n
是来自金融资产负收益率的独立同分布样本,其总体分布函数为
F
(
x
)
。给定一个门限值u,样本的超额Y表示为
Y
=
X
−
u
。超额的分布函数用SGEL分布近似并估计出超额分布的参数。
3) 基于门限值,得到门限值分布
F
(
u
)
。
检查样本的观测值
x
1
,
x
2
,
⋯
,
x
n
是否超过门限值u。通常假定n近似于无穷大来得到一个极限的结果,此时u也可以按比例增加。由于样本观测值来自于独立同分布的样本,此时每个观测值超过门限值的概率相等。将
x
i
超过门限值u的概率记为
P
(
x
i
>
u
)
,则观测值超过门限值u的数量为:
n
u
=
∑
i
=
1
n
I
(
x
i
>
u
)
.
门限值分布
F
(
u
)
为:
F
(
u
)
=
1
−
1
n
∑
i
=
1
n
I
(
x
i
>
u
)
=
1
−
n
u
n
.
(2)
4) 基于超额分布和门限值分布,得到极值分布函数
F
(
x
)
。超额分布函数的数学表达式为:
F
u
(
y
)
=
Pr
(
X
≤
y
+
u
|
X
>
u
)
=
Pr
(
X
≤
y
+
u
|
X
>
u
)
−
Pr
(
X
≤
u
)
1
−
Pr
(
X
≤
u
)
=
F
(
u
+
y
)
−
F
(
u
)
1
−
F
(
u
)
=
F
(
x
)
−
F
(
u
)
1
−
F
(
u
)
.
将SGEL分布和门限值分布(2)代入上式,得到极值分布为:
F
(
x
)
=
F
u
(
y
)
[
1
−
F
(
u
)
]
+
F
(
u
)
.
(3)
在给定尾概率
p
>
F
(
u
)
,且
0.9
≤
p
≤
1
的条件下,通过反转式(3)中的极值分布
F
(
x
)
得到极端VaR值为:
VaR
p
P
O
T
−
S
G
E
L
=
F
−
1
(
p
)
,
其中,
F
(
x
)
的反函数为
F
−
1
(
x
)
。
4. 实证分析
这一节应用上文构建的POT-SGEL极端值模型进行实证。选取了具有非对称、尖峰厚尾特征的数据,并将该数据应用于POT模型和新的POT-SGEL模型之中,进而度量其尾部的极端风险。
选取标普100指数2019年1月1日至2021年11月30日共735个股票日交易数据(数据来源于锐思数据库)。考虑标普100指数t时刻的连续复合收益率:
r
t
=
p
t
−
p
t
−
1
,
(
t
=
1
,
⋯
,
T
)
其中,
P
t
表示标普100指数在t时刻的收盘价,对数价格
p
t
=
ln
P
t
,T表示交易日总数。一些关于
r
t
的基本统计特征见
表1
。
Table 1
Table 1. Statistical characteristics of the S&P 100 daily log return rt Table 1. Statistical characteristics of the S&P 100 daily log return rt 表1. 标普100指数日对数收益率rt的统计特征
均值
方差
偏度
峰度
最小值
最大值
rt
8.7 × 10− 4
2.026 × 10− 4
−9.777 × 10− 1
17.483
−1.229 × 10− 1
9.646 × 10− 2
为了揭示对数收益率的非正态性和厚尾性,考虑波动率为常数。从
表1
可以看出标普100指数日对数收益率偏度为−0.977677,峰度为17.483777。说明该收益率存在左偏现象,其峰度高于正态分布。通过Jaraue-Bera检验(见
表2
)可以得到标普100指数统计量显著不为零,即该对数收益率的正态性假设被拒绝且存在较大的尾部。
Table 2
Table 2. Jaraue-Bera testTable 2. Jaraue-Bera test 表2. Jaraue-Bera检验
统计量t
9526.107
p值
<2.2e−16
为了进一步验证标普100指数的日对数收益率是否服从正态分布,给出其QQ图及密度函数图。
Figure 1
Figure 1. QQ chart of the S&P 100 daily log return rt, (reference line is the solid red line through the first and third quartiles)--图1. 标普100指数日对数收益率rt的QQ图(参考线为通过第一和第三四分位数的红色实线)--
图1
为标普100指数日对数收益率的正态概率图。图中的横轴表示理论分位数,纵轴表示了样本分位数,红色实线穿过第一和第三四分位数。从图中可以看出,该收益率的尾部数据产生了偏离,存在厚尾现象,进一步说明该数据不服从正态分布。绘制了样本的经验密度函数图,以便更直观地了解收益率的特征。
Figure 2
Figure 2. Plot of the empirical density function of the daily log returns of the S&P 100 index (red dashed line is the density function of the normal distribution)--图2. 标普100指数日对数收益率经验密度函数图(红色虚线为正态分布的密度函数)--
图2
为标普100指数日对数收益率的经验密度函数图。图中黑色实线为收益率的密度函数图,红色虚线为正态分布的密度函数图,它们具有相同的均值和标准差。和正态分布相比,标普100指数日对数收益率的经验密度函数图存在尖峰厚尾的现象,说明标普100指数日对数收益率是非正态的,与前面的结果一致。
基于POT-SGEL模型对收益率进行VaR值度量的步骤如下:
1) 绘制标普100指数日对数收益率的超额均值图,以得到其门限值及门限值分布。
Figure 3
Figure 3. Excess mean chart--图3. 超额均值图--
图3
为标普100指数日对数收益率的超额均值图。观察上图,我们可以得到门限值u在
(
0.001
,
0.020
)
间时,均值超额图为近似线性的且斜率为正值。可以选取该区间作为门限值的选取范围。由于门限值的选取具有较大的主观性,对于波动较大的对数收益率序列而言,一般选取较高的门限值。假设日损失为是合理的。给定门限值0.01181,此门限值既在
(
0.001
,
0.020
)
的区间范围内,又使得超额数值大约占到总体的10%。对于给定门限值,总共有74个超额数值。此时得到门限值分布
F
(
u
)
=
(
n
−
n
u
)
/
n
=
0.89918
.
2) 对超过门限值的标普100指数日对数收益率数据拟合SGEL分布,并估计出该分布的参数。
Leadbetter等人(1983)
[7]
和McNeil等人(2000)
[8]
对金融资产收益率序列的独立性进行了研究,指出若极端值事件是在较长时间间隔内发生的,此时极端值事件就可以看作是独立事件。将数据中超过门限值0.0118的超额看作独立同分布的随机变量。随后用能够刻画非对称、尖峰厚尾特征的SGEL分布来拟合超额分布并估计其参数,其主要拟合结果见
表3
。
Table 3
Table 3. Parameter estimation of the excess distributionTable 3. Parameter estimation of the excess distribution 表3. 超额分布的参数估计
μ
^
σ
^
v
^
θ
^
SGEL
1.348 × 102
1.606 × 102
4.101 × 10− 1
4.999
表3
给出了对超过门限值的数据拟合SGEL分布时的参数估计。
3) 基于超额分布和门限值分布,得到对数收益率的极值分布函数
F
(
x
)
。
极值分布函数
F
(
x
)
为
F
(
x
)
=
F
u
(
y
)
[
1
−
F
(
u
)
]
+
F
(
u
)
,将
F
u
(
y
)
和
F
(
u
)
代入式中,反解求出不同置信水平下的极端VaR值。
表4
给出了在置信度为0.90、0.95及0.99下,基于新的POT-SGEL模型和传统POT模型的极端VaR值。
表4
得到了基于POT-SGEL极端值模型下的VaR值。选取贵州茅台2018年1月1日至2019年6月3日共350个股票日交易的数据(数据来源于锐思数据库)作为样本的测试集数据,采用Kupiec失败率检验对基于POT-SGEL极端值模型进行回测检验。
Table 4
Table 4. Extreme VaR values at different confidence levels under different modelsTable 4. Extreme VaR values at different confidence levels under different models 表4. 不同模型下在不同置信水平下的极端VaR值
0.90
0.95
0.99
真实VaR
0.0118
0.0162
0.0354
POT-SGEL
0.0106
0.0157
0.0343
POT
0.0092
0.0143
0.0307
Table 5
Table 5. Results of backtesting tests at different confidence levels under different modelsTable 5. Results of backtesting tests at different confidence levels under different models 表5. 不同模型下在不同置信水平下的回测检验结果
置信水平
模型
失败率
p值
p = 0.95
POT
0.054
0.716
POT-SGEL
0.051
0.902
p = 0.97
POT
0.034
0.645
POT-SGEL
0.031
0.876
p = 0.99
POT
0.014
0.448
POT-SGEL
0.011
0.792
表5
是基于POT-SGEL极端值模型和POT模型下的回测检验。从
表5
可以得出,在置信水平为0.95、0.97和0.99的条件下,两个模型均通过了Kupiec失败率检验,认为两个模型对极端风险值的估计是有效的。但是POT模型检验的p值远小于置信水平,高估了市场风险,而POT-SGEL模型的p值较接近置信水平,这说明POT-SGEL模型的预测结果比POT模型更准确。这验证了我们的模型对金融市场的极端风险估计效果更准确。
5. 结论
由于金融数据往往具有不对称,且伴有尖峰厚尾等特征,此时使用传统的对称分布来描述此类偏态数据并不合适。为了刻画金融收益率分布尾部的特征,本文从极值理论出发,将传统的POT模型中的近似超额分布用SGEL分布近似,建立了基于极值理论的POT-SGEL模型。
研究结果表明,与传统的POT模型相比,本文提出的新POT-SGEL模型对金融数据的极端风险值估计的效果更加准确,能够更好地刻画收益率的极端风险,防范化解尾部风险,降低尾部风险对投资者造成的损失。
基金项目
重庆对外经贸学院科学研究项目(KYKJ202205)。
References
[
]1
Lauridsen, S. (2000) Estimation of Value at Risk by Extreme Value Methods. Extremes, 3, 107-144. >https://doi.org/10.1023/a:1009979331996
[
]2
Araújo Santos, P. and Fraga Alves, M.I. (2013) Forecasting Value-At-Risk with a Duration-Based POT Method. Mathematics and Computers in Simulation, 94, 295-309. >https://doi.org/10.1016/j.matcom.2012.07.016
[
]3
Yi, Y., Feng, X. and Huang, Z. (2014) Estimation of Extreme Value-At-Risk: An EVT Approach for Quantile GARCH Model. Economics Letters, 124, 378-381. >https://doi.org/10.1016/j.econlet.2014.06.028
[
]4
Jiang, J.J. and Ye, B. (2014) Value-at-Risk Estimation of Carbon Spot Market Based on the Combined GARCH-EVT-VaR Model. Advanced Materials Research, 1065, 3250-3253. >https://doi.org/10.4028/www.scientific.net/amr.1065-1069.3250
[
]5
邵腾伟, 冉光和. 基于POT-GPD损失分布的农业自然灾害VAR估算[J]. 统计研究, 2011, 28(7): 79-83.
[
]6
Pickands III, J. (1975) Statistical Inference Using Extreme Order Statistics. The Annals of Statistics, 3, 119-131.
[
]7
Leadbetter, M.R., Lindgren, G. and Rootzén, H. (1983) Extremes and Related Properties of Random Sequences and Processes. Springer.
[
]8
McNeil, A.J. and Frey, R. (2000) Estimation of Tail-Related Risk Measures for Heteroscedastic Financial Time Series: An Extreme Value Approach. Journal of Empirical Finance, 7, 271-300. >https://doi.org/10.1016/s0927-5398(00)00012-8