1. 引言
经典金融理论有效市场假说(Efficient Market Hypothesis, EMH)的提出有效的推进了资产定价的发展。该理论认为所有影响股价的信息都及时、准确且充分地反映在了股价中,且投资者是理性的做出投资决策 [1] 。然而该理论在应对越来越多的金融市场异常现象显得越来越无力,例如投资者的异质性 [2] ,股票市场异常 [3] 和“波动率之谜” [4] 等,以上都使得现代资产定价仅基于传统经济模型EMH的资产定价可能会被扭曲和产生了偏差。为解释传统经济模型预产生偏离的原因,行为经济学基于投资者心理(情绪)和行为等原因对金融市场的异常现象给出一定有效的解释 [5] [6] 。
在过去的二十年里,投资者情绪的研究已经成为行为金融学的一个独特领域 [7] 。首先在以往的研究中,部分学者认为投资者情绪是一种典型的投资者认知偏差 [8] [9] [10] ,即投资者对资产真正价值认识存在偏差,且经典金融理论并没有考虑投资者情绪的作用。其次,中国作为全球第二大经济体,同时拥有全球第二大的股票交易市场。但它相比于其它国家股市的独特之处在于,中国股市是个人投资者为主体的股票交易市场,个人投资者占比90%,且全部交易活动80%以上的都来自个人投资者,Hirshleifer等人认为个人投资者的认知偏差被认为是影响市场价格和交易活动的根源 [11] ,且个人投资者有模仿他人行为的倾向,在市场上随处可见,及羊群行为 [12] 。最后,波动率为资产收益的不确定性度量,市场上投资者根据不确定性度量及时调整投资组合,而且可以使决策者了解市场风险,根据市场情况制定相应的政策。因此准确测量和预测波动率对于资产定价的实践和学术研究都具有重要意义。
本文贡献如下。首先,现有文献中的模型可以较好地预测波动率,为此基于贝叶斯的Scaled-PCA产生的投资者情绪在相同基准模型下,考虑了几个相关的竞争模型,同样与我们提出模型效果上存在差异。第二,其他未考虑不同方法下的投资者情绪和股市波动性之间的动态关系,我们使用VAR模型对每个个体投资者情绪对波动率展开了脉冲分析。
2. 样本、代理情绪指标和描述性统计
在本章节中,首先介绍本文中使用的变量的时间维度、来源、定义和度量方法。通过有关上海证券交易所综合指数(简写为SSEC)的数据,计算出月度已实现波动率作为本研究的目标。第二,我们重新审视了中国市场上现存的市场层面的投资者情绪指数,第三,介绍本文用于构建中国金融市场投资者情绪的六个主流的情绪代理变量,然后对上述应变量和自变量进行描述性统计和相关性分析。最后,通过不同方法建立的投资者情绪进行同期之间预测能力分析。
2.1. 数据来源
本研究使用的数据来源于多个数据库和开放网站,例如,SSEC指数每日交易数据来源与上海证券交易所,其中收集了包括当日开盘价,前一交易日的收盘价以及当日成交量和成交额。基本情绪指标、CICSI、ISI数据来自中国股票市场和会计研究数据库(CSMAR)。
2.2. 月度已实现波动率的测度方法
Andersen等人提出已实现波动率(Realized Volatility),通过每日的交易数据来估计波动率 [13] ,具体见图1。第m个月的已实现波动率(
)可以通过式(1)表示为
(1)
其中
,
为第m个月中第n个交易日的收盘价,
为第m个月的总交易日数,
表示为第m月股指的对数收益率。
Figure 1. Realized volatility of the Chinese stock market
图1. 中国股票市场的已实现波动率
2.3. 现有综合投资者情绪
越来越多的学者加入对于中国投资者情绪的研究,基于此本研究选取了共计7个关于中国投资者情绪的指数(包含我们的模型)。其中首先有两个主流的综合投资者情绪的研究 [14] [15] ,它们是通过PCA方法在几个基本情感代理上构造的,其次两个较新的投资者情绪的研究 [9] [10] 。
1) CISIC,是由Yi等人基于Baker和Wurgler的研究方法以主成分分析方法(PCA),结合了6个基本情感指标及其滞后效应而创建的 [14] 。但与B-W指数不同之处在于CICSI是通过对前五个主成分进行特征值加权来构建,而B-W指数使用的是第一主成分,使用了的情绪代理包括封闭式基金折价率,股票市场成交量,IPO数量和IPO平均首日收益率,新的投资者账户数量,消费者信心指数CCI,同时还通过回归宏观经济因素进行了调整,以排除理性因素的干扰。
2) ISI,是由Wei等人提出的投资者情绪指数(ISI) [15] 与CICSI的相似之处在于它们都采用了相同的基本情感代理和降维方法(PCA)。但是这些基本情感代理的统计测量方式是不完全相同的。
3) SPLS是由Gong等人在CICSI和ISI的综合情绪指标选取的代理变量的基础上,使用了不同于CICSI和ISI的偏最小二乘法(PLS)构造了一种新的投资者情绪指数(NISI) [9] 。该指数同时关注AD比率和AD量并避免与其他市场层面的情绪度量重叠,NISI主要在三个方面优于许多现有的情绪指标。a) 样本内预测能力。b) NISI在中国股市波动前后具有较强的预测性,而其他指标则是不具备该能力的。c) 样本外分析表明,NISI的预测能力比其他情绪指标更加有效。
4) SSPCA,Song等人通过分别遵循Huang等人的方法构建 [16] 。即:SSPCA和SPLS方法以CICSI和ISI的6个基本情感指标为变量构建了两个投资者情绪指标SsPCA和SPLS,实证结果表明,SSPCA是一个显着的和强大的预测波动的样本内和样本外。他们发现SSPCA优于SPLS预测中国股市的股票波动,例如:在著名的金融危机和新冠疫情蔓延前后,总结得出SsPCA是一个强大的波动预测从各个方面,并表现得更好,与现有的情绪指标。
2.4. 基于贝叶斯时间序列的投资者情绪
投资者情绪基本代理变量
本文在前人的研究基础上选取投资者情绪基本代理变量 [8] [9] [10] 例如:ISI,CISIC为基础,收集了6个能反应投资者情绪对中国股市影响的情绪代理变量,各情绪代理变量时序图见图2,具体如下:
1) 封闭式基金折价率,计算每月沪–深股市(A股)中封闭式股票型基金份额的资产净值与其市场价格的平均差额,Lee等人认为封闭式基金的折价率可以反映投资者情绪CEFD作为投资者情绪的常见代理
指标。计算方法为:
其中
是基金i在t月末的市场价格,
是基金i在t月末的净值,k是t月末封闭式基金的数量。
2) IPO首日回报率:首次公开募股(上市)为当月新上市A股首日收益算术平均值,RIPO同样作为投资者情绪的常见代理指标。
3) IPO数:是指当月首次公开募股的公司数量;Baker和Wurgler认为,股票发行数量和首日回报率都可以反映投资者情绪。即当投资者情绪高涨时,更多的公司准备上升,而当投资者情绪低落时,准上市公司会降低上市的希望。
4) 新设投资者账户数是指当月新开股市交易账户。在新兴股票市场中使用较多的情绪代理指标。当投资者情绪高涨时,会增加更多新投资者开户。直观地说,NIA越大,股市吸引到的股市交易者越多。情绪越高涨。
5) 股票市场成交量,通常作为市场流动性的衡量标准,这是因为投资者在股市下跌时情绪较低会降低成交量,而在股市上涨时情绪较高会使成交量上升。本文选取了沪深两市A股加权月换手率作为情绪代理,计算方法见式(2)。
(2)
其中
表示为第t个月的市场成交额,
代表月底的市场总市值,
,
分别代表市场每月平均交易日和每月累计交易日。
6) 消费者信心指数,通过问卷调查的方式,由中国国家统计局发布,反映消费者对当前经济状况的看法以及他们对未来经济前景和个人经济状况的预期。这一指标通常被用来预测经济的走向和消费趋势也常被用来作为投资者情绪代理指标。
7) 中国不确定性指数,反映了外部环境的不确定性 [17] ,本文将作为投资者情绪代理变量之一。
Figure 2. Time series diagram of realized volatility and seven independent emotion agents used in this article
图2. 已实现波动率和本文使用的七个独立的情绪代理的时序图
市场层面情绪指标之间的相关关系如表1所示,首先,RV_mon和DCEF的相关系数为−0.35065,这意味着它们之间有中等强度的负相关关系。而ISI和CICSI的相关系数为0.49631,这表明它们之间有中等强度的正相关关系。最高的相关性在ISI和TURN之间,为0.98434,显示出非常强的正相关。
2.5. 数据统计属性
表2为投资者情绪指标数据统计属性。投资者情绪指标包括封闭式基金折价率(CEFD)、IPO首日收益率(RIPO)、IPO数量(NIPO)、股票成交量(TURN)、新开个人投资者账户数(NA)、消费者信心指数(CCI)和中国不确定性指数。七个独立的情绪代理的定义可以分别在第二节中找到。提供这些变量的统计数据,例如平均值(Mean)、最大值(Max)、最小值(Min)、标准差(Std)、偏度(Skew)和峰度(Kurt)。
2.6. 动态关系模型
建立VAR模型,VAR一般形式如式(3)所示:
Table 1. Correlation coefficients between investor sentiment agents
表1. 投资者情绪代理间相关系数
Table 2. Descriptive statistics of investor sentiment proxy variables
表2. 投资者情绪代理变量的描述性统计
注:***、**、*分别代表1%、5%、10%的显著性水平,Q(N)表示为滞后N阶。
(3)
是一个包含
个经济变量的向量,代表时间
的观测。
是一个截距项。
是包含回归系数的矩阵,它们捕捉了各个变量之间的动态关系。
是误差项,通常假定为白噪声,代表了未被模型考虑的随机扰动。
我们建立VAR模型的目的不是为了直接分析变量之间的相关关系,而是为了分析当一个误差项发生变化时,这一变化会对整个模型系统带来怎样的动态冲击影响,即脉冲响应函数。
(4)
其中:
是时间
时
对于单位冲击的响应。
表示时间
时
的变化。
表示
(误差项)的单位冲击。
脉冲响应函数指一个内生变量对残差冲击的响应,即在随机误差项上施加一个标准差大小的冲击后对内生变量的当期值和未来值所带来的影响。相比于静态分析法,本文采用VAR的建模方法,分析投资者情绪与波动率之间的动态关系。数据平稳性使用adf检验已经在第二节说明了,图3为VAR模型的脉冲响应图分析如下:
Figure 3. Pulse response of VAR models for sentiment proxy variables of various investors to realized volatility
图3. 各投资者情绪代理变量的VAR模型对已实现波动率的脉冲响应图
3. 模型开发
3.1. 贝叶斯框架下参数估计
贝叶斯方法将每一个参数都视为一个随机变量,加权似然函数则可以作为参数的先验分布,再将先验信息作为权重,使用由先验推导的后验分布进行统计推断。在参数
为一维时通过以下公式获得未知参数的后验分布为式(5):
(5)
其中
是参数的联合密度函数,其中包含了
中的信息,还有总体信息,
是参数
的先验密度函数,
就被称为似然函数,
计算公式为:
(6)
参数先验分布为
,
则作为其参数空间,x的边缘密度函数表示为
因此,可以得到:
(7)
由于与
是无关的,
中并没有包含有关
的任何信息,因此条件分布
可以对
做出推断,就因此贝叶斯估计公式可以近似如下:
(8)
函数
为参数
的后验分布。
3.2. 原有模型
通过SCALED-PCA算法的介绍得知,缩放(Scaled)技术指标面板为:
(9)
现基于贝叶斯框架缩放(Scaled)技术指标面板为:
(10)
矩阵形式为:
(11)
如果是矩阵形式,则多元线性回归模型因变量服从分布为:
(12)
其中待估斜率参数为
与
,
是平均值为0且方差为
的回归扰动。现将多元线性回归的
和
视为随机变量,则随机变量的多元线性回归的似然度表示为:
(13)
其中
是由参数给出并由
的条件分布诱导的
的条件概率密度函数。通常,
被认为是固定量。那么
(14)
其中
是在
处评估的具有平均值
和方差
的高斯概率密度。
3.3. 先验分布
由于关于参数
的先验信息是未知和缺乏关于模型方差和参数的任何初始信息的情况下,本文选择的是无信息先验,基于Box和Tiao提出的方法,可以使用无信息先验则
先验分布分别取为:
(15)
假设
和
是相互独立的,因此联合先验分布为:
(16)
由贝叶斯公式,参数
的联合后验分布密度函数为
(15)
在区间
上,函数
对
积分求解.最终得到,模型系数向量的后验边缘分布密度,如下
(17)
由式可知,得到的是自由度为a,位置参数为
,精度矩阵为多元t分布密度函数的核.对于给定的Y和X,
服从多元t分布,
为条件期望.在平方损失函数下,
的贝叶斯估计是:
(18)
Figure 4. Bayesian regression results for each parameter
图4. 各参数贝叶斯回归结果图
4. 实证结果
4.1. 贝叶斯回归
通过贝叶斯方法将每一个参数都视为一个随机变量,回归结果见图4。
4.2. 预测能力
为了检验SsPCA对中国股市收益的预测能力,我们运行以下标准预测回归模型式(15)。
(19)
其中
表示
个月的已实现波动率,
表示第t个月的第i个个体情绪指数,n为预测未来n个月。利用估计的斜率t和相应的t统计量来评价个体情感代理对股票收益率的预测性,实证结果见表3。
表3展示了多个综合情绪指数和每个情绪代理对中国股市回报的样本预测结果。如表3可知全部投资者情绪都对股票市场表现出优异的样本内预测能力,估计斜率β为0.001836,表明Ss(mcmc)-pca中每增加一个标准差,股票市场收益率就会增加1.836%。同时Ss(mcmc)-pcade RMSE最小,拥有最小的预测误差。证实了Ss(mcmc)PCA在预测中国股票市场收益率方面优于其他情绪指数,这意味着Ss(mcmc)PCA总体情绪是中国股票市场的有效和强大的预测器。
Table 3. Comparison of predictive power of sentiment proxy variables among investors
表3. 各投资者情绪代理变量预测能力对比
注:***、**、*分别代表1%、5%、10%的显著性水平。
5. 结论
在本文中,我们详细阐述并提出了一种创新的将贝叶斯方法融入投资者情绪测度的方法,用于测量和分析投资者情绪指标,并进一步探讨了该方法在中国股市中预测股票价格波动的有效性。通过构建一个贝叶斯统计框架,能够更准确地捕捉和量化投资者的情绪变化,这对于理解和预测股市动态至关重要。我们的研究结果表明,与传统的投资者情绪测量方法相比,我们的贝叶斯方法在样本内外的预测性能上都显示出显著的优势。具体来说,该方法不仅在样本内测试中胜过其他五个主要的综合情绪指标。
贝叶斯方法的优势主要源于其灵活性和对不确定性的有效处理。该框架允许我们整合来自不同来源的信息,并考虑信息之间的潜在关联性,从而提高了情绪指标的准确性和预测股价波动的能力。通过贝叶斯方法,可为理解和应对市场情绪波动提供了一种新的有效工具。
基金项目
湖北省教育厅科学研究计划指导性项目-B2022001。
NOTES
*通讯作者。