Value Measurement of Social Media Texts—Research on the Construction and Function of Online Consumer Public Opinion Index Based on Deep Learning
With the rapid popularization of the Internet and social media, social media texts have attracted attention because of their real-time, interactive and unbiased nature. It has become a meaningful exploration to explore the quantitative public opinion of social media consumption and further study its impact on consumer confidence. The paper first constructed a consumer keyword database with 6 different topic dimensions, and crawled about 1.782 million related popular microblogs on the social platform. Further, based on Bert pre-training model, emotional tendency is mined, and an online Consumer Confidence Index is created to comprehensively quantify consumer confidence by introducing Weibo heat score and wavelet transform. It is found that the online CPOI has a significant positive impact on consumer confidence and there is a long-term stable equilibrium relationship between the two. When it is further added into the consumer confidence forecasting model, all evaluation indicators are significantly improved, and the forecasting effect and robustness of LSTM are better than that of GRU and Random Forest in different forecasting periods.
Public Opinion Mining
作为推动经济增长的三驾马车之一,2023年消费支出对中国经济增长的贡献达到82.5%,成为最主要的驱动力。而随着消费者行为理论的发展,越来越多的研究表明,消费者对未来经济形势和消费水平的预期会显著影响其消费和投资决策
另一方面,随着互联网的发展,社交媒体已成为人们讨论公共事务和形成舆论的核心平台,是舆情最大的数据的重要来源
因此,网络舆情对消费者信心的影响不容忽视,当消费者接收到有关政策利好或经济前景乐观的消息时,其信心可能会得到提升。为测度网络消费舆情的价值,本文首先基于新华网构建6个主题维度的消费热点关键词库,爬取约178.2万热门微博,并运用微调后的Bert情感模型挖掘情感倾向。进一步地,结合微博热度和小波变换对消费舆情进行特征提取和量化,构建网络消费舆情指数(Consumer Public Opinoin Index, CPOI)。研究结果显示,本文构建的CPOI与CCI之间存在显著的正相关,且存在长期稳定的均衡关系。进一步对消费者信心进行预测,加入网络舆情因素的模型预测能力显著提升,且LSTM模型预测的准确性和鲁棒性优于GRU和随机森林。
本文的创新之处在于:首先,首次将Bert预训练情感模型应用于消费舆情分析,模型效果显著优于传统深度学习方法;其次,融合微博热度和小波变换,构建了一个综合量化网络消费舆情的指标CPOI,更精确刻画消费舆情;最后,为评价该指数的有效性,验证了其与消费者信心的相关性及长期均衡关系,证明了网络舆情对消费者预期的预测能力,填补了相关研究空白。
近年来,基于深度学习的文本挖掘方法得到了广泛应用,尤其是在情感分析任务中展现了其优势。Jelodar等(2020)利用LSTM对COVID-19评论进行情感分析,取得了优于传统机器学习算法的表现
随着媒体格局的变化,社交媒体已成为主要信息来源
综上,本文利用Bert预训练情感模型挖掘社交媒体消费舆情,对其在消费者信心方面的价值进行验证和评价,期望为该领域研究补充更加全面、准确的视角。
我们设计构建一个名为网络消费舆情指数(Consumption Public Opinion Index, CPOI)的指标,量化社交媒体环境中的消费舆情。研究路径可以划分为数据获取与处理、意见挖掘和指数构建三个阶段,见
为获取当下与消费者信心相关的不同维度的热点主题和关键词,本文选取了中国主流媒体之一的新华网财经频道,爬取了2023年5月至2024年4月近一年发布的1986条每日新闻。通过词频技术提取文本中的前1%高频词,并过滤掉与新闻主题无关的停用词和过于泛化的词汇。经过筛选后的Top 100高频词云图见
消费者信心包含对众多宏观经济和家庭层面变量的预期
主题维度 |
关键词 |
经济形势 |
经济、产业、外贸、利率、GDP、汇率、企业 |
生活状况 |
消费、收入、存款、旅游 |
投资 |
投资、基金、债券、黄金、股票 |
就业 |
就业、失业、创业 |
物价水平 |
CPI、物价、价格 |
购房 |
房地产、楼市、买房 |
截止2023年第四季度,微博平台月活跃用户达到5.98亿,是当今中国最大的公共信息发布平台之一。网民在平台上发布帖子和交流,高互动性的热门微博往往承载着更广泛的公众意见。基于已构建的关键词库,文本以每个关键词作为种子,爬取了微博平台内2015年1月至2024年5月每日前50条热门微博,共计约178.2万条,构成微博文本数据集。各主题维度的文本数量及内容见
主题维度 |
微博数量 |
例子 |
经济形势 |
229,933 |
(1) 我国经济的亮点是出口的结构更好了,由低附加值产品转成了90%机电产品 + 10%劳动密集型产业。 (2) 我觉得2024年可能是中国经济最困难的一年。 |
生活状况 |
444,802 |
(1) 去年至今,我国消费恢复保持良好势头,各种场景式消费不断创新,特别是文旅消费热度不减。 (2) 虽然今年收入下滑,消费也降级,但好在生活质量没下降太多。 |
投资 |
533,206 |
(1) 截至收盘北向资金净流入128.09亿元,外资积极流入明显,周三微博里我就明确说了看好11月份,今天依然重复这句话。 (2) 中国股市的冷淡让人担忧,如果再持续下去,可能会激起民心的不安,造成严重影响。 |
就业 |
236,853 |
(1) 今年以来,我国就业形势继续保持稳中向好态势,市场用工需求旺盛,重点群体就业基本稳定,失业率稳中有降。 (2) 现在就业形势的现实:从当下开始,任何人都要做好失业在家的准备。 |
物价水平 |
161,572 |
(1) 国家统计局新闻发言人毛盛勇表示,尽管CPI涨幅扩大,但主要受结构性因素影响,随着一系列政策落地,价格也会回归正常区间。目前既不存在通胀,也不存在通缩,物价总体是平稳的。 (2) 近日一名外国游客表示在西湖游玩时一瓶矿泉水要6块,嘉兴西塘酒吧街半打啤酒600块,感觉物价太贵太离谱。 |
购房 |
176,060 |
(1) 重磅利好,楼市终于出现回暖迹象了,没想到啊,你看看,深圳楼市这人山人海的局面已经好多年都没有看到了。 (2) 为什么这一次楼市市场反应不佳?因为市场缺的不是需求而是信心,虽然上半年颁布过一些政策,但都很“含蓄”,很难让老百姓有信心。 |
Bert基于Transformer的Encoder层堆叠而成,这种结构使得Bert能够学习和抽取不同层次和粒度的语义信息,获得更丰富的语义表示。同时,相比RNN的顺序计算,Bert也继承Transformer可以并行计算的优点大幅提高了运算速度。Bert的基本结构见
在输入层,位置编码(Position Encoding)
(1)
(2)
其中,pos是句子中token的位置,dmodel是嵌入维度,i代表向量维度索引,公式所得到的位置编码维度和嵌入向量维度dmodel相同,二者相加一起输入至编码层。
在编码层,自注意力机制(self-attention)是Bert的核心部分。用Sembedding表示句子S经过输入层后的最终嵌入特征,它的维度为sequencelength × embeddingdimension (sequencelength是句子长度,embeddingdimension 表示token的维度)。分配三个权重矩阵对每一个特征输入作线性映射,得到Query矩阵(Q)、Key矩阵(K)和Value矩阵(V):
(3)
(4)
(5)
接着,基于三个向量做以下计算:
(6)
式(6)中,用注意力矩阵 除以 转换为标准正态分布( 通常取64),使得softmax归一化后的结果更加稳定,从而帮助模型更易获得平衡的梯度。softmax变换后,得到的注意力权重分配与V相乘,得到基于一个attention生成的one-head表示Z。将多个Z拼接并进行转换,最终获得句子S的多头表示。
(1) 模型参数和评价指标
前期我们在每个主题维度文本中分别抽取4000条微博进行人工标注,共24,000条。根据文本情感,我们将其分为负向、正向和中性,并用−1、0、1表示。负向文本表达负面情绪,正向文本相反,中性文本则为无明确情感倾向或与主题无关的内容。
本文采用bert-base-chinese模型进行训练。每个主题的标注文本的80%作为训练集,20%作为测试集。由于数据集中文本类别不平衡,特别是中性文本占比过大,可能导致模型偏向于预测大类别。为此,我们调整了损失函数的权重,给予正向和负向文本更高的权重,以提升模型对小类别的识别能力。此外,Bert模型的最大输入长度为510个token。为保留微博文本中的关键信息,超过长度的文本选取前128个和后382个token。具体的模型参数设置见
本文基于Bert分别对6类主题文本进行建模,并与TextCNN进行对比,以正确率(accuracy)、精确率(precision)、召回率(recall)和F1得分(F1-score)作为模型评价指标:
(7)
(8)
(9)
(10)
参数名称 |
参数描述 |
参数设置 |
max_length |
最大文本长度 |
510 |
train_batch_size |
每批样本的大小 |
8 |
learning_rate |
学习率 |
0.0001 |
epoch |
全部训练集进行几次训练 |
20 |
(2) 情感分类结果
模型情感分类结果见
主题维度 |
Bert |
TextCNN |
||||||
Accuracy |
Precision |
Recall |
F1-score |
Accuracy |
Precision |
Recall |
F1-score |
|
经济形势 |
0.8887 |
0.8910 |
0.8887 |
0.8890 |
0.8775 |
0.8116 |
0.8775 |
0.8273 |
生活状况 |
0.8787 |
0.8639 |
0.8788 |
0.8694 |
0.8575 |
0.7473 |
0.8575 |
0.7986 |
投资 |
0.8750 |
0.8700 |
0.8750 |
0.8712 |
0.8425 |
0.7205 |
0.8425 |
0.7767 |
就业 |
0.8462 |
0.8487 |
0.8462 |
0.8459 |
0.7425 |
0.6350 |
0.7425 |
0.6630 |
物价水平 |
0.8575 |
0.8561 |
0.8575 |
0.8568 |
0.8525 |
0.7601 |
0.8525 |
0.7881 |
购房 |
0.8025 |
0.8003 |
0.8025 |
0.8013 |
0.7125 |
0.6432 |
0.7125 |
0.6257 |
首先定义单条微博的舆情得分,它由情感得分和热度得分组成。情感得分根据Bert情感分类结果得到:
(11)
微博热度的高低能反映网民的情感强度,具体可以表现在点赞、转发、评论量上。因此,本文创新性地提出热度得分:
(12)
其中, 是点赞、评论、转发的数量, 是权重,本文 。
舆情得分由热度得分和情感得分相乘得到:
(13)
舆情得分同时考虑了微博的情感倾向和热度。符号反映情感倾向,绝对数值反映情感强度。中性微博的舆情得分为0。
按时间窗口划分,计算不同维度的月度网络消费舆情子指数(Consumer Public Opinion Sub-Index, CPOSI):
(14)
其中, 是积极情感微博的消费舆情得分总和, 相反。
参考CCI的尺度对子指数加总后的结果进行放大,得到月度网络舆情指数:
(15)
根据上述网络舆情指数的构建方法和情感分类结果,本文计算得到了原始的网络消费舆情指数,但其由于随机波动与非系统性噪声呈现出较大的波动。因此,采用小波变换对其进行去噪和趋势提取。小波变换可通过多分辨率分析捕捉信号特征并去除噪声,过程包括小波分解、阈值处理和信号重构。多分辨率分析框架下的信号重构表示为:
(16)
其中, , 分别是尺度函数 和母小波函数 的伸缩和平移函数簇; 和 是伸缩尺度为j0,j,平移尺度为k的展开系数,Nt是时间序列的点数。
对原始的消费舆情指数进行ADF检验,p值为0.2297,是非平稳信号。因此选择具有紧支撑性和正交性、适合非平稳信号处理的Daubechies 4 (db4) 4层小波分解,并进行软阈值处理。小波变换后的CPOI见
小波变换后的CPOI和CCI见
为了证明这种关系是否是长期稳定的,本文对两者进行协整检验。由于两个序列都是非平稳的,对两者进行一阶差分,确定其是同阶单整后采用Engle-Granger两步法。对OLS回归后的残差进行ADF检验,p值为0.0033,因此在1%的显著性水平下可以认为调整后的CPOI和CCI之间存在长期稳定的均衡关系。
作为一种特殊的RNN,长短期记忆神经网络(LSTM)
在时刻t,LSTM接收输入特征Xt以及前一时刻的单元状态Ct-1和输出ht-1,并通过三种门控机制过滤和更新信息。遗忘门负责选择需要遗忘的信息,输入门确定需要添加的新信息,并结合遗忘门和单元状态更新当前记忆。输出门则选择哪些信息是当前时刻的输出,最终生成一个新的状态和输出。
本文采用中国国家统计局发布的消费者信心指数作为被解释变量。在解释变量的选择上,考虑到传统的消费者信心指数预测往往以相关经济指标作为解释变量
模型 |
模型作用描述 |
模型输入描述 |
对照组M1 |
进行结果对比 |
CCIt、GDPGt、UR16-24t、CPIt、ICGt、RECIt、SCIt |
实验组M2 |
验证消费舆情因素对模型预测的效果 |
CCIt、GDPGt、UR16-24t、CPIt、ICGt、RECIt、SCIt、CPOIt |
为消除量纲和异常值的影响,提升模型的预测性能,用式19对所有变量进行极值归一化处理,预测完成后再通过逆算得到预测值。
(17)
为了评估不同模型以及同一模型的对照组和实验组的预测效果,本文采用均方根误差(Root Mean Square Error, RMSE)、平均绝对百分比误差(Mean Absolute Percentage Error, MAPE)、对称平均绝对百分比误差(Symmetric Mean Absolute Percentage Error, SMAPE)三个指标对模型预测效果进行评价:
(18)
(19)
(20)
其中, 是实际值, 是预测值,n是样本量。当RMSE越接近于0、MAPE和SMAPE越接近于0%时,模型的误差越小,预测精度越好。
根据上文模型变量设计,本文设置传统变量构成的对照组M1和加入CPOI的实验组M2,采用Python的Tensorflow框架分别进行LSTM建模。为了优化模型参数,采用网格搜索(Grid Search)定义参数网格,遍历所有参数组合并进行交叉验证(Cross-Validation),从而选择最优参数组合。此外,引入早停机制防止模型过拟合,当验证损失在连续5个训练周期内没有改善时停止训练。本文最终设置参数见
参数名称 |
参数描述 |
参数设置 |
batch_size |
批量大小 |
4 |
epochs |
训练周期 |
20 |
optimizer |
优化器 |
adam |
loss |
损失函数 |
均方误差MSE |
units |
隐藏层神经元数量 |
50 |
learning rate |
学习率 |
0.001 |
n_past |
滑动窗口大小 |
3 |
以时间序列数据的前80%为训练集、后20%为测试集,分别对对照组M1和实验组M2建立LSTM模型,最终拟合效果见
模型 |
RMSE |
MAPE (%) |
SMAPE (%) |
对照组M1 |
1.3833 |
1.2682 |
1.2647 |
实验组M2 |
1.0207 |
0.9027 |
0.8989 |
通过对比对照组M1与实验组M2的表现可以清晰地看到,在引入CPOI这一变量后,实验组M2在三个评价指标上的表现均展现出了显著的优越性,相较于对照组M1有着明显的提升。具体而言,实验组M2的RMSE降低了26.21%,MAPE下降了28.82%,而SMAPE也实现了28.92%的降幅。这一结果不仅彰显了CPOI在优化预测模型中的关键作用,而且验证了网络消费舆情对提升消费者信心指数预测精度的积极影响。
分组实验结果已经证实了加入消费舆情指数的实验组M2模型对预测样本消费者信心指数的更优表现。但为了进一步考量LSTM模型本身的预测效果,本文选择GRU和随机森林模型作为对照模型,并在长期(12期)和短期(6期)不同期限内检验LSTM模型的稳健性。不同期限模型预测结果见
短期 |
长期 |
|||||
RMSE |
MAPE (%) |
SMAPE (%) |
RMSE |
MAPE (%) |
SMAPE (%) |
|
LSTM |
0.6786 |
0.6266 |
0.6251 |
0.7217 |
0.6287 |
0.6266 |
GRU |
1.3468 |
1.2795 |
1.2678 |
1.0889 |
1.1325 |
1.1326 |
Random Forest |
4.5474 |
5.1539 |
5.0240 |
5.0575 |
5.1895 |
5.0283 |
从稳健性来看,当增加预测期限时,LSTM的RMSE上升了6.35%,小于GRU和Random Forest的23.68%、11.22%;LSTM的MAPE上升了0.34%,小于GRU和Random Forest的13.0%、0.69%;LSTM的SMAPE上升了0.24%,小于GRU的11.94%,稍大于Random Forest的0.09%。尽管LSTM的SMPE指标稳健性表现略逊于Random Forest,但总体来说LSTM的稳健性在三个模型中还是最优的。我们可以进一步得出,基于本文实证数据,LSTM模型在预测效果和模型稳健性上均为最佳模型。
本文立足消费舆情视角,从对社交媒体文本的价值进行测度和评价。本文构建了6个主题维度下的Bert情感模型,对2015年1月至2024年5月的178.2万热门微博进行舆情挖掘,并在此基础上融合微博热度和小波变换构建了一个新的网络消费舆情指数量化舆情波动。随后,我们证明了CPOI和CCI的长期均衡关系并进一步验证了CPOI是预测消费者信心的重要指标。得出的主要结论如下:
首先,对Bert预训练模型进行微调后的情感建模准确挖掘了社交媒体环境中的消费舆情。其模型结果在准确率、精确率、召回率、F1等多个评价指标中的表现均显著优于TextCNN,显示出了预训练模型在社交媒体舆情分析领域的优越性。
其次,网络消费舆情指数量化社交媒体环境中的舆情变化,经检验与消费者信心有显著的正向关系。网络消费舆情指数和消费者信心的变化趋势具有一致性,存在长期稳定的均衡关系。从社交媒体文本挖掘消费舆情可以一定程度上反映消费信心的变动情况。
最后,社交媒体舆情影响着市场主体关于宏观经济的判断和预期,对预测消费者信心具有重要作用。本文将构建的CPOI加入对消费者信心的预测模型中,预测效果得到显著提升;同时,对比GRU和Random Forest,本文构造的LSTM模型在准确性和稳健性都更佳。
基于社交媒体文本挖掘的消费舆情提取可以有效弥补传统消费者信心指数的滞后性,为进一步准确掌握消费和经济运行趋势,及时响应市场变化提供有效参考。
本研究由浙江省大学生科技创新活动计划项目(批准号:2024R407C068)资助。