随着互联网和电子商务平台的发展,目前我国已经成为最近几年全球最大的网络销售市场,网络购物这一消费模式也已经逐渐成为我国国民日常生活当中必不可少的一种生活方式。销售预测作为一种重要的应用性问题,能够为商家提供更加准确的以销定产,避免产品积压;合理管理产品库存,安排生产进度;及时的产品增补,避免供不应求等现象的产生。与传统的线下门店销售相比较,电子商务具有数据采集简易、数据处理迅速、数据量庞大等优势,可以利用这些优势更加便捷地进行商品销量预测,来为电商提供货备,营销策略等方面的调整策略。论文使用了某电商网店的历史销量数据,在Keras框架下搭建了三层LSTM神经网络模型,对比分析了CNN模型、传统的LSTM模型、ARMA-SVR组合模型,以及WaveNet-LSTM模型的预测的运算结果,得到新模型在预测准确度,训练效率等方面都有更大的优越性。 With the development of the Internet and e-commerce platforms, China has become the world’s largest online sales market in recent years. Online shopping, a consumption mode, has gradually become an indispensable way of life in the daily life of Chinese people. As an important application problem, sales forecast can provide more accurate sales target for merchants and avoid product overstocking. Manage product inventory reasonably and arrange production schedule; Timely product supplement, to avoid the phenomenon of short supply. Compared with the traditional offline store sales, e-commerce has the advantages of simple data collection, rapid data processing and huge data volume. We can make use of these advantages to forecast the sales volume of goods more quickly, so as to provide e-commerce with inventory, marketing strategy and other adjustment strategies. This paper uses the historical sales data of an e-commerce shop to build a three-layer LSTM network model under the framework of Keras. The calculation results of CNN model, traditional LSTM model, ARMA-SVR combined model and WaveNet-LSTM model are compared and analyzed, and the prediction accuracy, training efficiency and so on of the new model obtained have greater superiority.
随着互联网和电子商务平台的发展,目前我国已经成为最近几年全球最大的网络销售市场,网络购物这一消费模式也已经逐渐成为我国国民日常生活当中必不可少的一种生活方式。销售预测作为一种重要的应用性问题,能够为商家提供更加准确的以销定产,避免产品积压;合理管理产品库存,安排生产进度;及时的产品增补,避免供不应求等现象的产生。与传统的线下门店销售相比较,电子商务具有数据采集简易、数据处理迅速、数据量庞大等优势,可以利用这些优势更加便捷地进行商品销量预测,来为电商提供货备,营销策略等方面的调整策略。论文使用了某电商网店的历史销量数据,在Keras框架下搭建了三层LSTM神经网络模型,对比分析了CNN模型、传统的LSTM模型、ARMA-SVR组合模型,以及WaveNet-LSTM模型的预测的运算结果,得到新模型在预测准确度,训练效率等方面都有更大的优越性。
销售预测,LSTM,电子商务
Bowen Hu, Jun Li
School of Computer Technology, Qingdao University, Qingdao Shandong
Received: Nov. 25th, 2021; accepted: Dec. 21st, 2021; published: Dec. 28th, 2021
With the development of the Internet and e-commerce platforms, China has become the world’s largest online sales market in recent years. Online shopping, a consumption mode, has gradually become an indispensable way of life in the daily life of Chinese people. As an important application problem, sales forecast can provide more accurate sales target for merchants and avoid product overstocking. Manage product inventory reasonably and arrange production schedule; Timely product supplement, to avoid the phenomenon of short supply. Compared with the traditional offline store sales, e-commerce has the advantages of simple data collection, rapid data processing and huge data volume. We can make use of these advantages to forecast the sales volume of goods more quickly, so as to provide e-commerce with inventory, marketing strategy and other adjustment strategies. This paper uses the historical sales data of an e-commerce shop to build a three-layer LSTM network model under the framework of Keras. The calculation results of CNN model, traditional LSTM model, ARMA-SVR combined model and WaveNet-LSTM model are compared and analyzed, and the prediction accuracy, training efficiency and so on of the new model obtained have greater superiority.
Keywords:Sales Forecast, LSTM Model, E-Commerce
Copyright © 2021 by author(s) and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
近年来我国电子商务发展迅猛,电商之间的竞争也日益激烈,与此同时,电子商务相对于传统的线下零售商业环境,更具有动态性和复杂性,在为各个电商提供全新的发展机会的同时也提出了全新的挑战。面对国内外电商市场的动态性和复杂性,销售额预测则成为大多数电商企业亟需解决的一个应用性问题。对电子商品销量的预测可以很大程度上压缩相关产品生产企业的存货周转周期,降低货物对企业流动资金的挤压,进而提升自身的经济效益 [
当下商品销售预测主要分为基于统计学的方法,基于机器学习的方法,基于数据挖掘的方法,和基于深度学习的方法 [
常炳国,臧虹颖等针对时序模型中无法捕捉商品销量中的非平稳性和非线性特征,提出了一种将时间序列线性回归模型与智能非线性回归方法组合的预测模型,改善了ARMA模型在平稳及非平稳时序下的预测效果 [
长短期神经网络是由循环神经网络发展而来,RNN的展开结构如图1所示。在时间序列预测中循环神经网络是使用频率相当高的一种网络,这一神经网络的具体结构示意图如下图2所示,这一图表当中对结构进行了全面的展示,在下图当中,这一神经网络所示有一个个紧密联系的神经元共同构成,形成了一个密闭的循环,而神经网络的右侧就是这一模型在计算过程当中的时间序列,其中 x t 时间输入, s t 代表输入时的这一时刻,而 o t 则代表输出的时刻,由此我们可以得出结论: o t 取决于 x t ,我们将数据按照时间顺序依次在神经网络的输入层植入,就可以获得与时间向关联的问题结果。但是最终决定实际结果的往往会与最终输入的数据直接相关,之前输入的数据会由于时间的逐渐流失而失去作用,所产生的效果也越来越低。针对时间长短的相关问题,提出了LSTM。
图1. RNN神经网络的展开结构
相较于上述的RNN神经网络,长短期记忆神经网络在内部结构的设计方面更加精细,加入了更多的输入和输出单元,具体的单元结构图如下图2所示。其中 x t 输入时间, h t 表示状态值。图中三个大框分别表示不同时间点,神经细胞的实际状况,针对这一状况,本文将神经细胞的状态通过作图的模式展示出来,具体展示图如下图3所示 [
图2. LSTM网络结构图
图3. 放大的神经元结构图
从图3可以看出,LSTM模型当 x t 和上一状态传递下来的 h t − 1 进行向量拼接乘以权重矩阵得到四个状态函数和输出分别如下:
i t = δ ( w i ∗ ( x t , h t − 1 + b i ) ) (1)
f t = δ ( w f ∗ ( x t , h t − 1 + b f ) ) (2)
o t = δ ( w i ∗ ( x t , h t − 1 + b o ) ) (3)
g t = tanh ( w g ∗ ( x t , h t − 1 + b g ) ) (4)
c t = c t − 1 ∗ f t + i t ∗ g t (5)
h t = o t ∗ tanh ( c t ) (6)
其中 i t , f t , o t 通过前面的sigmoid激活函数转换成0到1之间的数值,而构成门控单元,而 g t 则是将结果通过tanh激活函数转换成−1到1之间的数值作t时刻输入细胞的候选状态值。
在完成相关的数据计算之后,这一模型会通过对上一个节点输入的数值进行选择性忘记,相关的忘记功能具体流程时通过忘记门控实现的,而具体的忘记内容则通过神经细胞上一个状态当中的数据进行选择。
想要对输入的数据 x t 进行筛选,并将其中对于后续预测有帮助作用的数据进行选择性的记忆时,这一模型的具体操作就是将需要记忆的数据进行输入,最终由上文当中的公式4进行计算,得出最终的记忆结果,对于数据的筛选功能则主要是通过上文当中的公式1实现的,两者的结果整合到一起传输到神经细胞的下一个状态当中 c t 。
LSTM输出当前的状态 h t 。主要是通过 o t 和tanh激活函数对 c t 进行缩放控制,使其具有长时间的记忆功能。
为分析与预测电商销售中的销售量的演变规律,验证模型的有效性。本节利用某电商企业两年的网络历史销售数据展开对该电商企业未来销售状况的预测,在具体展开预测之前,首先应该进行的工作就是对上文中所提到的数据进行收集,并将数据进行整理与归纳,再过对数据进行清洗、处理转换成模型所需的标准数据格式。本文采用深度学习中的LSTM模型进行预测。深度学习主要有TensorFlow、Caffe、Pytorch以及Keras框架。Keras根植于Python,拥有简单便捷的模型搭建方式。本文采用Keras网络框架来进行模型搭建。预测的基本步骤如图4所示:
图4. 实验流程图
相对于线下门店销售来说,天气,人口流动等因素对于电商销售的影响相对较小,而在双十一等活动日期会有较大的销售高峰,因此本文先对于激增日进行识别,然后对其进行One-Hot编码与季节,营销策略等一同添加到数据中。之后再将得到的数据进行归一处理确保数据的绝对数值不会过大,以满足LSTM模型所用的双曲正切激活函数,便于模型训练效率的提升。
x = x − ( x max + x min ) / 2 ( x max − x min ) / 2 (7)
其中 x max 和 x min 为商品销量的极大和极小值。
模型对比都采用了用四种模型中表现最好的一组。
MAE = 1 n ∑ i = 1 n | y ^ i − y i | (8)
MAPE = 100 % n ∑ i = 1 n | y ^ i − y i y i | (9)
RMSE = 1 n ∑ i = 1 n ( y ^ i − y i ) 2 (10)
其中 y ^ i 是第i天的实际销售值 y i 是模型预测值,n为模型采用的商品销售数据的天数。
本文利用Keras框架来搭建该模型。模型结构如图5所示:
图5. 模型结构图
本文采用了三层LSTM网络叠加的方式进行所需网络模型的搭建,为防止过拟合情况的出现增加模型的预测精度,在每一层的LSTM网络后添加dropout,池化层系数的选择过大会导致节点向量过于稀疏,不利于获取数据特征,过小会导致模型过拟合现象的产生。本文dropout设置为0.3。为防止梯度爆炸的现象产生,在隐含层添加tanh激活函数,相比于sigmoid函数有更加迅速的收敛速度 [
图6. 消融比较
通过对不同层数的LSTM进行消融实验,可以发现多层次的LSTM进行叠加会有更好的预测效果,最后选择三层的LSTM作为本实验采用的模型,预测效果显著高于低层次的模型。同时越多层次的叠加会产生更高的计算消耗以及增加过拟合的几率,通过实验得知,三层的LSTM模型是最优选。
下面是不同模型进行的定性实验比较,比较结果如图7~10所示:
图7. 与CNN模型对比结果
图8. 与传统LSTM对比结果
图9. 与ARMA_SVR模型对比结果
图10. 与WaveNet-LSTM模型对比结果
由图7~10可以看出,本文所采用的多层LSTM模型更好的拟合了销售数量的变化趋势,通过对比CNN网络、传统LSTM网络,以及ARMA-SVR网络、WaveNet-LSTM网络我们可以发现本文所采用的三层LSTM网络模型有更高的预测精度。预测结果如表1所示:
Model | MAE | MAPE | RMSE |
---|---|---|---|
CNN | 0.03287 | 185.416 | 0.04668 |
LSTM | 0.03148 | 226.193 | 0.04522 |
ARMA-SVR | 0.03401 | 224.785 | 0.04772 |
WaveNet-LSTM | 0.02911 | 184.771 | 0.04417 |
OURS | 0.02892 | 111.317 | 0.04301 |
表1. 五种方法的预测性能指标
表1展示了五种预测模型调参后在MAE、MAPE和RMSE上的最优表现。从上述结果当中我们不难得出前面两种模型CNN和传统的LSTM模型最终的预测结果准确度一般,LSTM模型和WaveNet-LSTM模型在采用LSTM长短期记忆网络后,对预测的精度明显上升,证实了在销售预测方面以LSTM方法为基础的模型更具备优势性作用,而本文所提出的LSTM模型在实际应用过程当中相较于传统数据计算模型来说有着较大的效率提升功能,在平均绝对误差上提升最大,证明了该模型在长时间预测过程中的稳定性。
在发展迅速的电子商务中,电商销售预测成为大多数电商企业对于日常库存储备管理以及销售方式制定的重要指标,本文利用深度学习技术,采用三层LSTM网络叠加的方式,以及每一层LSTM网络中间加入池化层,在现有的技术基础之上将传统销量预测方式进行升级,根据商品的以往销售历史数据,以及影响变量的不同,详细介绍多层LSTM网络模型的应用方式,预测结果与实际结果进行对比,比CNN网络、传统LSTM网络,以及ARMA-SVR网络、WaveNet-LSTM网络等深度学习网络都有更加精准的预测结果。该模型在数据输入,网络结构搭建,性能提升训练效率等方面具有显著的优越性。该研究针对电商商品数据回流快的特性,利用本文提出的多层LSTM神经网络对商品进行销量预测,不仅为电商企业提供了更加精准的预测结果,也为双十一等销售高峰时期提供库存储备的意见,还有助于利用不同隐性因素制定更加完善的商品销售模式,减少了库存积压,增加了销售份额,实现了经营利润的提升。下一步,将针对不同影响因素对于商品销售数量的关系进行研究,利用海量的销售数据,来发掘在不同影响因素改变的情况下怎样实现盈利最大化。
胡博文,李 军. 基于多层LSTM的电商商品销售预测Sales Forecasting Method of E-Commerce Products Based on LSTM[J]. 计算机科学与应用, 2021, 11(12): 3081-3090. https://doi.org/10.12677/CSA.2021.1112311