1. 引言
坚持稳中求进工作总基调,保证经济平稳运行是实现行业发展质量全面提升的重要举措。为确保地市级烟草公司经济平稳运行,就需要准确把握市场容量和消费趋势,推动资源进一步向优势品牌规格聚集。然而,由于行业的特殊性,烟草企业在消费者数据收集和研究方面处于初期探索阶段 [1] ,如何从大量杂乱的数据中提取有效信息,从而掌握卷烟市场真实的变化趋势仍是目前工作的难点和重点。为解决上述问题,本文查阅大量文献研究发现行业内已有的文献主要以调研数据为主,研判卷烟消费特征和发展趋势,鲜少有文献基于真实卷烟消费数据分析卷烟消费结构变化趋势。寇明钰 [2] 认为在烟草供给侧改革的时代背景下,市场调研仍是研究卷烟产品和消费实态的重要手段,据此形成了专业化、数字化的标准规范,并期望借此掌握市场卷烟需求、趋势和特点。卢玥彤 [3] 运用实地调研和线上调查相结合的方式收集卷烟年轻消费群体数据,通过对调研数据进行分析,得出年轻群体卷烟结构提升有较大潜力等结论。李云鹤 [4] 等建立了以消费信息采集、消费记录管理、消费会员管理和消费数据分析为一体的卷烟消费跟踪体系,并利用LSTM算法分析预测卷烟消费变化趋势。朱峻 [5] 等依托多平台整合的方式,获取消费者信息,形成区域消费者数据库,在此基础上期望结合卷烟营销,研判消费趋势。已有的文献形成了卷烟市场消费趋势的初步研判方法,但是,在以下几点上仍存在一定的改进空间。一是,当前卷烟消费数据的收集方式普遍以市场调研为主,难以把控数据采集质量且具有明显的局限性;二是,多从零售客户的订购数据或调研结果去分析卷烟市场消费趋势变化,与市场真实状况存在着一定的差异。三是,现有方法多是从卷烟品规消费量增减变化进行分析,忽略了个体消费者对品规的消费变化。据此,本文基于聚合支付收集到的消费数据,通过构建识别消费者卷烟品牌转换行为的模型,分析和测算不同转换行为人群特征和占比,并将其应用于分析卷烟市场消费结构变化趋势及识别消费者卷烟品牌潜在的转换行为。同时,根据消费者在一定时期内购买品规的前后变化,以主销规格为例,探究品规间的替代关系。
2. 理论框架
转换行为是指顾客再次选择购买消费时,被心理或外界影响停止购买消费原品牌的过程,发生在已完成一次购买消费行为并计划发生下一轮的购买行为时,通常是指选择从消费原品牌到某新品牌的转换过程 [6] 。基于转换行为的定义,本文以消费者购买品规的变化为切入口,通过构建识别卷烟品牌转换行为的方法,研判消费者转换行为类别(即消费升级、消费降级和无明显变化趋势),并借助不同类别消费人数占比,分析当期卷烟市场的消费趋势。在此基础上,结合卷烟消费者的消费特征,即在给定时期内个体消费者月消费量是否增长、月消费金额是否增加、周平均购买频率和平均单次消费金额,在消费结构无明显趋势变化的消费人群中寻找有潜在品牌转换行为的消费者。同时,通过分析已发生转换行为的消费人群购买品规的变化规律的共性,运用共词分析方法,寻找不同品规间的替代关系。论文理论框架,见图1所示。

Figure 1. Theoretical framework of the paper
图1. 论文理论框架
3. 研究方法
3.1. 消费者卷烟品牌转换行为定义
根据消费者品牌转换的定义,本文从理论上将消费者卷烟品牌转换行为分为三类,一是消费者倾向于消费更髙价位段的卷烟品规,即实现消费结构升级;二是消费者倾向于消费更低价位段的卷烟品规,即呈现消费结构降级的趋势;三是消费者保持原有消费状态,无明显倾向性,该类消费者需要进一步分析是否具有消费结构潜在升级或降级的趋势。
3.2. 识别消费者卷烟品牌转换行为
基于消费者卷烟品牌转换行为定义,本文需要通过统计卷烟消费者每月的主吸品规的变化,研判消费者转换行为类别。具体方法步骤如下。
(1) 以月为单位统计每名消费者购买数量最多的品规,即认为是该消费者主吸品规;
(2) 结合品规所属价位段,为消费者打上品规标签和价位段标签;
(3) 考虑到价位段标签为文本数据,需要将其进行量化。因此,利用虚拟变量赋值法,按照价位段高低顺序,将8个类型转换为8个虚拟变量,具体见表1所示;

Table 1. Assignment of virtual variables in the price range of product specifications
表1. 品规价位段的虚拟变量赋值
(4) 使用曼–肯德尔趋势检验法(Mann-Kendall)对每名消费者趋势进行分析。曼–肯德尔趋势检验法本质是利用数据秩去分析持续增长或下降趋势的时间序列数据,对数据的要求较为宽松,即数据不需要服从某种分布,也不受异常值的干扰,更适用于顺序变量和类型变量 [7] 。考虑到本文所使用到的数据时间较短且为顺序变量,因此对消费者品牌转换行为的分析采用曼–肯德尔趋势检验法。具体公式如下。
对于时间长度为n的序列x,构造一秩序列:
(1)
其中
的取值是通过对比第 时刻和第j时刻
和
取值的大小,若此时
,则为1,反之则为0。
(2)
可见秩序列
为
大于
的数值个数的累计数。在样本随机独立的假定下定义统计量
:
(3)
式中,
,
为标准正态分布,
和
分别表示
的均值和方差。给定5%的显著性水平下,临界值
,若
在临界值内波动,表示序列变化趋势不明显,则认为该消费者保持原有的消费习惯,无任何趋势变动;若
超过临界值且其值为正,表示序列上升趋势显著,则认为该消费者倾向于消费更高价位卷烟品规,实现了消费结构升级;反之,表示序列下降趋势明显,则认为该消费者消费结构降级。
3.3. 识别消费者卷烟品牌潜在转换行为
在上文识别出消费者卷烟品牌转换行为类别的基础上,本文期望通过分析消费结构升级和降低两类消费者的交易特征,如消费量是否增长、消费金额是否增长、周平均购买频率和平均单次消费金额,在没有明显表现出趋势变化的消费人群中寻找具有品牌潜在转换行为的消费者。接下来,本文将对识别消费者卷烟品牌潜在转换行为的方法进行说明。
已知消费者卷烟品牌转换行为有三种类型:消费升级、消费降级和消费无明显趋势。每一类消费人群在一段时间内的交易行为都有所差异,如消费升级的人群随着购买卷烟价位段不断提升,单次消费金额会随着时间推移增加,消费降级的消费者则会倾向于选择更低价位卷烟,单次消费金额和购买频率会有所下降。根据不同类型的交易行为特征,本文利用多元Logistic回归模型,计算在无明显消费趋势的人群中每名消费者被纳入消费升级、消费降级和消费无明显趋势群体中的概率,若该消费者被纳入消费升级的群体中的概率较大,则认为该消费者是具有消费升级潜力的卷烟消费者。
构建多元Logistic回归模型:
(4)
式中,
表示品牌转换行为为某一赋值的概率;y为当前转换行为的赋值,y在1,2,3中任一取值;
表示回归系数;X分别表示月消费量是否增长、月消费金额是否增长、周平均购买频率和平均单次消费金额,其中为了避免由于数据量纲带来的影响,需要将周平均购买频率和平均单次消费金额对数化。
那么,在某种特定情况下
品牌转换行为为某一赋值相应的概率 [8] [9] 为:
(5)
因此,将消费者的相关特征代入公式,计算得到其被纳入消费升级、消费降级、消费无明显趋势不同类型转换行为的群体中的概率。
3.4. 品牌替代研究
目前,推动卷烟结构提升是行业工作的重点和难点。本文希望通过追踪已经发生卷烟品牌转换行为的消费者吸食品牌的前后变化,借助共词分析方法,寻找不同卷烟品规之间的替代关系。主要思路为:以消费升级为例,某一消费者实现消费升级肯定经过了一个从低价位卷烟中某品规到髙价位卷烟某品规的发展过程 [10] [11] [12] 。此时如果分析出在卷烟结构升级的消费群体中有较多的消费者经历过同样的过程,那么就可以认为上述两品规存在替代的关系。下文将对品牌替代关系的研究模型作进一步说明。
基于前文对消费者每月主吸品规的统计结果,将其归纳为如下矩阵:
(6)
式中,
表示第i个消费者,
表示第i个消费者一段时间内购买过的品规。
统计每名消费者品规出现次数,形成非对称的词频矩阵:
(7)
将该矩阵进行交叉分析,可得到两个不同品规同时出现的次数,将非对称矩阵转变为对称的矩阵形式:
(8)
此时,只要两种品规共同出现次数大于平均水平,本文就可以认为上述两品规之间存在替代关系。
4. 基于大数据的卷烟品牌转换行为实证分析——以Y市为例
4.1. 数据来源与分类
根据聚合支付的推广时间,本文选取了2022年9月至2023年5月的销售数据,在此期间内Y市烟草公司共记录了70多万名消费者,产生了200多万条卷烟商品交易记录,利用Python软件将数据进行预处理,剔除异常、不连续的数据后,最终将3921名消费者作为本文研究的数据样本。
4.2. 识别消费者卷烟品牌转换行为
依据第三部分研判消费者转换行为类别的相关步骤,计算得到2022年9月至2023年5月不同品牌转换行为类别(消费升级、消费降级及无趋势变动)的消费者人数。从不同类别的消费人数占比可以看出(见图2),绝大多数消费者尚未产生品牌转换行为,14.03%的消费者有结构升级的趋势,比消费结构降级的人数占比低1.48个百分点。由此可得,Y市卷烟市场消费整体趋于稳定,有略微下降的趋势。

Figure 2. Figure of the proportion of consumers in different categories of brand switching behavior in Y city
图2. Y市不同类别品牌转换行为的消费者人数占比图
进一步分析不同品牌转换行为下的个体交易特征(见表2)发现,消费结构升级和降级的消费人群产生差异的主要原因是月消费金额增长与否,而月消费量是否增长并不会影响消费者卷烟消费结构的变化趋势。具体表现为结构升级的消费人群平均单次购买金额在54.13元左右,与结构降级的消费人群相比高出17.48元;而其周购买频率在0.17次/每周,较结构降级的消费人群仅低0.08次/周。

Table 2. Individual transaction characteristics of brand switching behavior in different categories in Y city
表2. Y市不同类别品牌转换行为的个体交易特征
4.3. 识别消费者卷烟品牌潜在转换行为
使用公式(4)和(5)对表2的数据进行拟合,得出相关参数,具体见表3所示。

Table 3. Parameter estimation results of multiple logistic regression models
表3. 多元Logistic回归模型参数估计结果
注:参考类别为无明显变化趋势的消费人群;0 b因为此参数冗余,所以将其设为零;*、**、***分别表示在10%、5%、1%的显著性水平上检验显著。Note: The reference category is the consumer group with no significant trend of change; 0b is set to zero because this parameter is redundant; *, **, *** Significantly tested at 10%, 5%, and 1% significance levels, respectively.
表3的模型估计结果显示,−2对数似然值等于112.79,P = 0.00 < 0.01,说明模型整体拟合程度较好,表明模型设定是合适的。在5%的显著性水平下,模型的回归系数均通过检验,说明用各变量去分析消费者是否有发生卷烟品牌转换行为的可能是可行的。上述两个检验也说明了多元Logistic回归模型运用的合理性。
从回归系数的方向来看,对结构升级的消费人群来说(模型2),消费量的增长或消费金额的增加都会导致其结构提升,其中按照系数大小,消费金额的增长作用更为明显。而根据模型1的系数大小和方向,对于消费结构降级的卷烟消费人群来说,消费量的增加在一定程度上会缓解其结构的下降速度。
接下来,利用多元Logistic回归模型计算无明显消费趋势变动的消费者被纳入结构升级、降低和不变群体中的概率,并据此得到在该群体中具有结构提升潜力的消费人数占比。如图3所示,在消费结构无明显变化趋势的消费群体中有20.14%的消费者有提升结构的潜力,但仍有26.08%的消费者将出现卷烟消费结构降级。

Figure 3. Figure of the proportion of consumers with potential structural upgrading in Y city
图3. Y市潜在结构升级的消费者人数占比图
4.4. 品牌替代研究
本文根据第三部分品牌替代研究的相关内容,基于结构升级消费人群的主吸品规变化,运用共词分析方法,构建品规共词矩阵,从而分析不同品规之间的替代关系。由于所涉及到的品规数量较多,为避免影响品规间的共现关系,突出图谱的显示效果,设置关键词的阈值为4,选取主销品规进行展示,得到Y市主销品规共现图谱如图4所示,该图谱中共有20个节点,囊括了177条交易关系。图谱中节点间的连接线的粗细和颜色深浅表示两个品规的替代关系强弱;而节点呈现的颜色不同,若节点呈现红色,则表示两个品规存在直接替代关系,若节点为蓝色,表明两个品规间的替代关系是通过其他品规实现的,即存在间接替代关系。

Figure 4. Co occurrence chart of Y city’s main sales product specifications
图4. Y市主销品规共现图谱
表4梳理了Y市与主销品规存在替代的关系的品规,并根据品规与品规间共现频次的大小顺序,将替代品规划分为替代品规1、替代品规2和替代品规3。不同主销规格的替代品规具体如表4所示。

Table 4. Y city main sales product specification common word matrix table
表4. Y市主销品规共词矩阵表
5. 结论
本文基于聚合支付收集到的消费数据,通过分析卷烟消费者购买品规的前后变化,识别消费者品牌转换行为,研判单一消费者的消费趋势变化,即消费结构升级、降级和无明显变化,并测算不同消费趋势的人群占比,将其用于判断当前卷烟消费趋势。结合卷烟消费者交易行为特征,利用Logistic回归模型,测算无明显趋势变动的消费者中每名消费者被纳入结构升级、降级和无明显变化群体中的概率,以此作为判断其是否产生潜在转换行为的依据。在此基础上,借助共词分析方法,通过分析在已发生转换行为群体中品规变化的共性特征,寻找品规替代关系。
在应用方面,本文以Y市为例,通过利用上述方法和模型,得出以下几点结论:(1) 利用卷烟品牌转换行为识别方法,发现绝大多数消费者尚未产生品牌转换行为,然而,在发生转换行为的消费人群中消费结构升级的人数大于结构降级人数,表明当前Y市卷烟消费市场整体稳定,但仍有下降的趋势。(2) 结合Logistic回归模型的分析结果,可以看出消费结构提升主要通过消费金额增加,消费量的增减的作用并不明显,但对于结构降级的卷烟消费人群来说,消费量的增加在一定程度上会缓解其结构的下降速度。(3) 从潜在转化行为识别结果来看,潜在结构升级的消费人群数量与潜在结构降级的人群数量相比较少,更加印证了结论(1)。(4) 利用共词分析方法,形成不同品规间的共现图谱和共词矩阵,能有效反应品规间的替代关系。
据此,本文期望通过利用卷烟品牌转换分析,准确把握卷烟市场消费趋势,发现品规间的替代关系,为卷烟决策提供参考依据。
参考文献