- · 《湖南工程学院学报(社[05/20]
- · 《湖南工程学院学报(社[05/20]
- · 《湖南工程学院学报(社[05/20]
- · 《湖南工程学院学报(社[05/20]
- · 《湖南工程学院学报(社[05/20]
- · 《湖南工程学院学报(社[05/20]
大数据时代中小型零售企业客户细分实证研究
作者:网站采编关键词:
摘要:大数据时代,来源于多平台的数据飞速增长和累积。这些数据形态各异、种类繁多,数量巨大,利用价值率低。企业能够获得产品销售数据和运营数据以及客户行为数据和购买数据等多
大数据时代,来源于多平台的数据飞速增长和累积。这些数据形态各异、种类繁多,数量巨大,利用价值率低。企业能够获得产品销售数据和运营数据以及客户行为数据和购买数据等多维数据。[1]如何通过对数据进行分析、挖掘出庞大的客户群,建模细分客户,进行准确定位,达到精准营销是企业面对的难题。目前,“大数据”成为研究的热点和关注的焦点,在零售、金融、医疗、电信和制造等各个行业都在进行“大数据”的收集、分析和应用。张勇(天猫前CEO)讲到“未来任何一个企业的商务活动都离不开大数据”。[2]对于目前占市场主体超过90%的中小型零售企业,数据的价值在于经过采集、处理、分析以后成为有效的数据才能给企业带来商业价值。中小型零售企业大多缺乏科学的客户价值评估体系和客户细分方法,客户细分通常依靠业务人员的主观判断,正确性未免受到个人主观意识和情感因素的影响。有些中小型零售企业根本没有进行客户细分和客户价值的评估,同等对待每位客户,没有针对客户的不同特点和需求采用不同的营销策略,在进行营销活动时,只是随机的或者挑选部分客户发送微信、短信或者邮件,触达客户。[3]本文着眼于中小型零售企业,基于大数据对客户进行分类。将客户进行分类管理能帮助中小型零售企业优化资源配置,对中小型零售企业进行高效、精准营销意义重大。
一 基于大数据客户细分文献综述
客户细分是指将属性特征相同的客户群划分为同一群组,它能有效识别客户需求,有助于企业最终实现精准营销。[4]国内外学者研究发现客户细分方法主要基于人口统计、购买行为、生活方式和利益等四类。[5]基于购买行为的客户细分方法目前采用的比较多,它以信息技术为支撑,以数据为基础。RFM模型是最典型的基于客户购买行为的细分方法。[6]它是由Hughes提出,由最近一次购买时间(Recency)、购买金额(Monetary)和购买次数(Frequency)三个维度组成,每个维度只有一个指标。[3]而客户的消费行为是非常复杂的,三个指标不能完全反映客户的购买和价值。整理相关的文献综述发现,国内外学者基于RFM模型进行客户细分时,通常细化RFM指标或者对RFM模型进行拓展和延伸。吕斌和张晋东利用RFM模型对商业银行客户细分时,把每个指标细化为三个级别,另外最近购买时间由交易间隔天数替代。[7]曾小青通过深入研究传统RFM模型,构建了3个维度10个细分指标的新RFM模型,并选取某大型纸巾生产企业进行实证研究,说明了多指标客户细分方法的科学性。[8]赵萌针对企业客户线上评论所带来的价值,改进了传统的RFM模型,提出RFMP模型。[9]徐翔斌在RFM模型的基础上,增加了商品总利润指标,提出了RFP模型,并选取某电子商务企业进行实证分析,结果显示比原始RFM模型对客户细分更加准确。[10]
不同的客户细分指标重要程度不同,所以要对指标赋予不同的权重。梳理国内外学者对于客户细分指标的权重的研究结果显示,指标权重的赋予有两类:以熵值法为代表的客观评价赋值法和以层次分析法为代表的主观评价赋值法。[11]马玉芳和王扶东、熊兰和高炳采用层次分析法确定指标权重。[12]赵萌[9]、蔡玖琳[11]采用熵值法确定各指标的权重。主观评价赋值法易受评价者的判断能力的影响,评价结果可能产生随意性;客观评价赋值法注重应用数学理论,不受评价者主观因素的影响。综合已有研究,很少涉及利用大数据指导中小型零售企业的经营活动。本文基于大数据背景下,着眼于中小型零售企业,构建客户分类指标体系,提出一种改进的RFM模型与K-Means相结合,并应用熵值法确定各指标权重,得出客户细分模型,为中小型零售企业决策提供参考。
二 客户细分模型的构建
(一)客户分类指标体系的构建
传统的RFM模型每个维度只有一个指标,指标的划分标准过于宽泛。而客户的购买行为非常复杂,传统的RFM模型不能全面体现客户的购买行为,无法体现客户交易的变化趋势。因此本文结合中小型零售企业的特点,对传统的RFM模式进行改进,拓展维度并细化指标,构建多指标的客户分类指标体系(见表一)。用客户的本身指标值与全体客户对应的指标均值的比值来反映客户在这个属性上的相对位置。而客户已经购买商品种类数目也在某种程度上体现了客户的潜在价值,和购买多种相关产品的可能性。客户保持时间在一定程度上体现客户的忠诚度。
表一 客户细分指标体系
细分维度细分指标及其含义R:消费间隔时间R1:客户交易近度R2 :客户交易近度与全部客户平均交易近度比值F:消费频次F1:客户交易频率F2:客户交易频率与全体客户平均交易频率比值M:消费金额M1:客户平均交易金额M2:客户平均交易金额与全体客户交易金额比值T:客户保持时间T:最近购买时间和最初购买时间的差额C:交叉销售量C:客户不重复消费产品种类
细分指标说明:
R1:最近一次交易距离实验指定时间节点的时间间隔。
为了验证以上所提出的客户细分方法的有效性,选取某中小型零售企业的会员客户的消费数据进行测试(由于本文所采用的数据涉及商业机密,所以不便指出该中小型零售企业的名称和列出大量的客户数据)。数据的特征维度有会员客户基本信息,如会员编号、年龄、职业、性别、住址、入会时间等;交易信息,如商品编号、商品名称、交易数量、交易时间、单价、交易金额,等等。本文选取该中小零售企业的所有会员的交易行为进行研究,交易数据共451 745条。首先对数据进行预处理,对存在噪声、缺失值和不一致的数据进行清理,最终保留了38 672条会员客户信息和421 631条交易信息。本文只考虑与客户分类指标相关的属性,因此最终确定会员的入会时间、消费时间、消费商品编号和消费金额等属性。
应用型本科建设最早是在2014年教育部提出,要将全国1 000多所本科院校中的一半向应用型大学转变。应用型本科教育强调培养学生的实践能力和操作技能,它的提出使得高等院校的本科教育不再只关注理论教学和科研,转而更加重视应用型人才的培养。为贯彻落实教育部提出应用型本科教育的转型发展,武汉商学院在2015年申报并获批成立国际商务专业。该专业的目标是培养学生具备较强的社会适应能力、国际商务交际能力、商务素养、商业技能和处理商业实务的能力。本研究选择国际商务专业为研究对象,探索国际商务专业在校企合作背景下培育高素质技能型人才的模式。
值越大越好的正向指标:
F1:客户在样本数据时间段内的交易频率。
F2:F2越小,说明客户的忠诚度越低,其能间接反应客户对企业的忠诚度和依赖性。
M1:客户平均交易金额,其能反映客户对企业的贡献,M1值越大,说明给企业贡献的利润越大。
4.计算指标j的差异系数:
M2:如果M2大于1,说明该客户对企业的贡献高于平均水平。M2越大客户对于企业的贡献越大。
春天来了,草木萌发,花开遍地,少女内心那种无以言说的春意,被蒋海峰捕捉到了,情感也由此升温。在无人的草地上,水仙芝接受过蒋海峰的拥抱,甚至让他用温暖的手,覆在她那青涩的丰盈上。
T:体现顾客忠诚度的指标,T越大忠诚度越高,反之,忠诚度越小。
IT技术的不断发展使得培养应用型人才的大学有必要及时更新教材。将当今社会流行的新方法、新技术源源不断地填充到实际的教学内容中,为学生毕业能够更好地融入行业,具备企业要求的能力打下结实的基础。然而,目前信息工程学院部分教材的内容仍然延续了传统教育的理念,离企业、行业要求的理论和技术还有很大的差距。这需要将大学教科书与企业需求相结合,将理论与实践联系起来,并利用各自的优势。它更符合社会的要求和时代的发展,编写适合应用型人才的新教材。
C:交叉销售量,C越大说明对该类客户交叉销售的可能性越大,更容易促进他们购买品类繁多的商品。
(二)客户细分指标赋权
由于每个细分指标对确定客户类别的影响程度不同,需要对客户细分指标赋权。熵值法是一种客观赋权法,是根据每项指标观测值所提供的信息的大小来确定指标权重,避免了人为因素的影响[4]。因此本文采用熵值法对各指标赋予权重。假设原始数据集存在m个客户,n 个指标,Xij 表示第i个客户的第j个指标的取值。分为以下五个步骤:
1.原始数据标准化处理,本文构建的客户分类指标体系存在正、负向指标,需对它们分别处理。[13]
R2:R2的值越小,表明客户对企业越依赖,流失概率越小。
就像我的大舅早年就出去当兵了,很少回家,外婆也一直是我的母亲照顾,这样的孝道意识,我的父母很早就体会到了,也潜移默化地影响了我。
dj=1-ej
2.计算第i个客户第j个指标的比重:
临床资料和研究结果采用SPSS23.0软件进行统计分析,计量资料以(±s)表示,计数资料用%表示,组间比较分别采用t检验和χ2检验,P<0.05表示差异具有统计学意义。
3.计算指标 j 的信息熵:
1.2.2 创面换药+创面清创植皮对照组 对对照组实施创面换药、创面清创切除创面坏死组织,反复换药致感染创面控制,创面生长肉芽组织后再行二期手术植皮修复创面治疗。
值越小越好的负向指标:
对于指标j,特征值差异越大,其所起的作用就越大,熵值ej就越小,由公式可知dj越大的指标越重要。
她第一次去香港,在罗湖口岸排队办理八达通卡,正站在他的身后。他大概很厌烦晨起,头发蓬乱着,不时地打着不耐烦的哈欠。像处在梦游状态一般,他甚至忘记拿找零的五元钱。
5. 计算每个指标的权重:
(三)客户细分聚类方法的选择
K-Means算法简单、快捷,被广泛应用于科学研究和企业处理大规模数据聚类分析中。K-Means算法是定量方法,具有“理论上可靠,应用上高效”等优点。任何算法都没有十全十美,K-Means算法的不足在于确定聚类数目K对初始类质心的依赖,解决此问题可以通过多次聚类进行优化,确定初始类质心和聚类数目。[3]另外,K-Means算法对数据比较敏感,均值受到孤立点数据和噪声数据的影响很大,解决此问题通常通过数据的选择、清理和整理以及对数据进行标准化处理。[14]鉴于K-Means算法的优缺点,本文采用K-Means算法对中小型零售企业客户进行聚类分析。
(四)客户细分流程
改进RFM模式和采用K-Means聚类分析方法,提出中小型零售企业客户细分方法(见图1)。
图1 基于大数据客户细分流程图
三 实证分析
(一)数据的获取与预处理
2.3 健康素养单因素分析 35岁以上孕产妇健康素养合格率明显高于20~24岁、25~29岁、30~34岁,差异有统计学意义(P<0.05);定期参加孕妇教育健康素养合格率明显高于从未参加与偶尔参加者,差异有统计学意义(P<0.05);月收入5 000元以上孕产妇健康素养合格率明显高于2 000元以下,2 000~4 999元者,差异有统计学意义(P<0.05);小学、中学、大专及以上孕产妇健康素养合格率相比,差异无统计学意义(P>0.05)。见表2。
(二)指标值计算并赋权
应用熵值法对各指标进行赋权,通过计算各指标的权重为(0.041 266 15,0.045 584 16,0.116 868 89,0.079 890 16,0.358 031 16,0.044 814 16,0.282 545 16,0.031 000 01),通过计算得到加权后的新的数据集。
表二 指标值特征统计表
最大值最小值均值标准差R10.095 6430.036 5400.043 3800.058 325R20.194 3180.008 7460.071 5230.040 172M10.435 6780.123 2500.320 1860.211 279M20.326 7740.000 0000.013 4690.012 567F10.443 7450.132 5800.201 6300.128 580F20.096 7240.026 7270.319 1330.271 098T0.305 8910.027 8930.125 3920.003 289C0.966 1020.243 1890.476 5630.500 362
经过数据准备阶段,对本文所构建的客户分类指标体系中各指标值计算并进行标准化,得到各项指标值特征描述(见表二)。其中前两项为负向指标,其余为正向指标。
(三)K值的确定
1.K值的确定在使用K-Means聚类方法中非常重要,对聚类结果有很大的影响。聚类数目K不易过多,一般经验取值范围在2到8之间。因此本文按照上述权重调整后得到的数据集进行聚类,并采用多次聚类来确定K值。在聚类结果中,通过类内平均距离和泛化能力来观测聚类质量。[4]K-Means聚类要求类内平均距离尽可能小,而泛化能力尽量大。根据表三可知,随着聚类数目的增加,类内平均距离越来越小,但当K=4时开始减小的幅度越来越少。泛化能力也随着聚类数目的增加越来越大,但当K=5时泛化能力大幅增加,此后增长忽略不计。所以K取值为5时最合适。
实验采用介质阻挡放电管作为系统负载进行了实验,其中,介质阻挡放电管实物图如图8所示,采用同轴圆筒电极结构。其中,控制系统大致包括电流电压温度等采集电路、信号调理电路、DSP28335最小系统、开关管驱动电路、故障报警与保护电路等。如图7 所示,首先设置输出电压为8 kV,检验电极长度5 cm,实验结果如图8~图10所示。最后将输出电压调至16 kV,检验电极长度5 cm时的电源稳定性及放电状态,实验结果如图11~图13所示。
表三 改进RFM模型聚类数目结果
聚类数目K类内平均距离泛化能力 2 0.21000.4330.15000.5840.01900.7950.01800.9160.01790.9170.01780.9180.01780.91
2.对相同的数据集采用传统的RFM模型进行聚类,聚类结果如表四所示。
表四 传统的RFM模型聚类数目结果
聚类数目K类内平均距离泛化能力 20.2600.5230.1300.584 0.0800.7650.0740.7860.0260.8070.0240.8280.0210.82
与表三对比说明,改进的RFM模型的聚类结果,在泛化能力上及类内平均距离都优于传统的RFM模型。
(四)K-Means聚类实现及结果分析
聚类数目K=5,采用改进的RFM模型对新数据集进行聚类,经过K-Means算法得出聚类结果如表五所示。
表五 K-Means聚类结果
人数百分比(%)保持时间(众数)平均消费种类平均近度平均交易频次平均消费金额C13.987312974943 597C218.306183563620 365C330.204154352110 961C430.9029501125 321C516.602552369 873
第一类,VIP顾客(C1)。VIP顾客的特点是其交易频率高于平均交易频率,平均消费金额远高平均水平,而且消费的产品种类繁多,保持时间也远高于顾客平均保持时间。这类顾客人数占总顾客的比例不到4%,却是企业的购买主力。因此,中小型零售企业应高度关注并与该类顾客保持良好的顾客关系,为该类顾客提供优质服务,提供良好的顾客体验,提高满意度。
遂行食管调搏检查进一步明确诊断。插管深度34 cm,起搏阈电压14 V,食管心电图见P波与QRS波无传导关系,表现出房室分离现象,考虑为左前分支室性心动过速。尝试行心房刺激终止心动过速。首先采用频率为250次/min的S1S1连续刺激可夺获心房,但未能终止心动过速,逐渐加快刺激频率,予频率300次/min的S1S1刺激,连续刺激10次,成功终止心动过速,转复窦性心律(图2)。心动过速终止后行12导联心电图检查,提示窦性心律,心率约128次/min,PR间期108 ms,QRS波时限为71 ms,电轴40°,无束支阻滞图形(图3)。
第二类,忠诚顾客(C2)。忠诚顾客的特点是其平均消费金额略高于整体顾客平均交易金额,但不及VIP顾客,消费的产品种类与平均水平持平,但是其交易频率和保持时间均高于整体顾客水平。该类顾客消费金额不高,交易频率比较高,保持时间比较长,属于忠诚度比较高的一类顾客。这类顾客对企业非常信任,为企业带来了很大的收益,是企业必不可少的。因此,中小型零售企业应高度重视此类顾客,激励此类顾客并把他们逐步发展成为高忠诚度的VIP顾客。
第三类,一般顾客(C3) 。一般顾客的特点是其平均消费金额、交易频率、保持时间及消费产品的种类接近整体顾客的平均水平。一般顾客数量占整体顾客的比例非常高,达到30%左右,属于比较稳定的顾客,有潜力进一步发展的顾客。针对此类顾客,中小型零售企业可以加强促销攻势,刺激其购买欲望,以提高其消费金额。
第四类,易流失顾客(C4)。易流失顾客的平均消费金额远远低于顾客整体平均,交易频率和保持时间也低于整体顾客的水平,购买产品的种类比较少,该类顾客属于流动强,易流失的顾客,该类顾客占全部顾客的比例达到30%。易流失顾客给企业带来的经济效益比较少。针对此类顾客,中小型零售企业可以适当降低对他们的投入,或者选择部分产品适当采用低价策略去稳定此类顾客,以此带动其他产品的销售。
第五类,徘徊顾客(C5) 。徘徊顾客的平均消费金额接近顾客整体的平均消费金额,但交易频率远远低于整体顾客的平均水平,而且保持时间也低于顾客整体平均保持时间。针对此类顾客,中小型零售企业无需投入太多资源,维持现状即可。
五 结 语
在大数据时代背景下,中小型零售企业如果能从大数据中挖掘出有价值的信息,并加工处理,对客户进行精准营销,对提高客户的满意度和企业的效益意义重大。[4]传统的RFM模型不能全面体现客户的购买行为,指标划分标准过于宽泛,本文提出了一种改进的客户细分方法,对传统的RFM模式进行改进,拓展成5个维度并细化为8个指标,构建多指标的客户分类指标体系,通过熵值法为各指标赋权,并采用K-Means聚类将客户分成5类。针对5类客户采用不同的经营策略。对某中小型零售企业客户细分的实证研究说明,该客户细分方法在类内平均距离和泛化能力上都优于传统的RFM模型,说明方法可行、有效。
[1] 姜 疆.大数据给销售插上翅膀[J].新经济导刊,2018(3):64-68.
[2] 张 涵. 大数据:智慧商业的“中枢”[J].现代商业,2016,41(2):37-41.
[3] 贾晓丹.某化妆品公司客户细分实证研究[D].兰州财经大学硕士学位论文,2018.
[4] 吴明礼,黄亚非.基于聚类的多指标客户细分方法[J].电脑知识与技术,2018,36(2):18-21.
[5] 刘英姿,吴 昊.客户细分方法研究综述[J].管理工程学报,2006,20(1):53-57.
[6] 俞守华,张 琦.基于客户细分的Y公司客户关系管理研究[J].当代经济, 2018,24(15):106-110.
[7] 吕 斌,张晋东.基于RFM模型的商业银行营销决策分析[J].统计与决策,2013,54(14):65-67.
[8] 曾小青,徐 秦,张 丹,等.基于消费数据挖掘的多指标客户细分新方法[J].计算机应用研究,2013,30(10):2944-2947.
[9] 赵 萌,齐佳音.基于购买行为RFM及评论行为RFMP模型的客户终身价值研究[J].统计与信息论坛,2014,53(9):91-98.
[10] 徐翔斌,王佳强.基于改进 RFM 模型的电子商务客户细分[J].计算机应用,2012,32(5):1439-1442.
[11] 蔡玖琳,张 磊, 张秋三.一种基于数据挖掘的零售业客户细分方法研究[J].重庆工商大学学报,2015,32(2):43-48.
[12] 熊 兰,高 炳.基于RFM多层级客户价值模型的客户细分研究[J].商业经济研究,2017,21(5):55-57.
[13] 邓楚雄,谢炳庚.湖南省城镇建设用地集约利用研究[J].经济师,2011(8):17-18.
[14] 谢 飞.零售企业会员消费数据分析与研究[D].首都经济贸易大学硕士学位论文,2010.
Research on the Customer Segmentation of Small and Medium-sized Retail Enterprises in the Era of Big Data
文章来源:《湖南工程学院学报(社会科学版)》 网址: http://www.hngcxyxb.cn/qikandaodu/2020/0520/346.html