利用SPSS生存分析探索客户流失情况及影响因素

生存分析(Survival analysis)最早源于分析医学中,是指根据试验或调查得到的数据对生物或人的生存时间进行分析和推断,研究生存时间和结局与众多影响因素间关系及其程度大小的方法,也称生存率分析或存活率分析。后来该分析方法被延伸至各领域,例如下岗再就业的时间,机器从使用到发生故障的时间,顾客排队等待时间,再到如今的通讯服务、零售等的客户流失情况分析。生存分析方法的优点在于无需考虑数据的分布形态,同时可以处理删失数据。

某电信公司在减少客户群中客户流失方面,持续采取应对举措。应对客户流失的首要步骤是识别流失客户的特征,从而针对该特征客户采取措施以避免和减少流失。利用生存分析模块下的寿命表方法可以对各类别下的客户流失情况进行统计。

该电信公司提供的数据包括客户的多项背景资料。数据中,每个个案对应一个单独的客户,详细记录了每个个案的人口统计基本信息以及其所使用的电信服务信息。

IBM SPSS Statistics中的“分析”菜单中运行寿命表,并自定义相应输出,即可完成相应分析。

survival1

survival2

由上述分析可知,相较于未婚客户,已婚客户流失曲线更为平缓,也即更为稳定不易流失。而未婚客户流失相对较快,在使用服务10个月时预计流失10%以上。

survival

由上述分析可知,相较于未婚客户,已婚客户流失曲线更为平缓,也即更为稳定不易流失。而未婚客户流失相对较快,在使用服务10个月时预计流失10%以上。

由以上生存曲线可以看到,客户最大流失比率出现在第一年,这意味着电信公司应该在第一年对客户进行管理,提高服务满意度。不仅如此,随着客户学历增高,其累积生存率也下降越快,这说明学历低的客户流失相较于学历高的客户流失更慢。

除了观察生存曲线,我们还应当对样本进行总体比较和成对比较,以确认是否至少有两组存在差异,以及究竟哪两组之间存在显著差异。

该电信公司通过对客户各类别进行生存分析,可观察不同条件下客户流失情况,识别影响客户流失的因素,进而采取相应措施进行客户关系管理。

注:由于保密的原因,数据分析结果已被人造数据替代

 

Chinese, Simplified(简体中文)