青海民族大学,青海西宁,810000;
摘要:本文主要研究了银行客户流失预测问题。为了探究客户流失的原因,本研究选取了年龄、性别、所处国家、姓氏作为核心解释变量,并控制了CreditScore、Tenure、Balance、NumOfProducts、HasCrCard、IsActiveMember、EstimatedSalary等冗余变量。使用Logistic回归和随机森林模型对客户流失进行因果推断,并在训练集上启用5折交叉验证。经过分析,年龄对银行客户流失的影响存在门槛效应,在50-60岁之前,年龄越大的客户越容易流失;而在50-60岁之后,年龄越大的客户粘性越大。本文还发现客户的性别以及所处国家(或者说所说的语言)对客户流失也有显著的异质性影响:女性客户比男性客户更容易流失,说德语的客户比说法语以及西班牙语的客户更容易流失。最后,本文研究发现,客户的姓氏对客户流失并无显著影响。本文利用logistic回归、随机森林模型,从多个角度验证了结论,并且还使用替换代理变量的方法使得logistic回归的结论通过了稳健性检验。综上所述,本文从多种角度对银行客户流失进行了因果推断,结果表明年龄、所处国家和性别等因素对客户流失具有重要影响。本研究可为银行客户流失预测提供参考,并对相关领域的研究有所贡献。
关键词:银行客户流失;logistic回归;机器学习;随机森林
参考文献
[1]DoD,HuynhP,VoP,etal.Customerchurnpredictioninaninternetserviceprovider[C]//2017IEEEInternationalConferenceonBigData(BigData).IEEE,2017.
[2]SoeiniRA,TashakorL,BafghiJT,etal.Supplierselectionbasedonmultiplecriteria[J].
InternationalJournalofNewComputerArchitectures&ThrApplications,2012,2(1):
259-274.
[3]VafeiadisT,DiamantarasKI,SarigiannidisG,etal.Acomparisonofmachinelearningtechniquesforcustomerchurnprediction[J].SimulationModellingPractice&Theory,2015,
55:1-9.
[4]蒋良孝.朴素贝叶斯分类器及其改进算法研究[D].中国地质大学,2009.
[5]林怡婷,蔡涛,邓喜珊,等.MCP-Logistic模型在银行客户流失数据的应用[J].宁波工程学院学报,2021,33(4):6.
[6]LuN,LinH,LuJ,etal.Acustomerchurnpredictionmodelintelecomindustryusingboosting[J].IEEETransactionsonIndustrialInformatics,2014,10(2):1659-1665.
[7]VafeiadisT,DiamantarasKI,SarigiannidisG,etal.Acomparisonofmachinelearningtechniquesforcustomerchurnprediction[J].SimulationModellingPracticeandTheory.2015,55:1-9.
[8]方匡南,章贵军,张惠颖.基于Lasso-logistic模型的个人信用风险预警方法[J].数量经济技术经济研究,2014,31(02):125-136.
[9]XiuliangWu,MaoyongCao,KaiSun,FengyingMa.DevelopmentofanovelvariableselectionalgorithmforLSTMwithLASSO[C]//.第40届中国控制会议论文集(14),2021:
543-548.DOI:10.26914/c.cnkihy.2021.025127.
[10]李会,吴小兰,李侠.电信客户流失预测模型的构建及客户流失因素分析[J].内蒙古农业大学学报(社会科学版),2017,19(03):23-27.
[11]柳婷.基于数据挖掘的银行客户流失模型分析研究[D].重庆大学,2008.
[12]郑宇晨,吕王勇.基于logistic模型的证券公司客户流失预警分析[J].郑州航空工业管理学院学报,2016,34(05):80-88.
[13]高海燕.基于数据挖掘的银行客户流失预测研究[D].西安理工大学,2007.
[14]李长山.基于Logistic回归法的企业财务风险预警模型构建[J].统计与决策,2018,34(06):185-188.
[15]罗晓光,刘飞虎.基于Logistic回归法的商业银行财务风险预警模型研究[J].金融发展研究,2011(11):55-59.
[16]兰军,严广乐.基于客户特征分群的银行客户流失分析[J].技术经济与管理研究,2014(05):105-108.