运筹与管理 ›› 2023, Vol. 32 ›› Issue (12): 118-123.DOI: 10.12005/orms.2023.0395
阮素梅1, 孙旭升2, 甘中新3
RUAN Sumei1, SUN Xusheng2, GAN Zhongxin3
摘要: 信用卡欺诈是银行业面临的严峻问题,全球每年因信用卡欺诈造成的损失高达数十亿美元。然而信用卡交易数据存在特征冗余和样本不平衡的问题,这无疑增加了模型对少数欺诈交易的检测难度。针对以上问题,本文提出了三阶段集成学习模型“FS-IFKK-Stacking”:基于FS方法的特征选择、基于IFKK方法的不平衡数据处理和基于Stacking方法的异构模型集成。该模型同时解决了由于特征冗余和样本不均衡性导致的过拟合问题,能够更加准确地检测信用卡欺诈交易。基于Kaggle欧洲信用卡交易数据的实验表明:本文提出的“FS-IFKK-Stacking”模型对信用卡欺诈的检测效果明显优于基于原始样本训练的单类模型:在AUC提升0.44%的同时,对欺诈交易的召回率提升了3.27%。
中图分类号: