新闻动态
基于交易流水的信用卡风险交易及商户识别
时间:2021-10-28
1.研究背景
信用卡套现是一种威胁正常金融秩序的风险行为,常常涵盖虚假套现商家及虚假套现交易行为:(1)套现风险商家:存在套现行为的商家通过成立虚假商户申请低费率的POS机,用于套现行为;(2)套现交易:持卡人与持有POS机的商户合作,制造不存在实际消费的POS刷卡交易,从而套取现金。信用卡套现操作门槛低,过程隐蔽,为监管带来很大挑战。有效识别具有套现风险的商户及其风险交易,是控制信用卡风险的关键。在传统的信用卡风控中,对持卡人及其交易行为的信用风险评估需要先积累大量的标注数据,对持卡人拥有充分的先验信息。而信用卡标注的高成本限制了传统方法的应用。本案例考虑将交易流水数据分析与信用评价结合,提出一种基于无监督学习的套现交易及风险商户识别方法,为实际的信用评估、套现交易识别提供决策支持。
2.研究方法
实际的交易数据中,通常缺少关于商户套现等风险行为的标注,因而有监督学习存在较大的局限性。为了充分利用海量的交易流水数据,可通过聚类方法识别具有异常交易表现、异常行为模式的商户,以数据驱动的方式发现可疑商户群体。交易流水除了具有定量化的金额属性,还反映了商户与消费者之间的连接关系,即商户、消费者之间的交易往来关系。因此,我们考虑从商户交易金额、商户与消费者之间的关联关系两个方面进行商户聚类,提出基于无监督学习的套现风险商户识别方法。
套现风险商户的识别主要分为三个步骤(图1展示了整体框架):
Step1: 聚类生成基于交易金额的特征:利用每个商户的交易流水信息,计算其交易金额经验分布,并基于商户交易金额的经验分布进行KS聚类。对聚类得到的簇进行观测和归纳,找出能够直观概括不同簇中商户交易行为差异的有效特征,归纳出基于交易分布的商户套现风险指标,同时标注套现交易。
Step2: 双模网络产生基于交易连接的特征:从社交网络分析的角度出发,利用商户交易流水记录构建商户-消费者双模网络,在KS聚类结果的基础上,初始化网络中商户、消费者节点的标签,利用受限LPA方法进行网络聚类,根据聚类结果构建基于网络关系的商户套现风险指标,同时标注套现交易。
Step3: 构建可解释性强的聚类模型:综合从以上两种聚类方法中归纳、构建的特征指标,作为融合模型的输入,得到最终的商户聚类模型。
图1 套现风险商户识别框架
3.研究内容与结果
本文基于某第三方支付平台提供的数据集进行套现风险商户及套现交易识别的实证分析。利用交易金额的分布信息对商户进行KS聚类,利用受限LPA方法进行网络聚类,将商户划分为四类商户。对结果中每个类抽取部分商户,对商户的原始交易流水进行回溯分析,归纳并构建商户套现风险指标,经对比后总结出疑似套现交易的特征。
图2 套现风险商户局部网络图
对最终聚类得到的四类商户,可将商户归纳为四类,分别为:
第一类:“薅羊毛”商户。在交易金额上低于实际业务的正常商户的交易水平,有获取平台奖励的投机倾向,倾向于产生金额非常小的交易。该类商户套现交易比例很低;
第二类:正常商户。在交易特征上表现稳定,其金额浮动较小,异常时间交易和疑似套现的交易次数的比例非常低,符合正常商户表现;
第三类:低套现风险商户。其大额交易和疑似套现交易的平均金额虽然不高,但仍达到一定水平,因此将此类概括为低套现风险商户;
第四类:高套现风险商户。其疑似套现交易的均值和涉及套现行为数量等都远高于正常商户。这类商户的交易金额偏高且交易时间不规律。
综上,将融合聚类方法和挖掘得到的特征相结合,能够快速有效地划分出具有异质性的商户,尤其是具有套现行为的商户,并对商户按套现风险进行合理的细分。同时,基于融合聚类方法,可以便捷地对输入的新商户进行类别判断,快速识别其商户类型,为相应的管理提供决策支持。