eBay开发用于识别信用卡欺诈案例的AI系统
2018年11月08日 由 浅浅 发表
215032
0
信用卡欺诈比人们想象的更常见。2014年,在1760万起执法身份盗窃事件中,86%的受害者报告与现有信用卡或银行账户有关的欺诈行为。事实上,根据联邦贸易委员会的统计,信用卡欺诈是美国最常见的身份盗用形式,每年有超过130,000份报告。
检测可疑信用卡使用模式的自动方法并不新鲜,但eBay的研究人员在发表的一篇新论文“Credit Card Fraud Detection in e-Commerce: An Outlier Detection Approach”中描述了一种尖端技术。他们提出的系统使用经过训练的算法来识别“良好行为”,它涉及交易和支付,并并标记超出预期规范的活动。
“通常,与欺诈和垃圾邮件检测等任务相关的挑战是缺乏训练合适的监督学习模型所需的所有可能模式,”该论文的作者写道,“当欺诈模式不仅仅是稀缺时,这个问题更加突出,它们也随着时间而变化。有限的数据和不断变化的模式使得学习变得非常困难。我们假设良好行为不随时间变化,表示良好行为的数据点在不同分组下具有一致的空间特征。”
研究人员利用了一组聚类方法技术来识别具有不同参数的数据集中的相似对象组。在每次训练中,每个数据点都被分配到一个集群中,从这个集群中产生一个数学表示(向量),构成数据点的指纹,这些指纹可以组合成数据点的唯一签名表示。
为了生成表示“良好行为”(即一致性)的签名,团队将每个数据点向量组合在一起,并根据相应群集的大小对其进行加权,得到0到1之间的单个分数。低一致性得分(接近0),自然对应异常行为。
他们写道,这种方法比传统的AI欺诈检测有几个优点。它不需要事先了解异常值或内点。并且基础算法具有(1)高度可扩展性(2)通用性,它几乎可以应用于任何群集问题,包括医学领域的问题。
该团队采购了数据科学平台Kaggle的公开信用卡数据库,其中包含了2013年9月欧洲持卡人在两天内(其中492个是欺诈性)进行的284,807份信用卡交易样本,以测试他们的方法。在总共10次运行之后,该算法能够以高精度识别40%的欺诈案例。
它并不完美,它标志着29项合法交易,但正如他们在报纸中指出的那样,考虑到成千上万的数据点,这是一个巨大的收益。
团队表示,“我们的技术非常实用,因为在284,807个样本中,我们可以安全地排除139,220个交易。”
如果你最近在eBay上购买或出售过某些东西,你可能会遇到该系统的运行。研究人员指出,它成功地从电子商务平台中筛选了欺诈交易。
“我们推出此方法的动机是,每次电子商务公司引入新的消费者辅助功能或对某些交易行为施加限制时,都试图在电子商务平台上识别欺诈消费者,这为一些消费者滥用和滥用平台打开了新的大门和途径。此外,我们的算法在识别欺诈方面显示出巨大的潜力。”