Logistic Regression 虽然被称为回归,但其实际上是分类模型,并常用于二分类。Logistic Regression 因其简单、可并行化、可解释强深受工业界喜爱。 本资源使用基于Sklearn实现逻辑回归算法,同时提供了用于模型训练的数据集(信用卡数据集合),实现对是否存在信用卡欺诈行为进行检测。资源包括以下内容: 1、jupyter notebook程序源码 2、用于模型训练的数据集(csv文件) 3、使用混淆矩阵对测试结果进行评估 LR实现简单高效易解释,计算速度快,易并行,在大规模数据情况下非常适用,更适合于应对数值型和标称型数据,主要适合解决线性可分的问题,但容易欠拟合,大多数情况下需要手动进行特征工程,构建组合特征,分类精度不高。 LR直接对分类可能性进行建模,无需事先假设数据分布,这样就避免了假设分布不准确所带来的问题 LR能以概率的形式输出,而非知识0,1判定,对许多利用概率辅助决策的任务很有用 对率函数任意阶可导,具有很好的数学性质,许多现有的数值优化算法都可以用来求最优解,训练速度快 适用情景:LR是很多分类算法的基础组件,它的好处是输出。
2022-05-07 10:05:28 66.15MB 机器学习 回归 人工智能 数据挖掘
文章《3.4 信用卡欺诈预测代码实现》所需要的CSV文件
2022-04-06 03:12:03 8KB 深度学习
1
CreditCardFraud-Kaggle-Tensorflow 使用来自Kaggle的信用卡欺诈数据集,我创建了一个完全连接的神经网络,该网络可以预测信用卡欺诈,平均准确性为96%
2022-01-04 16:23:43 2KB JupyterNotebook
1
信用卡欺诈问题概述实现过程SVM介绍数据源下载代码实现代码解释总结 概述 初衷是因为引用卡欺诈问题相对与其他机器学习问题略有不同,因为二分类数据量差距过大,导致以往的评价方法对其不适用,如下图的284807 笔交易中只有492笔是欺诈行为,如果用以为的准确率评价几乎都在99%以上,但是这并不能说明模型好,因为即使漏掉1个欺诈交易都是损失很大的,所以这篇里引入了召回率和精确率,进行综合评价,详细步骤如下: 对数据源中不比较的字段进行删减,对数值型数据进行规范化,因为没有测试集数据,所以进行数据划分。 数据建模使用的是LinearSVR,因为LinearSVC 对线性分类做了优化,对于数据量大的线
2021-12-27 20:16:52 91KB 信用 信用卡
1
数据挖掘 (DM) 涉及一种核心算法,它使数据比基本见解和知识更深入。 事实上,数据挖掘更多是知识发现过程的一部分。 信用卡 (CC) 提供商为其客户提供多张卡。 所有信用卡用户必须是真实和真诚的。 任何类型的错误都可能导致金融危机。 由于无现金交易的快速增长,不太可能,虚假交易也可以增加。 欺诈交易可以通过研究各种行为的信用卡作为先前的交易历史数据集来识别。 如果与可用成本模式有任何偏差,则为虚假交易。 DM 和机器学习技术 (MLT) 广泛应用于信用卡欺诈检测 (CCFD)。 在这份调查报告中,我们展示了各种广泛使用的 DM 和 MLT 检测信用卡欺诈的迹象。
2021-12-26 18:54:16 545KB Data Mining (DM)
1
欧洲的信用卡持卡人在2013年9月2天时间里的284807笔交易数据,其中有492笔交易是欺诈交易,占比0.172%。数据采用PCA变换映射为V1,V2,...,V28 数值型属性,只有交易时间和金额这两个变量没有经过PCA变换。输出变量为二值变量,1为正常,0为欺诈交易。
2021-12-15 12:09:54 68.1MB 欺诈检测 风险识别
1
此资料里面的内容主要是解决如何在大数据集(本资料中是28w)中检测出欺诈数据集(本资料中是500),通过对原始数据集的处理之后,利用机器学习的方法,对其进行建模处理,然后不断进行模型的调优,最后达到检测效果。
2021-12-13 16:39:45 172.11MB 信用卡 欺诈检测
1
欺诈识别 使用RNN训练和测试模型以预测信用卡欺诈交易。 #如何使用模型: 从链接下载名为creditcard.csv的数据集。 下载python脚本欺诈_detection.py 将脚本和csv数据文件保存在同一文件夹中,否则在脚本文件的第13行中提及csv文件的路径 运行代码以查看培训和测试的准确性
2021-11-24 11:49:39 2.86MB Python
1
暂无描述
2021-10-11 21:39:15 65.6MB 数据集
1
creditcard :https://www.kaggle.com/mlg-ulb/creditcardfraud#creditcard.csv
2021-09-09 09:13:40 65.61MB 数据集
1