【项目实战】Python实现深度神经网络gcForest(多粒度级联森林)分类模型(医学诊断) 资料说明:包括数据+代码+文档+代码讲解。 1.项目背景 2.数据获取 3.数据预处理 4.探索性数据分析 5.特征工程 6.构建GCForest建模 7.模型评估 8.结论与展望 注意事项
针对词向量文本分类模型记忆能力弱, 缺少全局词特征信息等问题, 提出基于宽度和词向量特征的文本分类模型(WideText): 首先对文本进行清洗、分词、词元编码和定义词典等, 计算全局词元的词频-逆文档频度(TF-IDF)指标并将每条文本向量化, 将输入文本中的词通过编码映射到词嵌入矩阵中, 词向量特征经嵌入和平均叠加后, 和基于TF-IDF的文本向量特征进行拼接, 传入到输出层后计算属于每个分类的概率. 该模型在低维词向量的基础上结合了文本向量特征的表达能力, 具有良好的泛化和记忆能力. 实验结果表明, 在引入宽度特征后, WideText分类性能不仅较词向量文本分类模型有明显提升, 且略优于前馈神经网络分类器.
2022-01-07 09:59:39 995KB Word2Vec FastText WideText 文本分类
1
训练BANK-DATA分类模型示例 bank-data数据各属性的含义如下: id: a unique identification number age: age of customer in years (numeric) sex: MALE / FEMALE region: inner_city/rural/suburban/town income: income of customer (numeric) married: is the customer married (YES/NO) children: number of children (numeric) car: does the customer own a car (YES/NO) save_act: does the customer have a saving account (YES/NO) current_act:does the customer have a current account (YES/NO) mortgage: does the customer have a mortgage (YES/NO) pep (目标变量) : did the customer buy a PEP (Personal Equity Plan,个人参股计划) after the last mailing (YES/NO)
2022-01-04 15:50:59 14.29MB 数据挖掘实验
1
数据挖掘使用四个分类模型实现预测信用卡盗刷.docx
2021-12-30 09:08:16 975KB python
1
在ImageNet上预先训练的Keras分类模型
2021-12-29 03:31:23 39KB Python开发-机器学习
1
选题背景 Titanic生存概率预测是Kaggle平台上的经典竞赛项目,泰坦尼克号成员存活的数据集非常适合新手开始作为机器学习项目和Kaggle竞赛的练手。我们将在该项目中探索具备何种特征的人在此次海滩中幸存的几率更高,并通过改建机器学习模型和深度学习模型来预测乘客的生存率。Titanic项目的描述如下所示: 泰坦尼克号的沉没是历史上最声明远扬的航海事件 1912年4月15日,在她的处女航中,被广泛认为的“沉没” RMS泰坦尼克号与冰山相撞后沉没。 不幸的是,船上没有足够的救生艇供所有人使用,导致2224名乘客和机组人员中的1502人死亡 虽然幸存有一些运气,但似乎有些人比其他人更有可能生存 在这一挑战中,我们要求您建立一个预测模型来回答以下问题:“什么样的人更有可能生存?” 您可以使用乘客数据(即姓名,年龄,性别,社会经济舱等)来进行预测 开发环境 操作系统:Macos Python版本:3.7.4 Anaconda版本:4.9.2 tensorflow版本:2.1.0 keras版本:1.1.0 1 数据源集数据处理 1.1 数据源 数据集来自Kaggle网站提供的数据集,Kaggle提供的乘员数据分为两个部分: 训练集(train.csv) 测试集(test.csv) 训练集将用于构建我们的机器学习/深度学习模型。并且在训练集中对于每位乘客我们会有表示该乘客是否存活的label,也就是survival字段。在训练集中会给出每一位乘客的特征,我们需要从这些乘客的特征当中学得一些知识,或者可以使用特征工程来创建新的特征来帮助模型的构建 测试集数据将用来评判我们模型的表现。因此对于测试集中的每一位乘客没有代表该乘客是否存活的label,我们的模型需要根据每一位乘客的特征值来输出相应的label,真实的label将由kaggle网站保留
2021-12-27 12:03:14 418KB kaggle
PointNet是三维点云分类中具有代表性的研究成果,该模型开创性地利用深度学习模型对点云进行分类,取得了较好的效果。但是PointNet模型只考虑点云的全局特征而忽略每个点的局部信息,为弥补这个缺陷,提出基于图卷积网络的点云分类模型。在PointNet模型中插入一个kNN graph层,通过在点云空间构造k近邻图,利用图结构有效地获取点云的局部信息,从而提高整体点云分类准确率。分类实验在ModelNet40数据集上进行,对比不同近邻值k对输出精度的影响,结果表明在k取20时,分类准确率最高,达到了93.2%,比PointNet高4.0%。
2021-12-20 20:48:19 2.99MB 图像处理 三维点云 深度学习 图卷积网
1
BankChurners 机器学习分类模型可预测银行的客户流失。 嗨,访客们! 我是数据科学的新手,但我正在通过使用在线可用数据集将所有学习实践付诸实践。 我已经使用Python生成了机器学习分类模型! 我仍在学习,随着我学到更多,我将继续添加我的分析!
2021-12-15 10:11:00 391KB JupyterNotebook
1
为提高大规模恶意代码分类任务的分类准确率,提出基于词向量的恶意代码分类模型,引入NLP中表达语义含义的词向量概念,提取恶意代码函数语义特征,使用textCNN神经网络对其进行分类。实验结果表明,该模型在微软公司提供的BIG2015恶意代码分类比赛的训练集上能实现98.78%的预测准确率,相较几种传统方法准确率分别提高0.91%~3.16%。
2021-12-04 10:30:29 1.7MB 恶意代码; 分类; 词向量; CNN
1
迁移学习CNN图像分类模型 - 花朵图片分类-附件资源
2021-11-28 18:46:31 106B
1