人工智能-项目实践-汽车投保风险指数预测-基于xgboost的汽车投保风险指数预测
1、内容概要:本资源主要基于XGBoost与LightGBM实现文本分类,适用于初学者学习文本分类使用。 2、数据集为电商真实商品评论数据,主要包括训练集data_train,测试集data_test ,经过预处理的训练集clean_data_train,训练好的word2vec词向量模型w2v_model.pkl和中文停用词表stopwords.txt,可用于模型训练和测试,详细数据集介绍见商品评论情感数据说明文档。 3、源代码:word2vec_analysis.py 是基于Word2Vec进行词向量的生成,采用向量平均求得句向量,然后分别构建RandomForest和GBDT分类模型进行文本分类。 4、源代码:xgboost_model.py是基于xgboost模型对文本进行分类。 5、源代码:lightGBM_model.py是基于lightGBM模型对文本进行分类。
2022-04-16 14:07:38 37.99MB 机器学习 xgboost lightGBM word2vec
XGBRegressor:使用Python 2.7,scikit-learn和XGBoost进行回归问题的简单实现
2022-04-15 16:57:18 7KB python slack scikit-learn regression
1
使用xgboost建模的液压系统状态监测 我们将使用各种传感器值并使用xgboost进行测试,对测试液压钻机进行条件监控。 我们的F1得分很高(在所有情况下> 0.94,在两种情况下> 0.99)。 我们还监测了特征重要性,并且该特征重要性与钻机的实际物理状况(如冷却状况,泵泄漏,液压蓄能器和阀门状况)具有很好的相关性。 可以从以下下载此分析的数据集:
2022-04-12 11:52:56 149KB 系统开源
1
人工智能_项目实践_上市公司财务造假_基于XGBoost的上市公司财务造假预测
2022-04-11 12:03:53 15.39MB 人工智能
PySpark-ClusterClassify 使用AWS Sagemaker在MNIST数据集上进行分布式KMeans聚类和XGBoost分类作业
2022-04-03 16:34:56 671KB JupyterNotebook
1
XGBoost模型 该项目使用XGBoost模型预测销售价格,然后将结果与其他算法(例如,Random Forest和Decision Tree)进行比较。 资料栏位 这是您将在数据描述文件中找到的内容的简短版本。 SalePrice-物业的销售价格(以美元为单位)。 这是您要预测的目标变量。 MSSubClass:建筑类MSZoning:总体分区分类LotFrontage:连接到属性Lot的街道的线性英尺LotArea:平方英尺的地块大小Street:道路通道的类型Alley:胡同通道的类型LotShape:属性的一般形状LandContour:平面度属性实用程序:可用的实用程序类型LotConfig:批次配置LandSlope:属性的坡度邻域:Ames城市范围内的物理位置条件1:接近主干道或铁路条件2:接近主干道或铁路(如果有第二秒)BldgType:类型房屋外观样式:房屋风格整体质
2022-03-30 19:43:21 631KB JupyterNotebook
1
分类问题中的特征选择一直是一个重要而又困难的问题。这类问题中要求特征选择算法不仅能够帮助分类器提高分类准确率,同时还要尽可能地减少冗余特征。因此,为了在分类问题中更好地进行特征选择,提出了一种新型的包裹式特征选择算法XGBSFS。该算法借鉴极端梯度提升(XGBoost)算法中构建树的思想过程,通过从3个重要性度量的角度来衡量特征的重要性,避免单一重要性度量的局限性;然后通过改进的序列浮动前向搜索策略(ISFFS)搜索特征子集,使最终得到的特征子集有较高的质量。在8个UCI数据集的对比实验中表明,所提算法具有很好的性能。
1
Xgboost原理详解,参考了多个博客和论文,探讨XGB的基本原理和优点等。
2022-03-20 23:11:50 1.23MB XGB 原理详解
1
机器学习方法在股指期货预测中的应_省略_SVM和XGBoost的比较分析_黄卿.pdf
2022-03-11 14:20:17 1.52MB FinE
1