基于不平衡数据的Python_Health-Insurance-交叉销售预测 在该项目中,我们将现代机器学习技术应用于保险单持有人的数据,以分析和预测其行为。 使用Python语言,我们对数据的处理方法产生了令人兴奋的见解,可以帮助保险公司进行业务建模。
2023-03-17 18:20:03 6.05MB JupyterNotebook
1
该存储库包含Tübingen-Oslo团队在 使用的源代码。 该方法在英语和西班牙语数据集上均赢得了最佳位置。 该论文描述了该研究: ÇağrıÇöltekin和Taraka Rama(2018) 。 在:第十二届国际语义评估研讨会(SemEval-2018)的会议记录,第34-38页( ) 要求 该存储库仅包含模型的代码。 您需要按照网页上的说明获取数据。 为了进行测试,存储库中包含一个小样本。 除了标准的Python库, , (和 )需要运行在这个仓库的脚本。 脚本的简要说明 所有脚本都在Python 3上运行(可能需要进行一些更改才能在Python 2上运行)。 大多数脚本通过命令行选项和提供摘要的-h选项进行控制。 k-fold-linear.py使用n-grams袋模型对指定输入进行给定超参数的k倍交叉验证,并报告。 k-fold-linear.py -h给出了简要
2023-03-06 09:45:16 649KB Python
1
乳腺癌预测应用程序使用 Flask-Python 在乳腺癌威斯康星州数据集上建立机器学习模型来预测癌症是良性还是恶性。 定义问题陈述 我们的主要目标是使用 Flask API 构建一个应用程序并部署在 Heroku 上以对乳腺癌是良性还是恶性进行分类。 使用此链接访问完整项目的文件夹 此文件夹包含连接到这 5 部分文章的 Python 代码: | | | | 通过这段代码,我们将学习: 如何在 Heroku 上使用 Flask API 部署模型? 数据来自威斯康星癌症数据集。 该数据由威斯康星大学麦迪逊分校的医院和William H. Wolberg博士收集。 阅读更多 与我联系
2023-03-05 10:43:23 66KB HTML
1
您可以使用本数据集从严格的制图变量(与遥感数据相反)中预测森林覆盖类型(主要的树种)。给定的30 x 30米单元的实际森林覆盖类型是根据美国森林服务(USFS)区域2资源信息系统数据确定的。然后,从美国地质调查局和USFS获得的数据中得出自变量。数据为原始格式(未缩放),包含用于定性自变量(例如荒野和土壤类型)的二进制数据列。 sampleSubmission.csv test3.csv train.csv
2023-03-02 21:46:14 1.52MB 数据集
1
BigMart销售预测 BigMart销售数据集包含2013年销售数据,这些数据来自不同城市的10个不同网点的1559种产品。 以下项目的目标是建立一个回归模型,以预测下一年在10个不同的BigMart网点中每种1559产品的销售情况。 BigMart销售数据集还包含每个产品和商店的某些属性。 此模型可帮助BigMart了解在增加整体销售额中起重要作用的产品和商店的属性。 该项目由Harsh Nagoriya自豪地创建。
2023-02-27 02:56:28 1.26MB JupyterNotebook
1
orbitdynamics a C++ program for orbit dynamics, include compments: orbit propagator formation maneuver etc RKF78 propagator gravity field file supported DE405/DE421 for planet's ephemeris MSISE-00 atmosphere model virtual base class and easy to extend use armadillo library as vector and matrix operation use hdf5 data file C++轨道动力学计算程序 卫星、航天器轨道动力学的精密计算,包括主要特征包括: RKF78高精度积分器 支持地球引力场系数文件 DE405/DE421行
1
机器学习模型房屋价格预测 使用Flask Web框架的机器学习模型进行房价预测
2023-02-10 21:11:37 5KB Python
1
薪水预测-烧瓶部署 这是一个演示项目,用于详细说明如何使用Flask API在生产环境中部署机器学习模型 先决条件 您必须安装Scikit Learn,Pandas(用于机器学习模型)和Flask(用于API)。 项目结构 该项目包括四个主要部分: model.py-这包含我们的机器学习模型的代码,以预测hiring.csv文件中训练型数据上缺少的员工薪水。 app.py-包含Flask API,这些API通过GUI接收员工详细信息,根据我们的模型计算推定值并返回。 模板-此文件夹包含HTML模板,允许用户输入员工详细信息并显示预测的员工薪水。 运行项目 确保您在项目主目录中。 通过运行以下命令来创建机器学习模型- python model.py 这会将我们模型的序列化版本创建到文件model.pkl中 使用以下命令运行app.py以启动Flask API python app.
2023-02-10 19:53:45 6KB HTML
1
链接预测pyspark 用于链路预测的CNGFPyspark实现。 CNGF算法该有助于预测将来图中最可能连接的节点。 这可用于社交网络,以设想各种实体之间的连接。 与传统算法相比,该算法效率更高,因为它使用两个节点x和y的子图以及它们的公共邻居来预测将来的连接,而不是整个图。 它首先通过将子图中的公共邻居的度数除以整个图中该邻居的度数的对数来计算制导。 然后,它使用x和y的所有公共邻域的总和来计算相似度。 相似度越高,将来建立连接的机会就越大。 需要 Python 2.7以上 用法 要运行该程序,请克隆存储库并运行以下命令: $SPARK_HOME/bin/spark-submit --packages graphframes:graphframes:0.5.0-spark2.1-s_2.11 cngf.py file_path separator 它需要2个参数: fi
2023-01-02 16:17:44 7KB python pyspark graphframes Python
1
Kaggle_Jane_Street_Market_Prediction:https
2023-01-02 15:48:48 20KB JupyterNotebook
1