PyTorch Tabular旨在使利用Tabular数据进行的深度学习变得容易,并且现实世界中的案例和研究都可以访问。 库设计背后的核心原则是: 低电阻可用性 轻松定制 可扩展且易于部署 它建立在PyTorch (显然)和PyTorch Lightning等巨头的肩膀上。 目录 安装 尽管安装中包括PyTorch,但最好的推荐方法是从首先安装PyTorch,为您的计算机选择正确的CUDA版本。 一次,您已经安装了Pytorch,只需使用: pip install pytorch_tabular[all] 安装带有额外依赖项的完整库。 和 : pip install pytorch_tabular 裸露的必需品。 pytorch_tabular的源代码可以从Github repo仓库_下载。 您可以克隆公共存储库: git clone git://github.com/ma
1
SQL Server的Tabular Data Stream (TDS)协议是SQL Server的数据传输协议。 英文版 TDS 详细协议说明文档.
2022-07-23 17:41:27 5.2MB tds协议
1
DCNN用于表格数据 这项工作展示了我们在雷德黑德莱克黑德大学数据科学硕士课程的顶峰项目。 该项目使用不同大小范围的表格数据集,包括Connect4,Covertype,EEG,Letter识别,Hepmass-OS,Hepmass-NS,Hepmass-AS和HIGGS。 这项工作的目的是建立一个可用于表格数据的DCNN模型。 但是,众所周知,DCNN在图像分类方面具有出色的性能。 因此,我们决定制作一个将表格数据转换为图像的系统,随后将图像传递给DCNN模型进行分类。 这项研究工作是由很少的研究人员和编程人员执行的。 在所有这些产品中,我们设计的模型迄今为止可以提供最佳性能。 数据集: 我们已经对不同的数据集进行了实验,以检查模型的容量。 其中包括小型数据集(例如虹膜)到大型数据集(例如HIGGS)。 用于培训和测试的数据集分布如下: 方法: 加载数据集(connect4,cove
2021-11-27 17:19:53 28KB JupyterNotebook
1
标签转换器 在 Pytorch 中实现 ,表格数据的注意力网络。 这种简单的架构与 GBDT 的性能相差无几。 安装 $ pip install tab-transformer-pytorch 用法 import torch from tab_transformer_pytorch import TabTransformer cont_mean_std = torch . randn ( 10 , 2 ) model = TabTransformer ( categories = ( 10 , 5 , 6 , 5 , 8 ), # tuple containing the number of unique values within each category num_continuous = 10 , # number of co
1
用于表格数据的GAN 我们深知GAN在现实图像生成方面的成功。 但是,它们可以应用于表格数据生成。 我们将回顾和研究有关表格式GAN的最新论文。 Arxiv文章: 中等职位: 如何使用图书馆 安装: pip install tabgan 要生成新数据以通过采样进行训练,然后通过对抗性训练进行过滤,请调用GANGenerator().generate_data_pipe : from tabgan . sampler import OriginalGenerator , GANGenerator import pandas as pd import numpy as np # random input data train = pd . DataFrame ( np . random . randint ( - 10 , 150 , size = ( 50 , 4 )), col
1
从开源项目 网站: : 文档: : 仓库: : 执照: 发展状况: 概述 CTGAN是用于单个表数据的基于深度学习的合成数据生成器的集合,这些数据生成器能够从真实数据中学习并生成高保真度的合成克隆。 当前,该库论文实现在提出的CTGAN和TVAE模型。 有关这些型号的更多信息,请查阅相应的用户指南: 。 。 安装 要求 CTGAN已在 3.6、3.7上进行开发和测试 从PyPI安装 推荐的安装CTGAN的方法是使用 : pip install ctgan 这将从提取并安装最新的稳定版本。 用conda安装 CTGAN也可以使用安装: conda install -c sdv-dev -c pytorch -c conda-forge ctgan 这将从提取并安装最新的稳定版本。 使用范例 :warning_selector: 警告:如果您只是开始使用综合数据,我们建议您使用SDV库,该库提供
1
csvreader-以正确的方式读取逗号分隔值(csv)格式的表格数据(使用零配置立即使用最佳实践) 主页:: 错误:: 宝石:: rdoc :: 论坛:: 最新消息 对于额外的尾随值设置为默认解析器(双引号值V1.2.2新增的自动修复/校正/恢复ParserStd ),例如"Freddy" Mercury将得到读“原样”,变成了与“不带引号的”值“文本”引用例如"Freddy" Mercury 。 v1.2.1在默认解析器( ParserStd )中添加了对(可选)#标签的支持,以支持 。 默认设置为关闭( false )。 使用Csv.human或Csv.hum或Csv.hx
2021-09-21 14:04:27 65KB export json csv tabular-data
1
超级GBM | 我们正在招聘! 亲爱的朋友们,我们正在北京为热衷于 AutoML/NAS 的专业人士和实习生开设几个宝贵的职位,请将您的简历/简历发送至 。 (申请截止日期:待定。) 什么是 HyperGBM HyperGBM是一个支持全流水线AutoML的库,完全涵盖了数据清洗、预处理、特征生成和选择、模型选择和超参数优化的端到端阶段,是真正的表格数据AutoML工具。 概述 与大多数专注于解决机器学习算法超参数优化问题的 AutoML 方法不同,HyperGBM 可以将从数据清理到算法选择的整个过程放在一个搜索空间中进行优化。 端到端管道优化更像是一个顺序决策过程,因此 HyperGBM 使用强化学习、蒙特卡洛树搜索、进化算法结合元学习器来有效解决此类问题。 顾名思义,HyperGBM中使用的ML算法都是GBM模型,更准确的说是梯度提升树模型,目前包括XGBoost、Light
2021-09-13 17:55:27 2.09MB tabular-data xgboost semi-supervised-learning gbm
1