使用NLTK进行情感分析 使用NLTK应用于不同数据集的情感分析算法 该存储库包含几个子项目,这些子项目是如何从不同的数据集中执行情感分析的示例。 每个文件夹包含一个不同的项目。 ##使用的工具和安装说明(Ubuntu):### 1。 Python第一个示例已在Linux 64位体系结构下使用Python 2.7.9进行了测试。 但是,为了使用特定的“统计”包,需要使用Python3。 Python3已经随附了默认的Ubuntu安装,因此可以在终端上运行它: $ python3 Python 3.4.3 (default, Mar 26 2015, 22:03:40) [GCC 4.9.2] on linux Type "help", "copyright", "credits" or "license" for more information. >>> ### 2。 安装几个软件
2021-12-05 18:18:58 10.45MB Python
1
手势检测 数据集 依存关系: 张量流 autoware_msgs 跑步: 运行YOLO2 $ roslaunch cv_tracker yolo2.launch 主要代码: $ rosrun traffic_gesture_recognition ros_gesture_detection.py 筛选: $ rosrun traffic_gesture_recognition gesture_filter.py 显示调试图像: $ rosrun image_view image_view image:=/police_gesture/image_overlay 切换调试映像: $ rosservice call /set_debug "data: true" $ rosservice call /set_debug "data: false" 切换警察检测 $ r
2021-12-05 12:10:31 28KB Python
1
SCADA-GAN合成代 使用通用对抗网络综合生成SCADA数据集。 从简单的GAN网络开始,发展到WGAN和具有不同结果的CGAN。 二手的Keras和2功能:发电机频率和发电机电压相位更简单 观察结果:具有2个特征,所获得的综合数据集与真实特征非常相似。 哦耶!! 但是...当使用大量特征时,会观察到渐变消失(如Ian GoodFellow的论文)。 使用Wassertein GAN( )实现进行了进一步测试,以解决这种情况,并生成更多功能和CGAN以取得更好的结果。 样本合成生成的SCADA消息 Synthetic Data set output (Created by GAN): Generator Prod Freq Avg Generator Prod Volt Phase Avg 0 50.312412 405.223846 1 50.780399
2021-12-02 14:47:04 60KB JupyterNotebook
1
资料集 下表包含有关数据集的信息:数据集名称,默认用法,数据描述和下载说明。 数据集 用法 描述 下载 火山 地图 奥克兰的Maungawhau火山的数字高程模型。 数据由61列和87行组成,它们代表给定的火山地形。 值代表地形高度。 数据已从下载。 , 波兰省 地图 包含4个文件的shapefile格式的矢量数据。 数据描述了波兰各省的多边形。 在使用Python将数据读取到GeoDataFrame之后,有两个重要的列:带主要代码的'JPT_KOD_JE'和带有给定区域多边形的'geometry'。 文件是从波兰政府网站下载的。 ,,,, 波兰自治市镇 地图 包含4个文件的shapefile格式的矢量数据。 数据描述了波兰自治市的多边形。 在使用Python将数据读取到GeoDataFrame之后,有两个重要的列:带区号的'JPT_KOD_JE'和带给定区域的多边形的'geomet
2021-11-30 20:21:49 65.45MB
1
LeCaRD:中国法律案件检索数据集 概述 背景 勒加仑钙本身řetrieval d ataset(LeCaRD)含有106查询病例和超过43,000候选例。 查询和结果取自公布的刑事案件。 相关性判断标准和注释均由我们的法律专家团队进行。 对于数据集评估,我们在LeCaRD上实现了几种现有的检索模型作为基线。 项目结构 /LeCaRD/data是所有LeCaRD数据的根目录。 一些主要文件(或目录)的含义介绍如下: data ├── candidates │   └── candidates.zip // [important] candidate zipfile ├── corpus │   ├── common_charge.json │   ├── controversial_charge.json │   └── documen
2021-11-29 21:15:31 81.8MB Python
1
MetalDAM MetalDAM是来自钢的增材制造的金相数据集。 所有图像均由安赛乐米塔尔(ArcelorMittal)工程师提供。 数据集 图片 下载 引用 42 164 标记的数据集 标记的集包含用扫描电子显微镜拍摄的42幅灰度图像,分辨率为1280x895和1024x703(在底部裁剪了信息带之后)。 标签 频率 0.矩阵 31.86% 1.奥氏体 58.26% 2.马氏体/奥氏体 8.96% 3.沉淀* 0.24% 4.缺陷 0.68% (*)沉淀物尺寸的减小显着增加了注释这些微成分的工作量,因此在注释过程中忽略了其中的大多数。 未标记的数据集 也可以提供另外一组由相同材料获得的164张图像。 相关出版物 如果您想引用MetalDAM,请使用以下引用: @misc{metaldam, title={MetalDAM: Metallography datas
2021-11-26 15:49:24 1KB
1
微博公众意见数据集 不断更新新浪微博舆论数据集(仅用于研究) 更新:一站式科研数据服务平台已全面启动!! 只需单击几下即可实现数据采集,数据分析和数据应用。 欢迎尝试与合作 :clapping_hands: :clapping_hands: :clapping_hands: 介绍 新浪微博是中国最大的公共社交媒体平台。 最新和最受欢迎的社交活动将尽快在微博上公开和讨论。 因此,建立一个实时,全面的微博舆情数据集具有重要意义。 目前,在给定指定关键词和指定期限的情况下,微博推文数据集的构建方法有两种:(1)应用微博提供的高级搜索API; (2)遍历所有微博用户,收集指定时间段的所有推文,然后使用指定的关键字过滤推文。 但是,对于第一种方法,由于微博搜索API的限制,一次搜索的结果最多包含1000条推文,这使得构建大型数据集变得困难。 至于第二种方法,尽管我们可以构建几乎没有遗漏的大规模数据集,但是遍历数十亿微博用户需要非常长的时间和大量的带宽资源。 另外,大量的微博用户
2021-11-23 20:05:20 447KB
1
索尔L-20M Sophos-ReversingLabs 2000万数据集 此存储库中包含的代码产生了可在s3://sorel-20m/09-DEC-2020/baselines 该代码取决于可通过Amazon S3在s3://sorel-20m/09-DEC-2020/processed-data/获得的SOREL数据集;要训​​练lightGBM模型,您可以使用s3://sorel-20m/09-DC-2020/lightGBM-features/提供的npz文件,或使用此处包含的脚本从处理后的数据中提取所需的文件。 如果您在自己的研究中使用此代码或数据,请使用以下引用引用我们的论文:“ SOREL-20M:用于恶意PE检测的大规模基准数据集”,为 : @misc{harang2020sorel20m, title={SOREL-20M: A Large Scale B
2021-11-23 09:28:45 11.93MB Python
1
heart_disease_prediction 心脏病UCI数据集 该实验只是根据心脏病的缺席情况简单地预测心脏病的存在。 1.关于数据集: 该数据集在Kaggle( )上提供。 并且可以从UCI机器学习存储库( )中获得。 数据包含总共14个属性,如下所示。 属性说明 年龄:岁 性别:性别(1 =男性; 0 =女性) cp:胸痛类型 值1:典型心绞痛值2:非典型心绞痛值3:非心绞痛2值:无症状 trestbps:静息血压(入院时以毫米汞柱为单位) 胆汁:血清胆汁,mg / dl fbs :(空腹血糖> 120 mg / dl)(1 =正确; 0 =错误) restecg:静息心电图结果 值0:正常值1:ST-T波异常(T波倒置和/或ST升高或降低> 0.05 mV)值2:按照Estes的标准显示可能或确定的左心室肥大 丘脑:达到最大心率 exang:运动引起的心绞痛(
2021-11-21 10:39:53 130KB JupyterNotebook
1
via2coco 从生成的项目json中,生成类似coco的文件夹 入门 默认运行 node run.js -i viaproject.json 创建带有复制图片的类似可可的数据集 先决条件 您需要安装软件什么东西以及如何通过测试安装它们 node v9.11.1 npm 6.0.1 正在安装 安装部门 npm install 运行测试 运行测试 make 执照 以下 WTFPL
2021-11-20 18:27:01 12KB JavaScript
1