只为小站
首页
域名查询
文件下载
登录
torchtext-summary:torchtext摘要:torchtext使用总结,从零开始逐步实现了torchtext文本预处理,包括截断补长,词表排列,使用预
训练词向量
,可以使用PyTorch的可迭代数据等步骤。并结合Pytorch实现LSTM
torchtext的使用总结,并结合Pytorch实现LSTM 版本说明 PyTorch版本:0.4.1 火炬文字:0.2.3 python:3.6 文件说明 Test-Dataset.ipynb Test-Dataset.py使用torchtext进行文本预处理的笔记本和py版。 Test-Dataset2.ipynb使用Keras和PyTorch进行数据集进行文本预处理。 Language-Model.ipynb使用gensim加载预训练的词向量,并使用PyTorch实现语言模型。 使用说明 分别提供了笔记本版本和标准py文件版本。 从零开始逐步实现了torchtext文本预处理,
2022-07-20 01:38:55
43KB
python
nlp
pytorch
torchtext
1
Word2Vec:采用Word2Vec
训练词向量
,数据集:STS
Word2Vec 采用Word2Vec
训练词向量
,数据集:STS
2022-05-16 22:10:36
14KB
Java
1
中文预
训练词向量
(知乎问答 word2vec +Ngram)-数据集
中文预
训练词向量
北京师范大学中文信息处理研究所与中国人民大学 DBIIR 实验室的研究者开源的"chinese-word-vectors"。github地址为:https://github.com/Embedding/Chinese-Word-Vectors 此中文预
训练词向量
为知乎Word + Ngram的词向量
2022-03-18 09:38:10
225.28MB
数据集
1
GWE中文词向量
使用GWE(中文字形特征提取)预
训练词向量
(1.6GB维基百科语料),维度为300,词汇量约13000,文件大小为41.2MB
2021-09-13 09:25:42
56.93MB
自然语言处理
预训练词向量
1
glove.6B(词向量).zip
官网glove.6B的词向量,里面包含了50d、100d、200d、300d常用英文单词的词向量,来源于wiki百科和Gigaword数据集。
2021-06-01 08:42:18
867.45MB
glove数据集
nlp
深度学习
预训练词向量
1
word2vec中文词向量
使用gensim对维基百科作为预训练语料(约1.6G语料),生成词汇量约13000个词汇,维度为300,文件大小为45.6MB。使用方法,参考博客:https://blog.csdn.net/qq_36426650/article/details/87738919
2021-03-21 12:55:40
45.65MB
自然语言处理
预训练词向量
1
glove中文词向量
使用glove预
训练词向量
(1.6GB维基百科语料),维度为300,词汇量约13000,文件大小为41.2MB
2019-12-21 20:46:02
41.24MB
自然语言处理
预训练词向量
1
中文维基百科语料库(截止2019年2月20日)
这是最新的中文维基百科语料库(截至2019年2月20日),可以用来训练word2vec词向量,做文本分类,官网特别难下载,因此分享出来
2019-12-21 20:40:31
4.27MB
中文语料库
维基百科
word2vec
训练词向量
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
适用于eNSP 1.3.00 可加载的USG6000V防火墙设备包
大唐杯资料+题库(移动通信)
代码随想录知识星球精华-大厂面试八股文第二版v1.2.pdf
神经·模糊·预测控制及其MATLAB实现PDF + MATLAB程序
拾荒者.exe同时ID扫描器IP扫描器
pytorch实现RNN实验.rar
空间谱估计理论与算法------程序.rar
IEEE33节点配电网Simulink模型.rar
Plex v7.12电视端app
avantage 软件 xps 处理软件30天后不能使用问题
Spring相关的外文文献和翻译(毕设论文必备)
基于LSTM模型的股票预测模型_python
韦来生《数理统计》课后习题与答案
基于matlab的车牌识别系统设计
token登录器.rar
最新下载
在CAD下查找文字和块,并用直线指出来
西安电子科技大学工程优化历年原题以及PPT课件等还有课后题答案
MHDD4.6 官方原版ISO 附带教程 压缩包
android-sdk_r24.4.1-windows.zip.7z
极域电子教室管理系统软件V2.0 2022稳定版 支持Win11
用于 Matrox 硬件的图像采集工具箱支持包:从 Matrox 帧采集器采集视频和图像。-matlab开发
印刷报价网站源码_ Visual Studio2005 C#
STM32H7+W5500(HAL).rar
Bayesian Statistical Modeling with Stan, R, and Python.pdf
通用的职位招聘小程序ui模板.zip
其他资源
永磁同步电机直接转矩控制Simulink模型
Modbus Poll 6.1 64位 破解版
ListView快速显示100万条数据用时1秒
FOR.A HVS-100使用手册
Jquery,CSS,HTML学期作业
飞思卡尔电磁组决赛程序
echarts geoCoord全国省、市等中心坐标 Json 格式
神舟 K610D i7D4黑苹果 10.14.3 mojave EFI
液晶汉字的ASCII码表,pdf,ST7920+GB+中文字型码表
asp.net(c#)开源权限管理系统
apache-tomcat-8.5.63.zip
使用Voverage Directed仿真在SLM和TLM之间进行等效检查
97KILL.zip
考试时间个人规划2021
CEN/TR 17236:2018 电子烟和烟油----蒸汽产品的气溶胶成分测量-完整英文版(13页)
index.html
银行排号系统设计 C语言实现
代码走查规范文档
基于LDA 主题模型的短文本分类方法
2. 定义一个Card类,表示扑克牌,该类包括下述成员
车载导航源码
适合php初学者的注册登录功能页面
人事管理系统(使用MFC单文档程序,使用TXT文本作为数据库)
软件工程语言——Z
java读取XML内容源代码