SIFRank_zh 这是我们论文的相关代码原文是在对英文关键短语进行抽取,这里迁移到中文上,部分管道进行了改动英文原版在。。 版本介绍 2020/03 / 03——最初最初版本本版本中只包含了最基本的功能,部分细节还有待优化和扩展。 核心算法 预训练模型ELMo +句向量模型SIF 词向量ELMo优势:1)通过大规模预训练,较早的TFIDF,TextRank等基于统计和图的具有更多的语义信息; 2)ELMo是动态的,可以改善一词多义问题; 3)ELMo通过Char -CNN编码,对生隐词非常友好; 4)不同层的ELMo可以捕捉不同层次的信息 句子矢量SIF优势:1)根据词频对词向量进行平滑逆频率变换,能更好地捕捉句子的中心话题; 2)更好地过滤通用词 最终关键焦点识别 首先对句子进行分词和词性标注,再利用正则表达式确定确定名词短语(例如:形容词+名词),将名词作为前缀关键字 最终关键利率
1
图分类用变压器 这一计划规定,在描述了我们U2GNN执行,我们充分利用了变压器自重视网络,构建一个先进的聚合函数学习图形表示。 用法 消息 17-05-2020:更新Pytorch(1.5.0)实施。 要求 Python 3.x Tensorflow 1.14 张量2张量1.13 Networkx 2.3 Scikit学习0.21.2 训练 U2GNN$ python train_U2GNN_Sup.py --dataset IMDBBINARY --batch_size 4 --ff_hidden_size 1024 --fold_idx 1 --num_neighbors 8 --num_sampled 512 --num_epochs 50 --num_timesteps 4 --learning_rate 0.0005 --model_name IMDBBINARY_bs
1
word_embeddings层词向量初始化可以参考的资源,txt文件分别有50、100、200、300维,从程序中直接读取就好
2021-11-29 16:01:16 822.24MB glove word_embeddings
1
芒垣 欢迎来到芒垣! 该自述文件也提供。 从这里做什么? 漫画和动漫的AI 于2018年7月在洛杉矶动漫博览会上。 地球上的Mangaki(MoE):可视化动画嵌入 请参阅 我们地图 浏览。 安装Mangaki 数据库设置 您需要在计算机上运行PostgreSQL> 9.3。 您还需要一个有权访问数据库的用户。 最简单的方法是创建一个与您的用户名同名的帐户,该帐户可以创建数据库,并且是超级用户(用于CREATE EXTENSION): sudo -u postgres createuser --superuser --createdb $USER 然后创建数据库,并添加所需的扩展名: createdb mangaki psql -d mangaki -c \ "create extension if not exists pg_trgm; \ creat
1
更好的NER 具有双向LSTM-CNN的命名实体识别 命名实体识别的双向LSTM_CNN的keras实现。 原始论文可以在找到 该实现与原始论文的不同之处在于: 不考虑词典 使用存储桶可加快培训速度 使用nadam优化程序代替SGD 结果 该模型在约70个时期内产生90.9%的测试F1得分。 对于给定的体系结构,本文产生的结果是91.14体系结构(带有emb + caps的BILSTM-CNN) 数据集 conll-2003 论文网络模型 使用Keras构建网络模型 运行脚本 python3 nn.py 要求 0) nltk 1) numpy 2) Keras==2.1.2 3) T
2021-09-30 20:26:03 1.05MB tensorflow word-embeddings keras cnn
1
WordGCN 使用图卷积网络在词嵌入中整合句法和语义信息 WordGCN概述 SynGCN概述:SynGCN使用图卷积网络来利用依赖上下文学习单词嵌入。 对于词汇表中的每个单词,该模型旨在通过基于使用GCN编码的依存关系上下文预测每个单词来学习其表示形式。 请参阅本文的第5节以获取更多详细信息。 依存关系 与TensorFlow 1.x和Python 3.x兼容。 可以使用requirements.txt安装依赖项。 pip3 install -r requirements.txt 安装用于评估学习的嵌入的。 可以从此下载本文中使用的测试和有效数据集拆分。 用提供的文件夹替换原始的~
1
这部分是关于学习节点嵌入的方法。这些方法的目标是将节点编码为低维向量,这些低维向量总结了它们的图位置和它们的局部图邻域的结构。
2021-09-02 14:56:37 787KB 图节点 嵌入表示
1
text-embeddings.zip
2021-08-13 09:00:55 43.89MB elsatic
1
Node2Vec node2vec算法Aditya Grover,Jure Leskovec和Vid Kocijan的Python3实现。 安装 pip install node2vec 用法 import networkx as nx from node2vec import Node2Vec # Create a graph graph = nx . fast_gnp_random_graph ( n = 100 , p = 0.5 ) # Precompute probabilities and generate walks - **ON WINDOWS ONLY WORKS
1
spaCy是我的自然语言处理(NLP)任务的必备库。spaCy 用户手册
2021-07-01 18:02:44 445KB spacy 用户手册
1