参数值高达上亿,有点考验你的机器额 不过写作效果真是杠杠的,赶紧下载回去惊艳你的同事和同学吧。 安装过程吗,有手就行。 由于采用了一个基于解码器结构的单向语言模型,使用100G中文常用数据,32个A100训练了28个小时,是目前最大的开源GPT2中文大模型,写作质量当然也是极好的啊。 下载模型的时候需要耗费一些时间,不过好消息是下载一次就一劳永逸了。 随着人工智能研究的深入,各种模型参差不齐,层出不穷,好处就是大家学习人工智能自然语言处理更加容易了,心情是最好的老师,通过具体的实践,才会对书上那些晦涩难懂的概念有具象的认知。 所以赶紧用起来吧,不过也需要有一些python的基础,懂一点自然语言处理的入门知识。大家还可以下载我上传的其他资源,都是注释特别详细,非常浅显易懂,上手非常快的。 如果有训练好的模型,也可以共享给大家。
2023-03-12 09:43:38 709B GPT2 智能写作 自然语言处理 NLP
1
关系抽取任务采用DuIE2.0数据集,包含超过43万三元组数据、21万中文句子及48个预定义的关系类型。数据集分为以下5个部分: 关系schema:48个预定义的关系类型,其中43个简单O值的关系类型,5个复杂O值的关系类型。 训练集:共17万个句子,包含句子中对应的SPO,用于竞赛模型训练。 验证集:共2万个句子,包含句子中对应的SPO,用于竞赛模型训练和参数调试。 测试集: 约2万个句子,不包含句子中对应的SPO。该数据用于作为最终的系统效果评估。 注:另外为了防止针对测试集的调试,数据中将会额外加入混淆数据。
2023-03-09 20:38:12 36.81MB NLP
1
BERT-NER-Pytorch-master
2023-03-09 19:19:58 229KB nlp
1
Python 豆瓣书评 bs4多页爬虫 jieba中文分词 tf-idf向量化 kmeans聚类+统计词频 +停用词 douban图书评价 浏览器多页爬虫 jupyter notebook numpy pandas sklearn 数据分析 数据挖掘
2023-03-09 10:46:03 1.57MB 爬虫 NLP kmeans 数据挖掘
1
simCSEsimCSEsimCSEsimCSEsimCSE
2023-03-08 21:17:56 28.37MB NLP
1
插槽填充 使用RNN和ATIS数据进行插槽填充。 要求 Python3.6 火炬进度条 数据集 航空旅行信息系统(ATIS)数据集。 这是一个示例句子及其来自数据集的标签: 表演 航班 从 波斯顿 至 新的 约克 今天 Ø Ø Ø B部门 Ø B-arr - B日期 结果 双GRU 精确 记起 F1 动车组 99.77 99.83 99.8 测试集 94.78 94.75 94.76
1
自然语言处理+2020年初微博数据(疫情相关)+适用于nlp、数据挖掘模型训练
2023-03-06 00:53:02 2.37MB 数据挖掘 NLP
1
NLP图像到文本 从图像中提取文本的代码 pip install -r requirements.txt 如果遇到找不到文件错误,如下所示: FileNotFoundError: [Errno 2] No such file or directory: 'tesseract' 运行以下命令 brew install tesseract 然后如下运行image-to-text.py: python image-to-text.py 我们观察到,对于干净的输入,准确性很高。 参见输入2。嘈杂的输入可能不会产生相同的效果! 一些示例输入和输出: 输入: 输出: DON’T WATCH THE CLOCK; KEEP GOING. SAM LEVENSON / / 7 J .- - flCESSc
2023-03-04 22:03:55 953KB ocr python3 text-recognition tesseract-ocr
1
yelp-reviews-NLP 关于数据集Yelp评论的NLP
2023-03-04 19:26:16 40KB JupyterNotebook
1
Chatbot_CN 基于深度学习、强化学习、对话引擎的多场景对话机器人 • • • • • • • • Made by Xu • :globe_with_meridians: 项目说明     Chatbot_CN 是一个基于第三代对话系统的多轮对话机器人项目,旨在于开发一个结合规则系统、深度学习、强化学习、知识图谱、多轮对话策略管理的 聊天机器人,目前随着时间的慢慢发展,从最初的一个 Chatbot_CN 项目,发展成了一个 Chatbot_* 的多个项目。目前已经包含了在多轮任务型对话的场景中,基于话术(Story)、知识图谱(K-G)、端到端对话(E2E)。目的是为了实现一个可以快速切换场景、对话灵活的任务型机器人。 同时,Chatbot_CN 不仅仅是一个对话系统,而是一套针对客服场景下的完整人工智能解决方案。对话是解决方案的核心和最重要一环,但不仅限于对话,还包括智能决策
1