这是我在研究中文分词时找到的一个辞典。感谢hightman的基础工作。==============================================SCWS-1.x.x 自述文件 (Written by hightman)HomePage: http://www.hightman.cn...[SCWS 简介]SCWS 是 Simple Chinese Words Segmentation 的缩写(简易中文分词系统)。它是一套基于词频词典的机械中文分词引擎,它能将一整段的汉字基本正确的切分成词,因为词是汉语的基本语素单位,而书写的时候不像英语会在词之间用空格分开,所以如何准确快速的分词一直是中文分词的攻关难点。本分词法并无太多创新成分,采用的是自己采集的词频词典,并辅以一定的专有名称,人名,地名,数字年代等规则识别来达到基本分词,经小范围测试大概准确率在 90% ~ 95% 之间,已能基本满足一些小型搜索引擎、关键字提取等场合运用。首次雏形版本发布于 2005 年底。本系统支持的汉字编码包括 GBK、UTF-8在线分词演示:G B K: http://www.hightman.cn/demo/scws/v4.php UTF-8: http://www.hightman.cn/demo/scws/v48.php 详情可参看:http://www.hightman.cn/?scws
2022-03-23 15:22:35 5.55MB 分词 简体中文 辞典
1
16本英语学习资料电子书txt可放进手机,方便学习,祝大家学习愉快
2022-03-19 20:41:55 2.01MB 英语学习资料电子书txt格式
1
简单清洗过的金庸全集TXT格式,可做语言模型的训练集,
2022-02-26 22:54:03 10.44MB NLP
1
MATLAB读取显示txt格式点云(带数据)亲测可用, 谢谢支持。
2022-02-22 16:36:11 528KB MATLAB
1
MATLAB读取显示txt格式点云(带数据)
2022-02-21 13:34:46 528KB txt点云
1
txt格式的点云数据,用于PCL从txt文件中读取点云xyz坐标的算法测试。
2022-02-11 19:01:05 1.17MB 算法
1
怎么用VB把TXT格式的数据文件导入EXCEL表中.doc
2022-02-07 21:20:18 24KB 数据 导入 EXCEL
1
这是C++Primer中文版txt格式的电子书,适合手机阅读。 从此天涯各处皆可读。
2022-01-18 22:20:18 2.04MB C++Primer txt 手机阅读
1
关于作者 Frederick P. Brooks,Jr.是北卡罗来纳大学 Kenan-Flagler 商学院的计算机科学教 授,北卡来罗来纳大学位于美国北卡来罗来纳州的查布尔希尔。Brooks 被认为是“IBM 360 系统之父”,他担任了360 系统的项目经理,以及360 操作系统项目设计阶段的经理。凭借 在上述项目的杰出贡献,他、Bob Evans 和Erich Bloch 在 1985 年荣获了美国国家技术奖 (National Medal of Techology)。早期,Brooks 曾担任IBM Stretch 和Harvest 计算机 的体系结构师。
2022-01-08 09:14:58 531KB 人月神话
1
MATLAB数据编辑时,提供三种常见方法,将编辑器中的数据以txt文本格式保存下来。
2021-12-28 09:37:09 43KB MATLAB 数据保存 txt方法
1