安全技术-网络信息-面向印尼人的汉语网络课件设计与实现.pdf
2022-05-06 18:00:42 2.48MB 文档资料 安全 网络
人工智能-机器学习-汉语烟草广告双关语的认知语用研究.pdf
2022-05-06 10:06:18 2.91MB 人工智能 文档资料 机器学习
安全技术-网络信息-面向韩国小学生的网络汉语教学研究.pdf
2022-05-06 09:00:17 3.21MB 文档资料 安全 网络
提出一种统计与规则相结合的决策树算法进行汉语代词共指消解,利用规则过滤掉属性冲突的反例,一定程度上弥补了决策树算法忽略属性关联性的缺点。采用Chinese Treebank作为语料进行测试,手工标注其中的共指关系和特征向量;首先用规则过滤,然后采用C4.5决策树算法选择先行语。实验结果显示,消解成功率为82.59%,其中人称代词和指示代词的成功率分别为87.60%和75.21%。
2022-05-02 11:05:26 358KB 自然科学 论文
1
基于CRF 的先秦汉语分词标注一体化研究
2022-05-02 10:04:09 242KB 文档资料
安全技术-网络信息-顺应理论视角下汉语网络流行语的翻译研究.pdf
2022-04-30 09:00:31 1.93MB 文档资料 安全 网络
安全技术-网络信息-模因论视角下汉语网络流行语英译分析及策略研究.pdf
2022-04-28 19:00:15 1.3MB 文档资料 安全 网络
安全技术-网络信息-论名人汉语绰号的概念整合网络模型.pdf
2022-04-28 09:00:26 2.77MB 网络 安全 文档资料
提出了一种基于层叠隐马模型的汉语词法分析方法,旨在将汉语分词、词性标注、切分排歧和未登录词识别集 成到一个完整的理论框架中1在分词方面,采取的是基于类的隐马模型,在这层隐马模型中,未登录词和词典中收录的普 通词一样处理1未登录词识别引入了角色HMM:Viterbi算法标注出全局最优的角色序列,然后在角色序列的基础上,识 别出未登录词,并计算出真实的可信度1在切分排歧方面,提出了一种基于N2最短路径的策略,即:在早期阶段召回N 个最佳结果作为候选集,目的是覆盖尽可能多的歧义字段,最终的结果会在未登录词识别和词性标注之后,从N个最有 潜力的候选结果中选优得到1不同层面的实验表明,层叠隐马模型的各个层面对汉语词法分析都发挥了积极的作用1实 现了基于层叠隐马模型的汉语词法分析系统ICTCLAS, 该系统在2002年的“九七三”专家组评测中获得第1名,在2003 年汉语特别兴趣研究组(ACLSpecialInterestGrou ponChineseLan guageProcessing,SIGHAN )组织的第1届国际汉语分 词大赛中综合得分获得两项第1名、一项第2名1这表明:ICTCLAS 是目前最好的汉语词法分析系统之一,层叠隐马模 型能够解决好汉语词法问题.
1
古汉语常用字字典《古汉语常用字字典》是1979年商务印书馆出版的图书,作者是王力、岑麒祥、林焘、戴澧、唐作藩、蒋绍愚、张万起、徐敏霞。该书是新中国成立后第一部用现代语言学和辞书学观点、方法编写的古汉语权威字典。
2022-04-21 11:07:17 1.31MB 字典 语料
1