敏感词过滤算法全套,包含敏感词库,希望能帮到大家吧。
2021-12-25 20:51:18 95KB 敏感词过滤 过滤算法
1
本类库的敏感词替换算法,效率比str_replace高4倍(附6仟个敏感词),这个类库是没有学习过Trie树的时候写的,之后我接触了AC算法,我的算法和AC是类似的结构和逻辑,都是利用树,空间换时间,对搜索/替换海量数据帮助很明显。 strtr是KMP算法的代表,在对待海量词汇上面,并无优势,并且每次都要加载词库到内存。 使用AC算法写成扩展,将词库加载内存中,是最好的处理方式。 所以badword.src.php可供学习AC算法、学习查找替换等。
2021-12-22 16:06:35 3KB 源码 示例 PHP 敏感词过滤
php做的敏感词过滤,功能很强大喔!神马敏感词都得过滤掉,一切讲究的是河蟹!吼吼
2021-12-15 13:18:44 2KB 敏感词过滤,php,神马
1
基于百度先进的自然语言处理技术,一站式检测识别文本中夹杂的色情、推广、辱骂、违禁违法等垃圾内容
2021-12-15 12:13:19 61KB MVC 过滤
1
敏感词分析课程设计 包含代码 报告 各类图 任意选择一个文本文件,分析该文件,如果存在敏感词汇(这些词汇保存在sensitive.txt文件中,每个词占一行),报告每个词出现的次数。
2021-12-12 15:13:25 2.49MB 敏感词分析 课程设计 java 代码
1
原创。对输入文本串过滤所有敏感词,所有敏感词字符以'*'替换后输出。C语言实现的。
2021-12-11 16:42:59 3KB 敏感词 c
1
NLP民工的乐园 最强大的NLP武器库 NLP民工的乐园:几乎最全的中文NLP资源库 词库 工具包 学习资料 在入门到熟悉NLP的过程中,用到了很多github上的包,遂整理了一下,分享在这里。 很多包非常有趣,值得收藏,满足大家的收集癖!如果觉得有用,请分享并star,谢谢! 长期不定时更新,欢迎手表和叉子! 涉及内容包括但不限于:中英文敏感词,语言检测,中外手机/电话归属​​地/运营商查询,名字,名称,性别,手机号撤回,身份证删除,邮箱删除,中日文人名库,中文缩写库,拆字字典,词汇情感值,替换词,反动词表,暴恐词表,繁简体转换,英文模拟中文最佳,汪峰歌词生成器,职业名称词库,词典库,反义词库,否定词库,汽车品牌词库,汽车零件词库,连续英语切割,各种中文词向量,公司名称大全,古诗词库,IT词库,财经词库,成语词库,地名库,历史名人词库,诗词词库,医学词库,饮食词库,法律词库,汽车词库,动
2021-11-25 15:48:32 69.21MB Python
1
MyCommunity 项目介绍 MyCommunity 是一个模仿知乎的简单问答网站,基于SpringBoot+MyBatis实现。 用户可以发表帖子、评论、点赞、私信、相互关注、查看用户信息等。 同时,网站拥有敏感词过滤、热门帖子排行、搜索帖子、系统消息通知等功能。 项目演示 项目演示地址 (emmmmm...之前被我不小心把线上代码删了QAQ,网站展示暂时失败) 用户名: 时崎狂三 密码: 123456 (PS: 或者其它9个精灵名字) (PS: 项目现在已经不能注册,请使用现有账号密码登录 by.12.21) 项目截图 用到的技术 技术 名称 Spring Boot 容器+MVC框架 Spring Security 认证和授权框架 MyBatis ORM框架 Elasticsearch 搜索引擎 Redis 分布式缓存 Thymeleaf 模板引擎 Quartz 定时任务支持
2021-11-17 20:51:23 751KB Java
1
敏感词过滤 python3 测试过滤效果 python -m speachless.test 输出json文件 至 dist python -m speachless.sensitive_tree 简介 speachless/lib 敏感词库, 三个种类,涉政, 色情, 自定义. speachless/sensitive_tree.SensitiveTree 根据词库中的敏感词构造检测tree speachless/sensitive_filter.SensitiveFilter 检测输入内容是否与敏感词匹配 使用 git archive master | tar -x -C /project/xxx/speachless ** 应该将以下对象 作为全局变量避免每次重新初始化 tree 造成额外开销 ** ** 当导入外部词库时, 应避免词库中存在特殊字符** sensit
2021-10-25 20:03:07 10KB python text-filter china-law Python
1
敏感词过滤系统 更多详见 Ubuntu Linux下环境构建: sudo apt-get install python-pip pip install nltk pip install jieba pip install pymongo Config下config文件: 可以进行服务器配置,针对数据库中预定集合的不同区段列, 可以选择语言(中文,英文), 可以设置要过滤的文章数量,时间替换从最近前推 添加邮件通知系统,SendMailFlag =“是”#“否” 结果:细分filter_status为1表示通过过滤,为0表示不通过过滤 stopwords_chs和stopwords_eng为过滤词黑名单 可以随时添加要过滤的单词,一行一个 如果添加的过滤词无法正确被jieba分词,则同样方法将需要过滤的词和词频加入到主字典dict文件中或者用户字典user_dict,一行一
2021-10-25 20:02:20 1.84MB 系统开源
1