自媒体敏感词检测工具 2024-04-30 Website News,Download Area 暂无评论 395 次阅读 实现一款好用敏感词工具。 基于 DFA 算法实现,目前敏感词库内容收录 6W+(源文件 18W+,经过一次删减)。 特性 - 6W+ 词库,且不断优化更新 - 基于 fluent-api 实现,使用优雅简洁 - 基于 DFA 算法,性能为 7W+ QPS,应用无感 - 支持敏感词的判断、返回、脱敏等常见操作 - 支持常见的格式转换 - 全角半角互换、英文大小写互换、数字常见形式的互换、中文繁简体互换、英文常见形式的互换、忽略重复词等 - 支持敏感词检测、邮箱检测、数字检测、网址检测等 - 支持自定义替换策略 - 支持用户自定义敏感词和白名单 - 支持数据的数据动态更新(用户自定义),实时生效 - 支持敏感词的标签接口 - 支持跳过一些特殊字符,让匹配更灵活 在线演示: ```csharp https://houbb.github.io/opensource/sensitive-word/ ``` 源码地址: ```csharp https://github.com/houbb/sensitive-word ``` 标签: 敏感, 敏感字, 敏感词, 检测 本作品采用 知识共享署名-相同方式共享 4.0 国际许可协议 进行许可。
评论已关闭