基于AC自动机和贝叶斯方法的垃圾内容识别

(整期优先)网络出版时间:2019-02-12
/ 1
针对目前垃圾内容识别算法存在的问题,研究一种垃圾内容识别率高、准确率高的识别方法。对常用识别方法AC自动机和贝叶斯方法进行分析,指出这些方法存在的问题,提出一种基于AC自动机和贝叶斯方法的垃圾内容识别方法。首先,利用AC自动机按照设定的类别关键词库圈定关键词,然后利用贝叶斯方法训练所得的策略对关键词进行二次筛查,进而判断是否为垃圾内容。AC自动机与贝叶斯方法的结合能够在保证高效识别关键词的情况下尽可能地减少误伤,提高用户体验感。