简介:分析了Nutch的语言分析器结构,针对Nutch对中文进行单字切分的不足,结合基于多层隐马模型的汉语词法分析系统ICTCLAS,以JavaCC脚本设计了可扩展的词法分析器,实现了Nutch对中文的词语切分。实验表明,利用JavaCC和ICTCLAS分词系统实现的中文分词完善了Nutch的中文搜索功能。
简介:主要针对我院研究人员参加军队专业技术干部英语考试时所存在的一些问题,通过笔者4年来在这方面的教学经验,力求予以应试者一定的指导,以达到在短时间内有效复习,合格通过的目的。文中提到的一些复习方法,重点已在在历届学员中得到应用并取得良好效果。
汉语词法分析系统ICTCLAS在Nutch-0.9中的应用与实现
军队专业技术干部英语考试复习方法探讨