简介:摘要现阶段,我国国际上所开展的研究工作会关注于维汉机器翻译内容,这种机器翻译的方式带有一定的通用性,其在研究维汉机器翻译内容时,可以以主流机器翻译方式为基准。维吾尔语的语言较为复杂,其所形态变化比较丰富,很多词根都可以进一步的演变成为多种新形式。相比之下,我国汉语的形态变化就比较微弱,所以,目前,国际上所使用的机器翻译主要针对的对象就是英语等形态变化较为简单的语言,不需要对词形的变化进行分析。可以将各个不同词形的词语当做独立性的词语分析。本文主要就维汉机器翻译的维语命名实体的识别与翻译进行探究,找出现阶段我国维汉机器翻译现状以及存在的问题,科学合理的设计相应的系统。
简介:随着信息技术的飞速发展,互联网已成为国家教育考试有害信息传播的主要途径。为净化涉考网络环境,保障教育考试的公平和安全,在国家教育考试期间,各级考试机构安排专人利用百度、搜狗等搜索引擎,人工搜索有害信息,并上报有关部门进行处置。然而该方式存在工作效率低、搜索范围小、信息分析程度低等问题。针对这些问题,本文利用主题搜索、文本处理等信息技术手段,提出了以领域知识库为核心的有害信息自动监测模型,自动对互联网信息进行采集、去重、分类等处理,实时提供分类统计、热点分析、来源分析等基础数据。最后给出该模型与现有人工监测的协作方式,两者之间相互补充,从而形成覆盖面大、实时性强、精确度高的有害信息监控体系。