学科分类
/ 1
2 个结果
  • 简介:传记是然而,为普通的人知道众所周知的民族的表示的一个直接、广泛的方法,有差的知识让他们被认识到。在最近的年里,信息抽取(IE)技术被用来自动地与联机信息为任何人产生传记。关键挑战之一是能连接传记句子到相应实体的连接的实体(EL)。当前,使用的一般EL系统通常产生错误从实体名字变化和歧义发源。与一般文本相比,传记判决拥有唯一还很少学习了关系知识(RK)和时间的知识(TK),它能足够地区分实体。这篇文章建议一个新统计框架为自动化传记建设把知识称为提高的EL(龙骨)系统。提高实体连接利用象PK和TK一样的常识的知识。Wikipedia数据上的龙骨的表演被评估。与最先进的方法相比,龙骨显著地改进实体连接的精确和召回,这被显示出。

  • 标签: 传统知识 实体 链接 龙骨 传记 信息提取
  • 简介:音调模型(TM)集成是为官员语音识别的一项重要任务。有效有区别地使用当把TM分数集成到多传递语音识别时,放大因素训练被证明了。而且,可伸缩的上下文依赖者(CD)能更好被申请在模型之间的插值。这条途径的一限制是很多参数将被介绍,它使这种技术容易到训练过度。在这份报纸,我们建议由使用自动地导出的语音的决定树导致上下文依赖者模型重量。在每个树节点的问题被选择在训练数据上最小化期望的识别错误。首先订客观功能被用于问题修剪使树造有效的最小的电话错误(MPE)的近似。连续官员语音识别上的试验性的结果证明方法能够导致最关键的语音的上下文并且与少得多的参数获得重要错误减小,与由使用放大参数的手工地设计的上下文依赖者获得了那相比。

  • 标签: 汉语语音识别 上下文相关 模型集成 感应 训练数据 汉语普通话