智能化检索系统之语义检索应用初探

(整期优先)网络出版时间:2022-09-21
/ 2

智能化检索系统之语义检索应用初探

张慧敏,李现鹏1

国家知识产权局专利局专利审查协作天津中心  天津  300304

摘要:本文立足于国家知识产权局2021年上线的智能化检索系统中的语义检索功能,与目前常见的两种语义检索系统的进行对比,希望能给广大审查员在专利检索时予以启发,以进一步促进专利审查质量和专利审查效率的提高。

关键词:智能化检索系统 语义检索 对比

一、引言

在专利审查中,现有技术的检索是专利检索过程中极为重要的环节,而检索工具的选择往往直接决定了检索效率。对于传统的S系统检索方式,关键词、分类号提取的是否准确或扩展是否充分、检索式构建是否得当等均是影响检索结果的重要因素。基于常规检索方式的局限性和复杂性,寻找一种简单、智能、人为依赖程度低的检索方式变得越来越迫切[1]。本文作者通过对智能检索系统的实际使用体验与目前常见的patentics语义检索系统和incopat语义检索系统进行对比,期待可以帮助审查员更快、更好的适应智能检索系统中的语义检索功能,促进审查质量和审查效率的全面提升。

二、与patentics和incopat的语义检索系统比较

Patentics 是由索意互动(北京)信息技术有限公司开发的智能化专利搜索和分析系统,其智能语义检索基于统计语言模型,将给出的词语、段落、句子、文章,或者是一个专利公开号,在全球专利数据库中找到与之相关的专利,并按照相关度排序。incoPat 是北京合享智慧科技有限公司开发的,将全球发明深度整合并翻译为中文的专利信息平台。incoPat 的语义检索采用了国际领先的深度学习算法,支持输入一段话,系统自动匹配相关专利[3]。下面将结合具体案例将智能检索系统中的语义检索功能和patentics和incopat语义检索系统进行简单对比。


【案件1】(一)基本案情

发明名称:移动终端及其控制方法[2]

发明构思:当用户在观看视频、图片、网页等屏幕内容时,用户通常希望屏幕能跟随着移动终端的旋转而旋转,也即当移动终端处于横向放置状态时,希望屏幕内容进行横屏显示;当移动终端处于竖向放置状态时,希望屏幕内容进行竖屏显示。为了实现屏幕旋转,用户通常需要先开启移动终端的屏幕旋转功能,并确保移动终端与水平方向形成一定的角度,此时,再旋转移动终端来进行屏幕旋转,由于用户需要执行这一系列的操作,使得移动终端控制屏幕内容显示方式的效率并不高。      

本发明提出的移动终端及其控制方法,在采集到移动终端用户的指纹时,获取模块获取该指纹的指纹方向,然后确定模块根据该指纹方向来确定移动终端当前的放置状态,进而控制模块根据移动终端当前的放置状态,控制移动终端当前显示的屏幕内容的显示方式。省去了用户开启屏幕旋转功能。

(二)检索分析

本发明的发明点为依据指纹的方向确定移动终端与水平或者竖直方向的夹角,因此提取本申请的关键词为指纹,方向以及夹角或角度,在智能检索系统中先使用关键词布尔运算然而语义排序,则可以在第13位获得X文件。

该对比文件公开了:步骤一,检测获取手指与屏幕的触摸位置,并利用指纹识别传感器识别该手指指纹;步骤二,根据预先录入的指纹库判断该手指指纹为右手手指纹还是左手手指纹;步骤三,根据检测的手指与屏幕的触摸位置,确定该手指与横屏或竖屏方向的夹角;步骤四,根据判断结果以及确定的该手指与横屏或竖屏方向的夹角,确定当前用户手持该设备的状态,并根据确定的状态确定屏幕显示方向切换策略;步骤五,根据屏幕显示方向切换策略进行屏幕显示方向的切换。由此可见,该对比文件依据指纹的方向确定移动终端与水平或者竖直方向的夹角,即该对比文件公开本申请的发明构思。

使用patentics语义检索并使用相同的关键词以及检索式b/”指纹 nwn 方向” and b/(角度 or 夹角) 进行干预,在400篇排序之内并未发现该对比文件。同样使用incopat语义检索功能,并使用相同的关键词以及检索式子 指纹(s)方向 and (角度 or 夹角)进行干预,该对比文件则位于第182位,相关度为86.7%,因此使用incopat相比patentics,该对比文件排位靠前,但仍然存在一定筛选难度。

【案件2】(一)基本案情

发明名称:通话过程中的信息处理方法及装置

发明构思:在相关技术中,用户在通话过程中,常常会遇到需要根据对方提示输入相关信息的情景,而通常用户可能并不熟悉这些要输入的信息或者由于这些信息太长而记不太清楚,因而可能需要翻到手机中存储有这些信息的位置,然后将这些信息记录在纸上或者强行记住,进而输入这些信息。但这种通话过程中的信息输入过程显然过于繁琐,给用户带来很大困扰,用户体验并不好。

本公开的实施例提供的技术方案,通过将第一待输入信息存储至该预设存储位置中,可以在目标终端处于通话过程中时,根据检测到的输入指令,自动地从该预设存储位置中获取该输入指令所对应的第二待输入信息,进而控制目标终端自动输入该第二待输入信息,以实现在不需要用户记忆和手动输入通话对端需要获取的第二待输入信息的基础上,可以根据检测到的输入指令自动而快速地输入通话对端需要获取的第二待输入信息,避免用户需要翻至该第二待输入信息的存储位置进而手动输入该第二待输入信息,进而实现在减少用户操作的基础上简化通话过程中信息输入步骤,提高通话过程中信息输入的效率。

(二)检索分析

使用patentics语义检索,直接输入r/cn106406705并未使用任何关键词进行人工干预,在在1页第10位即可以得到公开了本申请发明构思的X类文件。

对比文件公开了:在步骤S110中,调用终端中的信息加载模块;在用户需要拨打语音专线时,如银行、快递或移动运营商的专线,一般都需要输入用户的某些信息,因此,可以预先在终端中安装信息加载模块,该信息加载模块具有加载用户相关信息的功能,在用户需要输入某些信息时,该信息加载模块可以自动调用这些信息;在步骤S120中,利用信息加载模块获取与预设通信号码相关联的预设信息;在步骤S130中,提取预设信息中的目标信息;在步骤S140中,将目标信息输入到终端,以使得终端将目标信息发送给与预设通信号码相对应的通信设备。由此可见,该对比文件通过信息加载模块自动加载用户预存的信息,以避免手动输入,公开本申请的发明构思。

使用incopat语义检索并未进行任何人工干预直接排序在400篇排序之内未发现该对比文件,而使用智能检索系统语义检索并未进行任何人工干预直接语义排序,该对比文件出现在第位页,其相关度为74%,该对比文件排位较incopat语义排序靠前,但相比Ptentics语义排序由于位置靠后仍然存在一定筛选难度。

从案例5和案例6这两个案例的对比可见,智能检索系统、Patentics以及incoPat在语义排序、相关度计算上存在一定不同,这主要是由于这三个系统训练得到的语言模型存在差异,但三者在语义检索的准确上并没有绝对的孰优孰劣,对于不同的专利检出效果也不甚不同。因此在使用语义检索功能时,建议同时在多个系统中进行语义检索。

三、结束语

通过本文的比较,智能检索系统、Patentics语义检索 和 Incopat语义检索在主要的检索功能上是相似的,三者均可以直接进行语义相关排序、也可以人工干预检索后语义排序,只不过在检索字段、格式、浏览界面等上稍有不同,此外这三个系统背后的语义检索算法模型存在一定差异,建议审查员在使用时可以同时在多个系统中进行语义检索,以便保证检索结果的正确性和准确性,从而进一步全面提高审查质量和效率。

参考文献

[1]吴娜,郑韩慈.浅析PATENTICS与S系统的结合检索[J].河南科技,2019(9):56-58.

[2]天津中心审查业务部. 智能化检索系统(检索部分专项培训)-电学领域[R].内部资料,2021.

[3]林婉娟. 智能语义检索在专利检索的实战分析[J].中国科技信息,2020(16):15-16.

1.等同于第一作者