如何提高专利语义检索的准确性和处理速度?

发布时间:2016-04-06 编辑:IPCOO创新咨询管理平台 点击:25


如何提高专利语义检索的准确性和处理速度?


专利语义检索是未来互联网检索发展的方向,国内外很多专家学者也纷纷投入到了专利语义检索的研究中,出现了部分语义检索方面的科研成果;一些优秀的专利数据库也逐步简单的语义检索功能加入到数据库中,但是总的看来,还有待进一步发展。


1  建立适用于专利文献的领域本体以提高专利检索准确性


领域本体(或知识库)是语义检索的核心和保障,完整和全面的领域本体能够保证语义检索的准确性。目前专利语义检索系统的主要问题在于:

①语义检索所依赖的领域本体规模较小,无法涵盖所有技术领域;

②部分学者使用通用本体(例如WordNet),缺乏对专业技术领域(特别是专利领域)知识的系统标注,检索准确性难以保证;

③部分专利数据库使用系统用户的检索历史作为检索语义扩展的依据,难以形成完整的结构体系。


因此,需要根据现有的技术领域建立若干个适用于专利文献的领域本体,可以以点带面,从几个具有代表性的技术领域开始,构建领域本体,并利用本体的可扩展性,对其不断丰富和完善,以满足语义检索的需要。


2  利用云计算技术提高处理速度


由于语义检索需要使用到计算机的运算资源,无论是提问式处理(前处理)还是检索结果处理(后处理),均需要耗费大量的资源,普通的服务器难以满足大数据量快速检索和推理的需求。具体表现在:

①在提问式处理过程中,一方面用户的检索词需要进入本体进行语义扩展,得到相关概念,另一方面,自然语言检索过程中,文本需要经过分句、分词、权重确定等过程,有可能还需要进一步概念扩展,需要耗费大量的计算资源;

②在检索结果处理过程中,不论是语义推理还是聚类处理,普通的服务器均很难快速得到结果。


因此,以云计算技术作为语义检索的基础技术,利用“云端”服务器集群的大规模数据处理能力和超快的计算速度,降低语义检索的处理时间,提高用户体验。


随着专利信息的爆发式增长和计算机技术的不断进步,越来越多的数据库供应商和专家学者加入到了专利语义检索的研究行列中,尝试通过语义检索,使计算机能够正确理解用户的检索意图,从而避免普通专利检索中易出现的“忠实表达”、“表达差异”及“词汇孤岛”等问题,提高检索的效果。总的看来,语义检索将会是未来专利检索发展的一个重要方向,但是依旧存在一些问题有待发展和突破,诸如构建大规模领域本体、提高运算速度等,需要进一步深入发展,才能真正满足人们的专利检索需求。

IPCOO创新咨询平台

为您一对一解决问题

联系我们

IPCOO创新咨询平台

网站主页
咨询我们