中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
一种支持混合语言的并行查询纠错方法

文献类型:期刊论文

作者颛悦; 熊锦华; 马宏远; 程舒杨; 程学旗
刊名中文信息学报
出版日期2016
卷号30.0期号:002页码:99
关键词查询纠错 词典树 语言模型 并行纠错
ISSN号1003-0077
英文摘要中文信息检索系统中的查询语句包含中文字、拼音、英文等多种形式,而有些查询语句过长,不利于纠错处理。现有的查询纠错方法不能很好的解决中文检索系统中的混合语言与中文长查询的问题。为了解决上述两个问题,该文提出了一种支持混合语言的并行纠错方法。该方法通过对混合语言统一编码,建立统一编码语言模型和异构字符词典树,并根据语言特点制定相应的编辑规则对查询词语进行统一处理,其中,针对中文长查询,提出双向并行的纠错模型。为了并行处理查询语句,我们在字符词典树和语言模型的基础上提出了逆向字符词典树和逆向语言模型的概念。模型中使用的训练语料库是从用户查询日志、网页点击日志、网页链接信息等文件中提取的高质量文本。实验表明,与单向查询纠错相比,支持混合语言的并行纠错方法在准确率上提升了9%,召回率降低了3%,在速度上提升了40%左右。
语种英语
源URL[http://119.78.100.204/handle/2XEOYT63/28812]  
专题中国科学院计算技术研究所期刊论文_中文
作者单位1.中国科学院计算技术研究所
2.国家计算机网络应急技术处理协调中心
推荐引用方式
GB/T 7714
颛悦,熊锦华,马宏远,等. 一种支持混合语言的并行查询纠错方法[J]. 中文信息学报,2016,30.0(002):99.
APA 颛悦,熊锦华,马宏远,程舒杨,&程学旗.(2016).一种支持混合语言的并行查询纠错方法.中文信息学报,30.0(002),99.
MLA 颛悦,et al."一种支持混合语言的并行查询纠错方法".中文信息学报 30.0.002(2016):99.

入库方式: OAI收割

来源:计算技术研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。