面向自然语言的信息智能检索
文献类型:学位论文
作者 | 高山 |
学位类别 | 工学硕士 |
答辩日期 | 2001-06-01 |
授予单位 | 中国科学院研究生院 |
授予地点 | 中国科学院自动化研究所 |
导师 | 徐波 |
关键词 | 信息检索 自然语言处理 三元统计模型 模糊智能检索 |
学位专业 | 模式识别与智能系统 |
中文摘要 | 本文主要研究信息检索的理论及其方法,并建立一套基于模糊集合的智能检 索系统,使用户能够应用自然语言进行检索,克服了按照关键词进行简单匹配检 索的种种弊端。本文首先介绍了信息检索的基本概念及其背景,简单地阐述了信 息检索的主要方法。然后,分析了汉语信息检索的难点,为了更好地理解汉语语 言,文章概述了可以借鉴的自然语言处理的主要理论体系。分词和词性标注成为 汉语的自然语言处理的基础工作。文本详细地讲解了应用三元统计模型的分词及 标注一体化实行的方法。最后,给出了基于模糊集合的检索方法及其实现过程。 通过筛选出关键词,为每个关键词建立模糊集合,根据关键词矢量计算出每个文 档在每个集合中的隶属函数。在对全部文档及用户的检索要求预处理后,根据检 索要求与文档之间关键词矢量的相似度,用模糊运算给每个文档打分,按分值排 序输出结果。 按照本文所讲述的方法建立的检索系统,实验证明能够取得较好的结果。 |
语种 | 中文 |
其他标识符 | 614 |
源URL | [http://ir.ia.ac.cn/handle/173211/6852] ![]() |
专题 | 毕业生_硕士学位论文 |
推荐引用方式 GB/T 7714 | 高山. 面向自然语言的信息智能检索[D]. 中国科学院自动化研究所. 中国科学院研究生院. 2001. |
入库方式: OAI收割
来源:自动化研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。