基于单字提示特征的中文命名实体识别快速算法
文献类型:会议论文
作者 | 冯元勇 ; 孙乐 ; 张大鲲 ; 李文波 |
出版日期 | 2007 |
会议名称 | 第三届全国信息检索与内容安全学术会议 |
会议日期 | 2007 |
会议地点 | 苏州 |
关键词 | 中文命名实体识别 条件随机场 自然语言处理 机器学习 中文信息处理 |
页码 | 575-281 |
中文摘要 | 近年来条件随机场(CRF)模型在自然语言处理中的应用越来越广泛。标准的线性链(linear-chain)模型一般采用L-BFGS参数估计方法,收敛速度慢。本文在分析模型复杂度的基础上提出了一种改进的快速CRF算法。该算法通过引入小规模单字特征降低特征的规模,并通过在推理过程中引入任务相关的人工知识压缩Viterbi和Baum-Welch格搜索空间,提高了训练的速度。在中文863命名实体识别评测语料和SIGHAN06语料集上进行的实验表明,该算法在不影响中文命名实体识别精度的同时,有效地降低了模型的训练代价 |
会议主办者 | 中国中文信息学会 |
会议录 | 第三届全国信息检索与内容安全学术会议论文集
![]() |
语种 | 中文 |
源URL | [http://124.16.136.157/handle/311060/11028] ![]() |
专题 | 软件研究所_基础软件国家工程研究中心_会议论文 |
推荐引用方式 GB/T 7714 | 冯元勇,孙乐,张大鲲,等. 基于单字提示特征的中文命名实体识别快速算法[C]. 见:第三届全国信息检索与内容安全学术会议. 苏州. 2007. |
入库方式: OAI收割
来源:软件研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。