中国科学院机构知识库网格系统: 面向大规模语料的语言模型研究新进展

中国科学院机构知识库网格

Chinese Academy of Sciences Institutional Repositories Grid

面向大规模语料的语言模型研究新进展

文献类型：期刊论文


作者	骆卫华 1; 刘群 2; 白硕 3
刊名	计算机研究与发展
出版日期	2009
卷号	000 期号:010 页码:1704
关键词	语言模型数据压缩随机存取模型布隆过滤器分布式并行体系
ISSN号	1000-1239
英文摘要	N元语言模型是统计机器翻译、信息检索、语音识别等很多自然语言处理研究领域的重要工具．由于扩大训练语料规模和增加元数对于提高系统性能很有帮助，随着可用语料迅速增加，面向大规模训练语料的高元语言模型（如N≥5）的训练和使用成为新的研究热点．介绍了当前这个问题的最新研究进展，包括了集成数据分治、压缩和内存映射的一体化方法，基于随机存取模型的表示方法，以及基于分布式并行体系的语言模型训练与查询方法等几种代表性的方法，展示了它们在统计机器翻译中的性能，并比较了这些方法的优缺点．
语种	英语
源URL	[http://119.78.100.204/handle/2XEOYT63/35059]
专题	中国科学院计算技术研究所期刊论文_中文
作者单位	1.中国科学院大学 2.中国科学院计算技术研究所 3.上海证券交易所
推荐引用方式 GB/T 7714	骆卫华,刘群,白硕. 面向大规模语料的语言模型研究新进展[J]. 计算机研究与发展,2009,000(010):1704.
APA	骆卫华,刘群,&白硕.(2009).面向大规模语料的语言模型研究新进展.计算机研究与发展,000(010),1704.
MLA	骆卫华,et al."面向大规模语料的语言模型研究新进展".计算机研究与发展 000.010(2009):1704.

入库方式： OAI收割

来源：计算技术研究所

浏览0

下载0

收藏0

其他版本

除非特别说明，本系统中所有内容都受版权保护，并保留所有权利。