中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
一种基于密度的自适应最优LDA模型选择方法

文献类型:期刊论文

作者曹娟; 李锦涛; 唐胜; 张勇东
刊名计算机学报
出版日期2008
期号第10期页码:1780—1787
关键词主题模型 主题 Lda 密度
英文摘要主题模型(topic models)被广泛应用在信息分类和检索领域.这些模型通过参数估计从文本集合中提取一个低维的多项式分布集合,用于捕获词之间的相关信息,称为主题(topic).针对模型参数学习过程对主题数目的指定和主题分布初始值非常敏感的问题,作者用图的形式阐述了LDA(Latent Dirichlet Allocation)模型中主题产生的过程,提出并证明当主题之间的相似度最小时模型最优的理论;基于该理论,提出了一种基于密度的自适应最优LDA模型选择方法.实验证明该方法可以在不需要人工调试主题数目的情况下,用相对少的迭代,自动找到最优的主题结构.
语种中文
公开日期2010-10-19
源URL[http://ictir.ict.ac.cn/handle/311040/736]  
专题中国科学院计算技术研究所期刊论文_2008年中文
推荐引用方式
GB/T 7714
曹娟,李锦涛,唐胜,等. 一种基于密度的自适应最优LDA模型选择方法[J]. 计算机学报,2008(第10期):1780—1787.
APA 曹娟,李锦涛,唐胜,&张勇东.(2008).一种基于密度的自适应最优LDA模型选择方法.计算机学报(第10期),1780—1787.
MLA 曹娟,et al."一种基于密度的自适应最优LDA模型选择方法".计算机学报 .第10期(2008):1780—1787.

入库方式: OAI收割

来源:计算技术研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。