一种基于密度的自适应最优LDA模型选择方法
文献类型:期刊论文
作者 | 曹娟; 李锦涛; 唐胜; 张勇东 |
刊名 | 计算机学报
![]() |
出版日期 | 2008 |
期号 | 第10期页码:1780—1787 |
关键词 | 主题模型 主题 Lda 密度 |
英文摘要 | 主题模型(topic models)被广泛应用在信息分类和检索领域.这些模型通过参数估计从文本集合中提取一个低维的多项式分布集合,用于捕获词之间的相关信息,称为主题(topic).针对模型参数学习过程对主题数目的指定和主题分布初始值非常敏感的问题,作者用图的形式阐述了LDA(Latent Dirichlet Allocation)模型中主题产生的过程,提出并证明当主题之间的相似度最小时模型最优的理论;基于该理论,提出了一种基于密度的自适应最优LDA模型选择方法.实验证明该方法可以在不需要人工调试主题数目的情况下,用相对少的迭代,自动找到最优的主题结构. |
语种 | 中文 |
公开日期 | 2010-10-19 |
源URL | [http://ictir.ict.ac.cn/handle/311040/736] ![]() |
专题 | 中国科学院计算技术研究所期刊论文_2008年中文 |
推荐引用方式 GB/T 7714 | 曹娟,李锦涛,唐胜,等. 一种基于密度的自适应最优LDA模型选择方法[J]. 计算机学报,2008(第10期):1780—1787. |
APA | 曹娟,李锦涛,唐胜,&张勇东.(2008).一种基于密度的自适应最优LDA模型选择方法.计算机学报(第10期),1780—1787. |
MLA | 曹娟,et al."一种基于密度的自适应最优LDA模型选择方法".计算机学报 .第10期(2008):1780—1787. |
入库方式: OAI收割
来源:计算技术研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。