基于Labeled-LDA模型的文本分类新算法
文献类型:期刊论文
作者 | 李文波 ; 孙乐 ; 张大鲲 |
刊名 | 计算机学报
![]() |
出版日期 | 2008 |
卷号 | 31期号:4页码:620-627 |
关键词 | 文本分类 |
其他题名 | Text Classification Based on Labeled-LDA Model |
中文摘要 | LDA(Latent Dirichlet Allocation)模型是近年来提出的一种能够提取文本隐含主题的非监督学习模型.通过在传统LDA模型中融入文本类别信息,文中提出了一种附加类别标签的LDA模型(Labeled-LDA).基于该模型可以在各类别上协同计算隐含主题的分配量,从而克服了传统LDA模型用于分类时强制分配隐含主题的缺陷.与传统LDA模型的实验对比表明:基于Labeled-LDA模型的文本分类新算法可以有效改进文本分类的性能,在复旦大学中文语料库上micro_F1提高约5.7%,在英文语料库20newsgroup的comp子集上micro—F-提高约3%. |
收录类别 | EI |
语种 | 中文 |
公开日期 | 2009-12-29 |
源URL | [http://124.16.136.157/handle/311060/620] ![]() |
专题 | 软件研究所_基础软件国家工程研究中心_期刊论文 |
推荐引用方式 GB/T 7714 | 李文波,孙乐,张大鲲. 基于Labeled-LDA模型的文本分类新算法[J]. 计算机学报,2008,31(4):620-627. |
APA | 李文波,孙乐,&张大鲲.(2008).基于Labeled-LDA模型的文本分类新算法.计算机学报,31(4),620-627. |
MLA | 李文波,et al."基于Labeled-LDA模型的文本分类新算法".计算机学报 31.4(2008):620-627. |
入库方式: OAI收割
来源:软件研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。