基于Labeled-LDA模型的文本分类新算法
文献类型:会议论文
作者 | 李文波 ; 孙乐 ; 黄瑞红 ; 冯元勇 ; 张大鲲 |
出版日期 | 2007 |
会议名称 | 第三届全国信息检索与内容安全学术会议 |
会议日期 | 2007 |
会议地点 | 苏州 |
关键词 | 文本分类 图模型 隐含狄利克雷分配 变分推断 |
页码 | 110-116 |
中文摘要 | Latent Dirichlet Allocation(LDA)模型是近年来提出的一种具有文本主题表示能力的非监督学习模型。通过在传统LDA模型中融入文本类别信息,本文提出了一种附加类别标签的LDA模型(Labeled-LDA)。基于该模型可以计算出隐含主题在各类别上的分配量,从而克服了传统LDA模型用于分类时强制分配隐含主题的缺陷。与传统LDA模型的实验对比表明,基于Labeled-LDA模型的文本分类新算法可以有效改进文本分类的性能:在复且中文语料库上micro_F1提高约5.7%,在英文语料库20n |
会议主办者 | 中国中文信息学会 |
会议录 | 第三届全国信息检索与内容安全学术会议论文集
![]() |
语种 | 中文 |
源URL | [http://124.16.136.157/handle/311060/11024] ![]() |
专题 | 软件研究所_基础软件国家工程研究中心_会议论文 |
推荐引用方式 GB/T 7714 | 李文波,孙乐,黄瑞红,等. 基于Labeled-LDA模型的文本分类新算法[C]. 见:第三届全国信息检索与内容安全学术会议. 苏州. 2007. |
入库方式: OAI收割
来源:软件研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。