基于隐含狄列克雷分配分类特征扩展的微博广告过滤方法
文献类型:期刊论文
作者 | 邢金彪2; 崔超远2![]() ![]() ![]() |
刊名 | 计算机应用
![]() |
出版日期 | 2016 |
卷号 | 036 |
关键词 | 广告过滤 隐含狄列克雷分配 短文本分类 支持向量机 特征扩展 |
ISSN号 | 1001-9081 |
其他题名 | Microblog advertisement filtering method based on classification feature extension of latent Dirichlet allocation |
英文摘要 | 传统的微博广告过滤方法忽略了微博广告文本的数据稀疏性、语义信息和广告背景领域特征等因素的影响。针对这些问题,提出一种基于隐含狄列克雷分配(LDA)分类特征扩展的广告过滤方法。首先,将微博分为正常微博和广告型微博,并分别构建LDA主题模型预测短文本对应的主题分布,将主题中的词作为特征扩展的基础;其次,在特征扩展时结合文本类别信息提取背景领域特征,以降低其对文本分类的影响;最后,将扩展后的特征向量作为分类器的输入,根据支持向量机(SVM)的分类结果过滤广告。实验结果表明,与现有的仅基于短文本分类的过滤方法相比,其准确率平均提升4个百分点。因此,该方法能有效扩展文本特征,并降低背景领域特征的影响,更适用于数据量较大的微博广告过滤。 |
语种 | 中文 |
CSCD记录号 | CSCD:5774728 |
源URL | [http://ir.hfcas.ac.cn:8080/handle/334002/51815] ![]() |
专题 | 中国科学院合肥物质科学研究院 |
作者单位 | 1.中国科学院合肥智能机械研究所 2.中国科学院合肥智能机械研究所 3.中国科学院合肥智能机械研究所 4.中国科学院合肥智能机械研究所 |
推荐引用方式 GB/T 7714 | 邢金彪,崔超远,孙丙宇,等. 基于隐含狄列克雷分配分类特征扩展的微博广告过滤方法[J]. 计算机应用,2016,036. |
APA | 邢金彪,崔超远,孙丙宇,&宋良图.(2016).基于隐含狄列克雷分配分类特征扩展的微博广告过滤方法.计算机应用,036. |
MLA | 邢金彪,et al."基于隐含狄列克雷分配分类特征扩展的微博广告过滤方法".计算机应用 036(2016). |
入库方式: OAI收割
来源:合肥物质科学研究院
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。