基于类别分布的特征选择框架
文献类型:期刊论文
作者 | 靖红芳; 徐 燕; 杨雅辉; 王 斌 |
刊名 | 计算机研究与发展
![]() |
出版日期 | 2009 |
期号 | 第9期页码:1586~1593页 |
关键词 | 特征选择 非平衡语料 特征降维 文本分类 数据挖掘 |
英文摘要 | 目前已有很多种特征选择方法,但就目前所知,没有一种方法能够在非平衡语料上取得很好的效果.依据特征在类别间的分布特点提出了基于类别分布的特征选择框架.该框架能够利用特征的分布信息选出具有较强区分能力的特征,同时允许给类别灵活地分配权重,分配较大的权重给稀有类别则提高稀有类别的分类效果,所以它适用于非平衡语料,也具有很好的扩展性.另外,OCFS和基于类别分布差异的特征过滤可以看作该框架的特例.实现该框架得到了具体的特征选择方法,Retuers-21578语料及复旦大学语料等两个非平衡语料上的实验表明,它们的Macro 和Micro F1效果都优于IG, CHI和OCFS. |
语种 | 中文 |
公开日期 | 2010-09-29 |
源URL | [http://ictir.ict.ac.cn/handle/311040/545] ![]() |
专题 | 中国科学院计算技术研究所期刊论文_2009年中文 |
推荐引用方式 GB/T 7714 | 靖红芳,徐 燕,杨雅辉,等. 基于类别分布的特征选择框架[J]. 计算机研究与发展,2009(第9期):1586~1593页. |
APA | 靖红芳,徐 燕,杨雅辉,&王 斌.(2009).基于类别分布的特征选择框架.计算机研究与发展(第9期),1586~1593页. |
MLA | 靖红芳,et al."基于类别分布的特征选择框架".计算机研究与发展 .第9期(2009):1586~1593页. |
入库方式: OAI收割
来源:计算技术研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。