一种自顶向下挖掘长频繁项的有效方法
文献类型:期刊论文
作者 | 王天然![]() ![]() |
刊名 | 计算机研究与发展
![]() |
出版日期 | 2004 |
卷号 | 41期号:1页码:148-155 |
关键词 | 自顶向下 数据挖掘 关联规则 项目约简 频繁项 |
ISSN号 | 1000-1239 |
其他题名 | An Effective Top-Down Data Mining Method for Long Frequents |
产权排序 | 1 |
英文摘要 | Apriori算法已经成为关联规则挖掘中的经典算法 ,被广泛地用于商业决策、银行贷款、金融保险等几乎所有的关联规则挖掘领域之中 该方法是一种自底向上的有效挖掘方法 ,对于长频繁项 (如 10 0个项目 )该方法会遇到非常耗时的巨大计算问题 采用了一种新的自上而下挖掘方法 ,提出了事务项目关联信息表、关键项目、项目约简、投影数据库等新概念 ,利用投影、约简等方法在候选项集生成过程中及时修剪重复分支 ,使算法的实际效率大为提高 ,较好地解决了长频繁项的挖掘问题 通过计算机实验和算法分析证明了这种挖掘方法的有效性和完备性 新算法的计算复杂度与项目集平均约简项长度有关 ,估计为 0 5×M3 N×O(2 S×N′2 ) 其中 ,S为系统在用户给定最小支持度条件下的平均约简项长度 ,N′是数据库所对应关系的元组数 ,N为记录数 ,M为项目集平均长度 对于长频繁项来说S很小 ,计算复杂度接近多项式时间 |
语种 | 中文 |
CSCD记录号 | CSCD:1568379 |
资助机构 | 国家“八六三”高技术研究发展计划基金 ( 2 0 0 1AA413 410 );;辽宁省自然科学基金 ( 9910 2 0 0 2 0 5 ) |
公开日期 | 2010-11-29 |
源URL | [http://210.72.131.170//handle/173321/4325] ![]() |
专题 | 沈阳自动化研究所_工业信息学研究室_先进制造技术研究室 |
通讯作者 | 王晓峰 |
作者单位 | 1.中国科学院沈阳自动化研究所 2.沈阳化工学院计算机科学与技术学院 |
推荐引用方式 GB/T 7714 | 王天然,王晓峰,赵越. 一种自顶向下挖掘长频繁项的有效方法[J]. 计算机研究与发展,2004,41(1):148-155. |
APA | 王天然,王晓峰,&赵越.(2004).一种自顶向下挖掘长频繁项的有效方法.计算机研究与发展,41(1),148-155. |
MLA | 王天然,et al."一种自顶向下挖掘长频繁项的有效方法".计算机研究与发展 41.1(2004):148-155. |
入库方式: OAI收割
来源:沈阳自动化研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。