编号
zgly0000743774
文献类型
期刊论文
文献题名
改进的FLWAP的Web访问序列模式挖掘方法
作者单位
牡丹江医学院教育技术与信息中心
阿里巴巴(中国)网络技术有限公司
母体文献
计算机与现代化
年卷期
2011(3)
页码
17-20
年份
2011
分类号
TP393
关键词
序列模式
FLWAP-mine
投影树
剪枝
文摘内容
为了提高序列模式挖掘的FLWAP-mine算法挖掘海量数据的效率和性能,基于减少数据库访问次数原则和序列模式的Apriori性质对FLWAP-mine算法进行改进,构造FLWAP-tree过程中只扫描一次访问序列数据库,对树进行剪枝删除非频繁事件。模式挖掘过程中采取投影数据库思想,只搜索当前模式的投影树,对构造的投影树判断剪枝,去除非频繁事件,进一步缩小搜索范围。实验表明,当数据量较大或支持度阈值较小时,改进的FLWAP-mine算法比FLWAP-mine算法有更好的性能。