数据资源: 中文期刊论文

流式大数据下随机森林方法及应用



编号 zgly0000980109

文献类型 期刊论文

文献题名 流式大数据下随机森林方法及应用

作者 刘迎春  陈梅玲 

作者单位 北京航空航天大学经济管理学院 

母体文献 西北工业大学学报 

年卷期 2015(6)

页码 1055-1061

年份 2015 

关键词 决策树  随机森林方法  大数据  流式计算  社交网站  搜索引擎  分类器  剪枝  客户评分  分布式系统 

文摘内容 流式计算形态下的大数据分析一直是当前需要解决的问题,而且研究成果和实践经验较少。随机森林方法是目前应用较多的分类算法,但在流式计算应用场景中,数据所呈现出来的实时性、易失性、无序性等特征会使得算法准确度逐渐降低。针对这个问题,分析了随机森林的算法特点,提出了根据决策树的准确度进行随机森林剪枝的思路。同时为了适应数据的变化,结合准确度间隔的概念提出生成、验证并补充新决策树的方法,最终形成可以不断随数据更新的随机森林,满足流式大数据环境对算法的要求。使用实际数据对改进后方法的可行性进行了验证,证明新方法在真实流式大数据场景中有着更高的分类准确度,最后分析讨论了随机森林方法如何进一步研究改进的主题。

相关图谱

扫描二维码