数据资源: 中文期刊论文

面向网页文本的地理要素变化发现



编号 zgly0000924648

文献类型 期刊论文

文献题名 面向网页文本的地理要素变化发现

作者 郭俊枫  赵仁亮  郑娇龙 

作者单位 中国矿业大学(北京)地球科学与测绘工程学院  国家基础地理信息中心 

母体文献 地理信息世界 

年卷期 2015(1)

页码 52-56

年份 2015 

关键词 地理要素  动态更新  变化发现  网页文本  贝叶斯分类 

文摘内容 地理要素变化发现是地理信息数据库动态更新的重要组成部分。互联网在信息传播中扮演着越来越重要的角色,网页文本中蕴含着一些现势性很强的地理要素信息,可作为地理要素变化发现的数据源。本文结合网络爬虫和朴素贝叶斯分类模型,提出并实现了一种面向网页文本的地理要素变化发现方法。首先,本文在收集分析地理要素变化新闻锚文本的基础上,构建了网络地理要素变化新闻关键词库,并基于关键词库设计了适于地理要素变化发现的网络爬虫,实现了候选网页文本的主动获取;接着为了提取地理要素变化新闻,本文训练构造了适于地理要素变化发现的朴素贝叶斯分类器,对候选网页文本进行筛选。

相关图谱

扫描二维码