数据资源: 中文期刊论文

基于DOM的数字图书馆Web资源信息提取服务模型之研究



编号 zgly0000287624

文献类型 期刊论文

文献题名 基于DOM的数字图书馆Web资源信息提取服务模型之研究

作者 刘平兰 

作者单位 中南林学院 

母体文献 情报杂志 

年卷期 2002,21(11)

页码 37-38

年份 2002 

分类号 G250.76 

关键词 DOM  信息提取  XML  提取规则  数字图书馆  Web资源 

文摘内容 针对万维网上用于表达Web页面信息的HTML语言存在的缺点, 提出了一种基于DOM的数字图书馆Web资源信息提取服务模型, 即以文档对象模型DOM为基础, 把所要提取的信息在DOM层次结构中的路径作为信息提取的“坐标”, 设计了一种归纳学习算法来半自动地生成提取规则, 然后根据提取规则生成Java类, 生成的Java类可以作为Web包装器软件的重要组成部分。此模型是研究异型数据源系统中组合查询处理的重要组成部分。

相关图谱

扫描二维码