编号 zgly0000986444
文献类型 期刊论文
文献题名 MapReduce环境下支持精确查询的嵌套式数据索引技术
作者单位 上海理工大学光电信息与计算机工程学院
母体文献 小型微型计算机系统
年卷期 2015(2)
页码 220-225
年份 2015
关键词 嵌套式数据 精确查询 列存储 倒排索引 Uni Hash
文摘内容 目前,针对嵌套式数据集上的高效查询处理已成为Web数据检索的一个重要任务.不同于传统信息检索,嵌套式数据集既要存储数据又要存储结构,导致了针对该类数据集查询的低效性,特别是对如何保证精确查询效率更是一个挑战.结合列存储结构和倒排索引技术,首先定义了表达嵌套式数据集中数据位置信息的唯一路径UPath,提出一种新的支持嵌套式数据集精确查询的索引结构——Uni Hash.在此基础上,给出了生成数据值的唯一路径UPath以及基于MapReduce框架建立Uni Hash索引的相关算法.通过将其与XPath检索进行对比,验证了Uni Hash索引结构的有效性。