编号
zgly0000986444
文献类型
期刊论文
文献题名
MapReduce环境下支持精确查询的嵌套式数据索引技术
作者单位
上海理工大学光电信息与计算机工程学院
母体文献
小型微型计算机系统
年卷期
2015(2)
页码
220-225
年份
2015
关键词
嵌套式数据
精确查询
列存储
倒排索引
Uni Hash
文摘内容
目前,针对嵌套式数据集上的高效查询处理已成为Web数据检索的一个重要任务.不同于传统信息检索,嵌套式数据集既要存储数据又要存储结构,导致了针对该类数据集查询的低效性,特别是对如何保证精确查询效率更是一个挑战.结合列存储结构和倒排索引技术,首先定义了表达嵌套式数据集中数据位置信息的唯一路径UPath,提出一种新的支持嵌套式数据集精确查询的索引结构——Uni Hash.在此基础上,给出了生成数据值的唯一路径UPath以及基于MapReduce框架建立Uni Hash索引的相关算法.通过将其与XPath检索进行对比,验证了Uni Hash索引结构的有效性。