编号 zgly0001590397
文献类型 期刊论文
文献题名 自然语言理解的中文地址匹配算法
作者 宋子辉
作者单位 遥感国家重点实验室中国科学院遥感与数字地球应用研究所
母体文献 遥感学报
年卷期 2013年04期
年份 2013
分类号 P208
关键词 自然语言理解 地址匹配 地址要素 地址解析 隐马尔科夫模型
文摘内容 在分析现有3类主要的中文地址匹配算法:要素层级匹配法、全文检索法、正则表达式法的基础上,提出了基于自然语言理解的中文地址匹配算法。新算法中建立了空间关系地址模型以解决中文地址抽象问题、地址库逻辑模型以解决地址信息的空间知识表达问题。新算法的完整流程包括预处理、地址解析、地址要素标准化、推理匹配和匹配登记等5个环节,本文重点阐述了地址解析和推理匹配这两个重要环节,分别依据自然语言理解中的中文分词和语义推理原理,对用非结构化的中文自然语言描述的中文地址进行处理,实现自然语言理解方法与地址匹配之间的结合,从而建立完整的基于自然语言理解的中文地址匹配算法。为验证该算法,开发了中文地址智能匹配实验系统,对河南省濮阳市人口库1000条居民地址数据进行匹配,匹配率达到了95%,准确率高于93%。