科技日报记者 马爱平 通讯员 宋平 马文君
日前,由中国林科院科信所林草大数据与知识服务团队历经3年多时间研发的“林草领域知识图谱应用系统”正式推出运行。该系统覆盖了从数据采集到数据清洗、知识提取、知识表示、本体建模、图谱自动构建及动态更新、可视化关联分析、智能问答、语义检索、智能知识推荐等知识图谱技术链,实现了林草领域知识资源协同建设与知识共享,为用户提供基于语义关联的知识发现服务。
该系统通过林草领域专家的参与,确定了专家、机构、地点、类别、品种、种(动植物)、属(动植物)、科(动植物)8大概念维度,定义了各概念之间的关系与属性,构建了林草领域知识本体模型。开展了林草专家、机构、造林树种、国家林木良种名录、授权植物新品种等知识的收集、数据抽取、精细化加工和标注,形成不同知识维度和分类体系的数据,构建了林草领域知识本体库,目前已收录林草领域实体数据53753个,关系数据162888个,以RDF三元组形式表示,利用Neo4j图形库进行存储。实现了林草领域知识图谱与林业专业知识服务系统林业搜索系统的有机融合,提高了平台的统一搜索和聚合能力,实现知识关联、智能搜索、知识挖掘与可视化分析等功能。利用本体针对用户检索结果进行辅助聚类,同时利用本体关联关系辅助用户进行深入检索,实现数据资源的深度挖掘与揭示。
林草领域涉及的范围广、数据来源多、形式复杂,对此,中国林科院科信所林草大数据与知识服务团队深入开展林草领域语义知识组织研究,探索智能化语义知识组织技术方法,加强林草知识组织体系优化和关键技术研发,研究解决了大容量知识本体的灵活抽取、实时自动关联与可视化展示等技术问题,构建了林草大数据科技知识资源体系。“林草领域知识图谱应用系统”借助知识图谱的优势,实现分散孤立的数据到聚合关联的知识转化,可以深化数据资源利用,更好地为林草科技创新和政府决策提供支撑保障。
(中国林科院供图)
马爱平 宋平 马文君 科技日报 2022-06-17