编号
zgly0000353756
文献类型
期刊论文
文献题名
基于混合策略的英语基本名词短语识别——边界统计和词性串规则校正相结合的策略
作者单位
哈尔滨工业大学计算机科学与技术学院
东北林业大学信息与计算机工程学院
母体文献
计算机工程与应用
年卷期
2004,40(35)
页码
1-3,121
年份
2004
分类号
TP301
H313
关键词
基本名词短语识别
英语
混合策略
语块
边界统计
词性串规则校正
文摘内容
基本名词短语识别是自然语言处理领域非常重要的子任务。文中总结了一些有代表性的基本名词短语识别方法, 并对多种典型英语基本名词短语识别的结果进行了比较和对照, 提出并实现了边界统计和词性串校正相结合的英语基本名词短语识别方法。该方法把基本名词短语识别分成主次分明的两部分, 边界统计作为主要部分能够正确识别出大部分基本名词短语, 词性串规则作为辅助手段在对前者识别出的基本名词短语进行核对和校正的同时还对边界统计方法遗漏的基本名词短语进行再回收。此方法中, 词性串规则弥补了边界统计无法顾及基本名词短语内部组合规律的缺点, 提高了精确率和召回率。采用此方法, 基本名词短语识别的精确率达到96.22%, 召回率97.59%, Fβ=1 96.90%, F值超出了目前报道的最好结果。