数据资源: 中文期刊论文

C值和互信息相结合的术语抽取



编号 zgly0000653325

文献类型 期刊论文

文献题名 C值和互信息相结合的术语抽取

作者 梁颖红  张文静  张有承 

作者单位 苏州市职业大学江苏省现代企业信息化应用支撑软件工程技术研究开发中心  东北林业大学信息与计算机工程学院 

母体文献 计算机应用与软件 

年卷期 2010,27(4)

页码 108-110

年份 2010 

分类号 TP391 

关键词 术语抽取  C值  互信息 

文摘内容 在目前的生物信息领域开放语料的术语抽取实验中,前2000多个双字词的精度已经达到了90.36%,但是三字以上的词的抽取精度只有66.63%,多字词的抽取成为了名词术语自动抽取的一个难点问题。针对该难点,提出综合C-value参数在长术语抽取方面的优势,并与术语抽取中的互信息参数相结合的策略来识别术语。实验结果表明,长术语抽取正确率为75.7%,召回率为68.4%,F测量值为71.9%,高于相同语料下的其他方法。

相关图谱

扫描二维码