数据资源: 中文期刊论文

大词汇连续汉语语音的MLP声学特征的研究



编号 zgly0000654667

文献类型 期刊论文

文献题名 大词汇连续汉语语音的MLP声学特征的研究

作者 吕丹桔  Ch.  Plahl  B.Hoffmeister 

作者单位 西南林学院计算机与信息科学系  亚琛工业大学计算机第六研究所 

母体文献 电脑知识与技术: 学术交流 

年卷期 2010,6(5)

页码 3470-3471,3475

年份 2010 

分类号 TN912 

关键词 多层感知器  差异特征  隐马尔可夫  高斯混合模型 

文摘内容 短时声学特征参数如MFCC,PLP作为输入向量的高斯混合模型(GMM)的隐马尔可夫模型(HMM)的经典模型在大词汇连续语音识别系统(LVCSR)已取得了良好识别效果。但针对短时声学特征区分性差的特点,本文提出采用神经网络多层感知器(MLP)产生的两种类型差异特征HATs与TANDEM代替短时特征,分别训练GMM参数模型。实验结果表明,差异特征的GMHMM的LVCSR系统优于传统的短时特征的系统;为了更进一步提高系统识别率,该文又将两种类型差异特征HATs与TANDEM进行复合,构成MLPs特征流重建GMHMM,系统的错字率(CER)有2%~3.8%的明显改善。

相关图谱

扫描二维码