编号 zgly0000654667
文献类型 期刊论文
文献题名 大词汇连续汉语语音的MLP声学特征的研究
作者 吕丹桔 Ch. Plahl B.Hoffmeister
作者单位 西南林学院计算机与信息科学系 亚琛工业大学计算机第六研究所
母体文献 电脑知识与技术: 学术交流
年卷期 2010,6(5)
页码 3470-3471,3475
年份 2010
分类号 TN912
关键词 多层感知器 差异特征 隐马尔可夫 高斯混合模型
文摘内容 短时声学特征参数如MFCC,PLP作为输入向量的高斯混合模型(GMM)的隐马尔可夫模型(HMM)的经典模型在大词汇连续语音识别系统(LVCSR)已取得了良好识别效果。但针对短时声学特征区分性差的特点,本文提出采用神经网络多层感知器(MLP)产生的两种类型差异特征HATs与TANDEM代替短时特征,分别训练GMM参数模型。实验结果表明,差异特征的GMHMM的LVCSR系统优于传统的短时特征的系统;为了更进一步提高系统识别率,该文又将两种类型差异特征HATs与TANDEM进行复合,构成MLPs特征流重建GMHMM,系统的错字率(CER)有2%~3.8%的明显改善。