编号
zgly0000654667
文献类型
期刊论文
文献题名
大词汇连续汉语语音的MLP声学特征的研究
作者
吕丹桔
Ch.
Plahl
B.Hoffmeister
作者单位
西南林学院计算机与信息科学系
亚琛工业大学计算机第六研究所
母体文献
电脑知识与技术: 学术交流
年卷期
2010,6(5)
页码
3470-3471,3475
年份
2010
分类号
TN912
关键词
多层感知器
差异特征
隐马尔可夫
高斯混合模型
文摘内容
短时声学特征参数如MFCC,PLP作为输入向量的高斯混合模型(GMM)的隐马尔可夫模型(HMM)的经典模型在大词汇连续语音识别系统(LVCSR)已取得了良好识别效果。但针对短时声学特征区分性差的特点,本文提出采用神经网络多层感知器(MLP)产生的两种类型差异特征HATs与TANDEM代替短时特征,分别训练GMM参数模型。实验结果表明,差异特征的GMHMM的LVCSR系统优于传统的短时特征的系统;为了更进一步提高系统识别率,该文又将两种类型差异特征HATs与TANDEM进行复合,构成MLPs特征流重建GMHMM,系统的错字率(CER)有2%~3.8%的明显改善。