为了确定哪些任务能用语音识别系统来完成,了解针对语音识别系统的实验室评分标准是值得的。表5-1给出了很大一类语音识别系统的性能评分,它们都是在实验室环境中(如高质量麦克风、低环境噪声)得到的。表中分别针对多种识别方式,例如,特定技术、特定任务,特定任务语法、特定模式、特定词汇表,给出了语音识别系统的单词错误率性能(用“%”表示)。

表5-1语音识别系统的性能评分
从表中可以看出,对于适合用孤立词识别的任务,在不考虑任务内容和语法限制的情况下,特定说话人(SD)识别方式的单词错误率小于5%;而针对非特定人识别方式(SI)和较宽范围的识别词汇表,单词错误率在7%以下。这些应用的单词错误率相当低。如果能够较好地确定识别任务,并引入恰当的任务语法(它们会对识别出的孤立词序列进行额外的限制),识别性能将进一步提高。我们即将在后面看到几个例子。
在适用连接词识别方式的任务里,例如连接数字串,如果已经知道数字串的长度,SD和SI两种识别方式的单词错误率都在0.1%-0.2%。这样高的识别精度,使得个人身份证号码、电话号码、信用卡号码和分类代码的识别成为可行,如果能够在语音识别的这些应用中再考虑相应的语法,识别结果会更加可靠。
最后一个例子是海洋资源管理任务。这个任务以连续语音识别的方式工作,系统词汇表有991个单词,识别的困惑度(表示单词的平均分支因子)是60。在非特定人的工作模式下,单词错误率是4%,句子的错误率是20%。因此在实际运用中,这个任务利用语音识别来做是不合适的。
表5-1中所有性能评分都是在实验室条件下得到的。而在实际应用中,由于说话人的口音、环境有噪声、说话人言语习惯(包括犹豫、加了“啊”、“嗯”,以及其它变化)等因素的影响,单词错误率会增加2-5倍。幸运的是,基于特定任务的一些限制又会使单词错误率减少了2-10倍。因而,表5-1中所引用的单词错误率经常符合识别系统在实际环境中工作时测试到的性能值。