什么是词错误率（WER）

AI解读 1年前 (2024) 硕雀

450 0 0

词错误率（Word Error Rate，简称 WER）‍是评估语音识别、机器翻译、光学字符识别等序列输出系统准确性的一种常用指标。它通过比较系统输出（假设文本）与人工标注的参考文本（真值）之间的差异，量化错误的比例。

WER 实际上是 编辑距离（Levenshtein distance）‍ 在词层面的表现形式。

参考文本（Reference）	系统输出（Hypothesis）	错误类型	计数
“今天天气很好”	“今天天气好”	删除 (D)	1
“我喜欢听音乐”	“我喜欢听歌曲”	替换 (S)	1
“他去了北京”	“他去了北京了”	插入 (I)	1

优点	缺点
直观、易于解释；能够捕捉插入、删除、替换三类错误。	对长句子或结构变化敏感；不考虑词序的语义重要性；对同义词替换不作惩罚，可能导致“过高”错误率。

词错误率（WER）是通过 插入、删除、替换 三类编辑操作相对于参考词数的比例来衡量系统输出质量的指标。它在语音识别等序列生成任务中被广泛采用，能够提供一个直观的错误比例，但也需要结合其他评估手段（如语义相似度、BLEU、CER）来获得更全面的性能评估。

声明：文章均为AI生成，请谨慎辨别信息的真伪和可靠性！