1. 定义
字符级准确率(Character Accuracy Rate,简称 CAR)是衡量文本识别系统在单个字符层面上正确率的指标。它表示系统正确识别的字符数占参考文本总字符数的比例,取值范围 0 %–100 %。在实际计算中,常通过 Levenshtein 编辑距离(即插入、删除、替换的最小操作数)来得到错误字符数,再求出正确字符数,从而得到 CAR。
2. 计算公式
常见的两种等价写法:

其中“错误字符数”包括插入、删除和替换的字符。如果已知字符错误率(CER),则
CAR = 1 - CER
3. 适用场景
- 光学字符识别(OCR):评估扫描文档、车牌、手写文字等的识别质量。
- 语音转文字(ASR):在语音识别系统中,用于衡量转写的字符层面准确度。
- 手写文字识别:如阿拉伯手写、英文手写等任务中常用 CAR 与词级准确率(WAR)共同评估模型表现。
- 机器翻译/文本生成:有时也会把字符级准确率作为细粒度评估指标。
4. 与其他指标的关系
- 词级准确率(WAR):统计完整词(或句)是否全部正确,适合对整体语义完整性要求高的场景。
- 字符错误率(CER):CAR 的补数,二者互为 1‑CER = CAR。
- 正确接受率(CAR) 在信息检索或机器翻译中有时指 “Correct Acceptance Rate”,概念不同,需要结合上下文辨别。
5. 示例

6. 小结
字符级准确率(CAR)是衡量文本识别系统在最细粒度(单字符)上的正确率的核心指标,计算简单、直观,广泛用于 OCR、ASR、手写识别等领域。通过编辑距离或直接计数即可得到,常与词级准确率、字符错误率等指标配合使用,以全面评估模型性能。
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!