2026年3月24日,国家数据局局长刘烈宏在中国发展高层论坛及国务院新闻办发布会上正式宣布,Token的中文名正式确定为“词元”。这一决定标志着人工智能核心计量单位在中文语境下的标准化,结束了此前学术界与产业界关于“智元”、“模元”等译名的争议。
以下是关于此定调的详细介绍:
1. 官方定调的背景与宣布
- 发布时机:在中国发展高层论坛2026年年会上,国家数据局局长刘烈宏明确指出,这一命名不仅是语言层面的翻译,更是对Token本质的定位。
- 官方确认:此消息经过中国政府网转发人民日报援引,属于官方媒体与政府机构双重发布,具有权威性。
2. “词元”这一名称的含义与内涵
- 技术层面:Token是大模型(如GPT-4)处理信息的最小计量单位。它可以是一个完整的单词(如“apple”)、一个词根或一个词缀。称之为“词元”,强调了它在自然语言处理中的基础性作用。
- 经济层面:国家数据局局长刘烈宏将Token定义为智能时代的“可计量、可定价、可交易”的结算单位,类似于“克”之于黄金或“美元”之于外汇,具有重要的价值锚定作用。
3. 数据与产业影响
- 调用量数据:官方公布的数据显示,中国的AI Token(词元)调用量正呈爆炸式增长。截至2026年3月,中国日均词元调用量突破140万亿,较2024年初的1000亿增长了1000多倍,较2025年底增长了40%以上。
- 产业意义:这一增长表明中国人工智能产业的活跃度和应用渗透率极高。从对话到决策执行,中国AI模型被广泛使用,推动了产业竞争力的显著增强。
4. 与其他译名的区分
- 与“智元”对比:此前“智元”是学术界和行业内部的主流建议,强调其承载“智识”的本质。但官方最终选择了“词元”,更侧重于其作为语言基本单位的属性。
- 与“模元”对比:在此之前,腾讯研究院学者提出过“模元”作为译名,但最终未被采用。
5. 政策与未来规划
- 数据集建设:刘烈宏指出,未来国家数据局将推进高质量数据集建设行动计划,打造技术可行、实用便捷、质量保障的高质量数据集,进一步提升数据供给的量质。
综上所述,“词元”不仅是一个语言学术语,更被官方赋予了宏观经济与技术管理的意义。它标志着我国在人工智能产业链的计量、监管和商业化进程中的标准化迈出了关键一步。
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!