Liquid AI 发布 LFM2.5模型

AI资讯 2个月前 硕雀
48 0

Liquid AI LFM2.5 模型是该公司在其原有 LFM2 系列基础上推出的“新一代小型基础模型家族”,旨在进一步提升边缘设备上的推理效率和任务复杂度处理能力。

以下是基于最新公开资料的详细介绍:

1. 核心定位与发布背景

  • 发布时间:2026 年 1 月。
  • 定位:LFM2.5 代表了 LFM 系列的“中间升级版”。它在 LFM2 的基础上进行了架构优化和规模扩展,特别针对 CPUNPU神经网络处理单元)协同计算进行了改进,旨在解决边缘设备(如手机、智能穿戴)上复杂任务的延迟问题。

2. 架构与技术创新

  • 混合计算模式:延续了 Liquid AI 的一贯思路,强调CPU 与 NPU 的协同优化。通过改进内存管理机制(Memory Management),显著提升了模型在资源受限环境下的推理效率。
  • 强化学习微调:在指令微调(Instruction Fine-tuning)阶段,LFM2.5 采用了多阶段强化学习框架,特别强化了模型在指令理解、工具调用、数学运算及知识推理等关键能力,确保模型能够在复杂任务中保持高可靠性。

3. 规模与能力参数

  • 模型参数:基础模型的参数规模扩展至 12 亿(1.2B),这在小型模型中属于较高容量,能够支持更丰富的语言理解和生成能力。
  • 训练数据预训练数据量大幅提升,从之前的 10 万亿 tokens 增至 28 万亿 tokens,构建了更庞大的知识储备。
  • 主要型号:文本处理领域的主力模型为 LFM2.5-1.2B-Instruct,主打通用型指令执行和对话能力。

4. 性能表现(Benchmark

LFM2.5 在发布后通过多项基准测试验证了其竞争力:

  • 知识问答:在 GPQA 知识问答基准测试中取得 38.89 分。
  • 综合评估:在 MMLU Pro 综合评估中达到 44.35 分。
  • 领先优势:这两项指标均领先于同等规模的开源模型,如 Llama-3.2-1B 和 Gemma-3-1B,显示出 Liquid AI 在小模型效率方面的优势。

5. 多模态能力(LFM2.5-VL)

LFM2.5 还推出了视觉语言模型变体:

  • 模型规格:包括 LFM2.5-VL-1.6B 等型号。
  • 深度优化:集成了专用视觉处理模块,针对文档解析、界面识别及多图推理等场景进行了深度优化,适用于需要理解视觉内容的边缘设备应用。

6. 应用场景

  • 边缘智能设备:适用于智能手机、智能穿戴等需要快速响应的设备。
  • 工具调用与复杂指令:在边缘端实现复杂的任务调度和工具调用,减少对云端的依赖。
  • 多语言处理:推出了 LFM2.5-1.2B-JP 版本,针对日语市场进行了特殊优化,支持日语学科测试和交互评估。

总结:LFM2.5 是 Liquid AI 在边缘 AI 领域的又一力作,通过增加模型规模、优化算力协同以及强化指令微调,旨在让资源受限的终端设备拥有更强大的“思考”能力。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!