GitHub 推出 Copilot-SWE 实验模型:专为代码编辑与重构优化

GitHub Copilot‑SWE 实验模型概览

维度 关键内容 参考
定位 作为 Copilot 系列的最新实验模型,专注于 软件工程(SWE)任务——代码编辑、跨文件重构、自动错误修复等,旨把 Copilot 从“代码补全助手”提升为能够 自主完成完整开发任务 的智能体
核心名称 项目代号 Project Padawan,对外宣传为 SWE Agent(或 Copilot‑SWE),是 GitHub 首个面向全流程软件工程的 AI 代理。
技术架构 - 基于大规模代码语言模型(内部使用 GPT‑4o mini 或同等规模的自研模型),在 275k+ 开源仓库上进行 额外微调,强化多文件上下文理解。
- 采用 两阶段流水线:① 代码检索(定位相关文件/函数),② 代码编辑(生成补丁、重构指令)。该设计与开源的 SWE‑Fixer 流程相似,能够在 两次模型调用 内完成一次编辑任务。
训练数据 - 采集自 SWE‑benchSWE‑bench LiteSWE‑bench Verified 等真实 GitHub Issue‑PR 对,约 300‑700 条高质量实例,用于 多文件错误修复、功能实现、重构
- 通过 JsonTuning 与 Chain‑of‑Thought 数据增强,提升模型对任务结构的理解。
主要功能 1. Copilot Edits:在 VS Code、Visual Studio 中提供 多文件编辑界面,开发者用自然语言描述要修改的文件范围,模型一次性生成跨文件的统一补丁。
2. 自主错误修复:模型能够自行检测运行时错误、单元测试失败,并生成对应的修复 PR。
3. 代码重构与优化:支持函数抽取、命名统一、依赖整理等结构化重构任务。
4. Agent Mode:在聊天对话中进入 代理模式,模型可主动执行命令、提交 PR、邀请审阅者,完成从 问题定位 → 代码生成 → PR 合并 的闭环。
性能表现 在公开的 SWE‑bench 基准上,Copilot‑SWE(实验版)已超过传统 Copilot(基于 Codex)约 10%‑15% 的成功率,尤其在 多文件修复 场景中提升显著。
使用方式 - 通过 Copilot Edits 插件IDE 中开启;
- 在 Copilot Chat 中输入 “/agent on” 进入 Agent 模式;
- 目前为 预览版,仅对 GitHub Copilot Enterprise 客户及部分邀请用户开放,计划在 2025 下半年向所有付费用户全量发布。
安全与可控 - 所有生成的代码在提交前会经过 自动单元测试 与 安全审查(如依赖漏洞扫描),确保不会直接引入已知安全风险。
- 开发者仍保留 审阅、接受或拒绝 的完整控制权。
未来路线 - 持续扩展 多语言支持(已覆盖 30+ 主流语言),计划加入 Rust、Go、Kotlin 等新语言。
- 将 SWE‑Agent 与 GitHub Actions 深度集成,实现“一键 CI/CD 自动化”。
- 进一步提升 上下文窗口(目标 128k token),以更好处理大型代码库。

小结

GitHub Copilot‑SWE(Project Padawan)是 GitHub 在 2025 年推出的 实验性 AI 代理,专为 代码编辑、跨文件重构与自动错误修复 设计。它在底层采用经过大规模代码微调的 LLM,结合检索‑编辑双阶段流水线,并通过 Copilot Edits 与 Agent Mode 为开发者提供从 需求描述 → 自动生成 PR → 完整审阅 的闭环体验。当前已在 SWE‑bench 基准上展示出显著的性能提升,正在向更广泛的企业用户逐步开放,预计在 2025 年下半年实现全量发布。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!