Devstral 是由 Mistral AI 和 All Hands AI 合作开发的一款用于软件工程任务的 Agentic LLM(大型语言模型)。 它被设计为擅长代码库探索、多文件编辑,并能为软件工程代理提供强大支持. Devstral 在 SWE-Bench Verified 基准测试中取得了显著的性能,成为该基准测试中排名第一的开源模型. 它是在 Mistral-Small-3.1 的基础上进行微调的,因此具有高达 128k tokens 的长上下文窗口. Devstral 是一个纯文本的编码代理,在从 Mistral-Small-3.1 微调之前,移除了视觉编码器。
Devstral 最新消息
- Mistral AI 于 2025 年 5 月 21 日发布了 Devstral。
- Devstral 在 SWE-Bench Verified 基准测试中取得了 46.8% 的分数,超过了之前最先进的开源模型 6% 以上.
- Devstral 的性能明显优于一些闭源替代品,例如,超过了最近的 GPT-4.1-mini 20% 以上。
- Mistral AI 正在努力构建一个更大的 Agentic 编码模型,预计将在未来几周内发布。
Devstral 概述
Devstral 是一种 Agentic LLM(大型语言模型),专门为软件工程任务而设计. 它旨在解决实际软件开发中遇到的问题,例如在大型代码库中理解代码上下文、识别不同组件之间的关系以及发现复杂函数中的细微错误. Devstral 通过使用工具来探索代码库、编辑多个文件以及支持软件工程代理来解决这些问题。
Devstral 历史
- Devstral 是 Mistral AI 和 All Hands AI 合作的成果。
- 它是在 Mistral-Small-3.1 的基础上进行微调的。
- Devstral 于 2025 年 5 月 21 日发布,并采用 Apache 2.0 开源许可证。
Devstral 版本
截至目前,只有一个版本的 Devstral,即 Devstral-Small-2505. 这是一个 24B 参数的模型,基于 Mistral-Small-3.1 进行微调. Mistral AI 计划在未来几周内发布一个更大、功能更强大的 Devstral 版本。
Devstral 主要特征
- Agentic 编码: Devstral 专为 Agentic 编码任务而设计,使其成为软件工程代理的理想选择。
- 轻量级: Devstral 只有 240 亿个参数,可以在单个 RTX 4090 或配备 32GB RAM 的 Mac 上运行,适合本地部署和设备端使用。
- Apache 2.0 许可证: 采用 Apache 2.0 开源许可证,允许用于商业和非商业目的。
- 上下文窗口: Devstral 支持 128k tokens 的上下文窗口。
- 分词器: 使用 Tekken 分词器,词汇量为 131k。
Devstral 官方网站
其他资源
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
暂无评论内容