Ads

Devstral – Mistral 开源模型

Devstral – Mistral 开源模型

Devstral 是由 Mistral AI 和 All Hands AI 合作开发的一款用于软件工程任务的 Agentic LLM(大型语言模型)。 它被设计为擅长代码库探索、多文件编辑,并能为软件工程代理提供强大支持. Devstral 在 SWE-Bench Verified 基准测试中取得了显著的性能,成为该基准测试中排名第一的开源模型. 它是在 Mistral-Small-3.1 的基础上进行微调的,因此具有高达 128k tokens 的长上下文窗口. Devstral 是一个纯文本的编码代理,在从 Mistral-Small-3.1 微调之前,移除了视觉编码器。

Devstral 最新消息

  • Mistral AI 于 2025 年 5 月 21 日发布了 Devstral。
  • Devstral 在 SWE-Bench Verified 基准测试中取得了 46.8% 的分数,超过了之前最先进的开源模型 6% 以上.
  • Devstral 的性能明显优于一些闭源替代品,例如,超过了最近的 GPT-4.1-mini 20% 以上。
  • Mistral AI 正在努力构建一个更大的 Agentic 编码模型,预计将在未来几周内发布。

Devstral 概述

Devstral 是一种 Agentic LLM(大型语言模型),专门为软件工程任务而设计. 它旨在解决实际软件开发中遇到的问题,例如在大型代码库中理解代码上下文、识别不同组件之间的关系以及发现复杂函数中的细微错误. Devstral 通过使用工具来探索代码库、编辑多个文件以及支持软件工程代理来解决这些问题。

Devstral 历史

  • Devstral 是 Mistral AI 和 All Hands AI 合作的成果。
  • 它是在 Mistral-Small-3.1 的基础上进行微调的。
  • Devstral 于 2025 年 5 月 21 日发布,并采用 Apache 2.0 开源许可证。

Devstral 版本

截至目前,只有一个版本的 Devstral,即 Devstral-Small-2505. 这是一个 24B 参数的模型,基于 Mistral-Small-3.1 进行微调. Mistral AI 计划在未来几周内发布一个更大、功能更强大的 Devstral 版本。

Devstral 主要特征

  • Agentic 编码: Devstral 专为 Agentic 编码任务而设计,使其成为软件工程代理的理想选择。
  • 轻量级: Devstral 只有 240 亿个参数,可以在单个 RTX 4090 或配备 32GB RAM 的 Mac 上运行,适合本地部署和设备端使用。
  • Apache 2.0 许可证: 采用 Apache 2.0 开源许可证,允许用于商业和非商业目的。
  • 上下文窗口: Devstral 支持 128k tokens 的上下文窗口。
  • 分词器: 使用 Tekken 分词器,词汇量为 131k。

Devstral 官方网站

其他资源

© 版权声明
THE END
喜欢就支持一下吧
点赞5 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情

    暂无评论内容