心流logo

米斯特拉尔发布新AI编程模型Devstral AI编程模型如何改变软件开发效率? 开源AI模型与闭源模型各有何优势? 本地部署AI模型将带来哪些应用场景?

模型发布与特点

法国人工智能初创公司米斯特拉尔(Mistral)于周三发布开源模型Devstral。该模型由Mistral与开源软件开发代理公司全手智能(All Hands AI)合作开发。

性能表现

在评估AI模型解决真实软件问题能力的SWE-Bench Verified基准测试中,Devstral获得46.8%的得分,超越了OpenAI的GPT-4.1 Mini和Claude 3.5 Haiku等开源AI模型。Mistral表示,该模型专门针对解决真实GitHub问题进行训练,克服了传统大语言模型的局限。虽然传统模型在代码补全等基础任务表现优异,但在处理实际工程问题时表现欠佳。

部署与可用性

Mistral表示:"Devstral具备轻量级特性,可在单个RTX 4090显卡或32GB内存的Mac上运行,非常适合本地部署和设备端使用。"即日起,用户可在HuggingFace、Ollama、Kaggle、Unsloth和LM Studio等平台下载该模型。

战略合作进展

Mistral近期与阿布扎比科技集团G42建立战略合作关系,共同开发下一代AI平台和基础设施。合作范围涵盖AI模型训练、代理开发到行业应用,覆盖欧洲、中东和全球南方地区。此外,Mistral将与世界首个AI大学——穆罕默德·本·扎耶德人工智能大学(MBZUAI)在基础模型研究、人才培养等方面展开合作。

其他产品进展

几周前,Mistral推出了Mistral Medium 3模型,在成本效益方面表现突出,基准测试成绩超越Meta的Llama 4 Maverick。该模型专为企业部署设计,在编程、STEM和多模态任务方面表现优异,达到Claude Sonnet 3.7超过90%的基准测试得分,但价格更具优势——输入每百万token仅需0.40美元,输出2美元。