Mistral AI推出首个多语言推理模型

产品发布

法国人工智能初创公司Mistral AI发布了其首个专注于推理能力的语言模型Magistral（马吉斯特拉尔）。该模型通过提供透明的推理过程，增强了多语言环境下的问题解决能力。

版本特点

Magistral推出了两个版本：开源的Magistral Small（24B参数）和企业级的Magistral Medium。这两个版本专门针对需要逐步推理的任务进行优化，相比早期模型在多语言推理和跨学科逻辑追踪方面有显著提升。此次发布紧随其新企业级文档AI（Document AI）平台，该平台在基于OCR的文档处理方面实现了速度和准确性的突破。

性能评估

在2024年AIME基准测试中：

Magistral Medium：64-shot提示下得分73.6%，采用多数表决机制可达90%
Magistral Small：基础得分70.7%，多数表决下达83.3%

两个版本均针对法律研究、金融建模、软件工程以及医疗保健和政府等监管行业进行了优化。

技术特点与应用

Magistral经过多步逻辑推理的优化，提供了可解释的推理过程，支持英语、法语、阿拉伯语、德语、中文等多种语言。该模型已集成到Mistral的Le Chat助手中，新增的"Flash Answers"（闪电回答）模式响应速度比竞品快10倍。

部署与开源

Magistral Medium目前已在La Plateforme和亚马逊SageMaker（亚马逊智能云）平台上线，即将支持IBM WatsonX、Azure AI（微软智能云）和Google Cloud（谷歌云）。Mistral已在Hugging Face平台以Apache 2.0许可开源了Magistral Small版本，并公开了相关研究论文，详细说明了模型训练、基础设施和评估方法。公司计划持续迭代优化架构，鼓励开发者社区参与建设。