法国人工智能初创公司Mistral AI发布了其首个专注于推理能力的语言模型Magistral(马吉斯特拉尔)。该模型通过提供透明的推理过程,增强了多语言环境下的问题解决能力。
Magistral推出了两个版本:开源的Magistral Small(24B参数)和企业级的Magistral Medium。这两个版本专门针对需要逐步推理的任务进行优化,相比早期模型在多语言推理和跨学科逻辑追踪方面有显著提升。此次发布紧随其新企业级文档AI(Document AI)平台,该平台在基于OCR的文档处理方面实现了速度和准确性的突破。
在2024年AIME基准测试中:
两个版本均针对法律研究、金融建模、软件工程以及医疗保健和政府等监管行业进行了优化。
Magistral经过多步逻辑推理的优化,提供了可解释的推理过程,支持英语、法语、阿拉伯语、德语、中文等多种语言。该模型已集成到Mistral的Le Chat助手中,新增的"Flash Answers"(闪电回答)模式响应速度比竞品快10倍。
Magistral Medium目前已在La Plateforme和亚马逊SageMaker(亚马逊智能云)平台上线,即将支持IBM WatsonX、Azure AI(微软智能云)和Google Cloud(谷歌云)。Mistral已在Hugging Face平台以Apache 2.0许可开源了Magistral Small版本,并公开了相关研究论文,详细说明了模型训练、基础设施和评估方法。公司计划持续迭代优化架构,鼓励开发者社区参与建设。