Mistral AI(Mistral人工智能)发布了新一代人工智能模型,致力于实现不同语言使用者之间的无缝对话。该公司推出两款语音转文本模型:Voxtral Mini Transcribe V2(沃克斯特迷你转录V2)和Voxtral Realtime(沃克斯特实时版)。前者专注于批量音频转录,后者实现近乎实时的转录,延迟仅为200毫秒,两款模型均支持13种语言互译。其中,Voxtral Realtime采用开源许可证免费提供。
这些模型规模为40亿参数,能够在手机或笔记本电脑上本地运行,实现了语音转文本领域的重要突破。本地部署意味着用户的私人对话无需上传云端处理。据Mistral AI表示,新模型在运行成本和准确率方面都优于竞品。
Mistral AI的科学运营副总裁(VP of Science Operations)皮埃尔·斯托克在接受《连线》(WIRED)采访时表示,公司正在构建无缝翻译系统,预计2026年可解决跨语言交流障碍。目前,主要竞争对手谷歌(Google)的最新翻译模型延迟为2秒。
作为由Meta和谷歌DeepMind(Google DeepMind)前员工于2023年创立的公司,Mistral AI通过创新的模型设计和精细的数据集优化来弥补资金和算力的不足。他们注重每个开发环节的效率提升,而非依赖大规模算力资源。
在美欧关系趋于复杂的背景下,Mistral AI强化其欧洲身份优势。IT咨询公司PAC首席分析师丹·比勒指出,欧洲企业和政府正在重新评估对美国科技公司的依赖程度。
Mistral AI将自身定位为欧洲本土的、多语言的、开源的可靠选择。D'Ornano + Co创始人拉斐尔·多尔纳诺认为,Mistral AI的战略是在美国主导的市场中寻找差异化发展路径,着力打造符合欧盟监管要求的主权替代方案。
虽然与美国科技巨头在模型整体性能上仍有差距,但随着企业关注AI投资回报和地缘政治因素,专注于特定行业和区域需求的小型模型将获得更大发展空间。