谷歌(Google)于7月22日发布了Gemini 2.5 Flash-Lite的稳定版本。这是Gemini AI系列中运行速度最快、最具成本效益的模型。该模型不仅内置推理能力,还支持用户按需启用。
根据Artificial Analysis的评测,Gemini 2.5 Flash-Lite的输出速度达到471个标记/秒(tok./sec.),位居当今AI模型前列。它的性能显著超过了Gemini 2.5 Flash Reasoning(309 tok./sec.)、Grok 3 Mini Reasoning-High(202 tok./sec.)、Meta的Llama 4 Maverick(168 tok./sec.)等多个知名模型。
Gemini 2.5 Flash-Lite采用极具竞争力的定价策略。每百万输入和输出token的价格分别为0.10美元和0.40美元,显著低于市场上其他主流模型:
在Artificial Analysis智能指数评测中,Gemini 2.5 Flash-Lite获得46分,超越了OpenAI的GPT-4o(41分)。该评分体系涵盖数学、逻辑、推理和编程等七个评估领域。同系列的Gemini 2.5 Flash和Gemini 2.5 Pro分别获得65分和70分,而目前最高分由xAI的Grok 4(73分)和OpenAI的o3-pro(71分)保持。
Gemini 2.5 Flash-Lite现已在Google AI Studio和Vertex AI平台正式上线。该模型支持100万token的上下文窗口,并配备思维预算功能,集成了谷歌搜索、代码执行和URL上下文等原生工具。
在实际应用中,卫星数据处理平台Satlyt采用该模型后,板载诊断延迟降低45%,同时将功耗减少30%,展现出显著的性能优势。