谷歌发布最快速低成本AI新品

模型性能突破

谷歌（Google）于7月22日发布了Gemini 2.5 Flash-Lite的稳定版本。这是Gemini AI系列中运行速度最快、最具成本效益的模型。该模型不仅内置推理能力，还支持用户按需启用。

根据Artificial Analysis的评测，Gemini 2.5 Flash-Lite的输出速度达到471个标记/秒（tok./sec.），位居当今AI模型前列。它的性能显著超过了Gemini 2.5 Flash Reasoning（309 tok./sec.）、Grok 3 Mini Reasoning-High（202 tok./sec.）、Meta的Llama 4 Maverick（168 tok./sec.）等多个知名模型。

价格优势分析

Gemini 2.5 Flash-Lite采用极具竞争力的定价策略。每百万输入和输出token的价格分别为0.10美元和0.40美元，显著低于市场上其他主流模型：

Gemini 2.5 Flash：输入0.15美元，输出0.50美元
Gemini 2.5 Pro：输入2.50美元，输出10美元
OpenAI的o4-mini（high）：输入1.10美元，输出4.40美元
DeepSeek R1：输入0.55美元，输出2.19美元

综合能力评估

在Artificial Analysis智能指数评测中，Gemini 2.5 Flash-Lite获得46分，超越了OpenAI的GPT-4o（41分）。该评分体系涵盖数学、逻辑、推理和编程等七个评估领域。同系列的Gemini 2.5 Flash和Gemini 2.5 Pro分别获得65分和70分，而目前最高分由xAI的Grok 4（73分）和OpenAI的o3-pro（71分）保持。

实际应用成效

Gemini 2.5 Flash-Lite现已在Google AI Studio和Vertex AI平台正式上线。该模型支持100万token的上下文窗口，并配备思维预算功能，集成了谷歌搜索、代码执行和URL上下文等原生工具。

在实际应用中，卫星数据处理平台Satlyt采用该模型后，板载诊断延迟降低45%，同时将功耗减少30%，展现出显著的性能优势。