2025年Google I/O开发者大会于5月20日至21日举行,重点展示了谷歌在人工智能(AI)、Android扩展现实(XR)、搜索以及开发者工具等领域的最新进展。以下是本次大会值得关注的关键信息:
1. 人工智能(AI)领域的重大进展
Gemini 2.5 Pro
- 性能提升:Gemini 2.5 Pro是谷歌目前最强大的通用AI模型,其在语言、推理、代码等方面表现优异,尤其在WebDev Arena和LMArena排行榜中名列前茅。
- Deep Think模式:新增的Deep Think模式进一步提升了模型的推理能力,尤其在复杂数学和编程任务中表现突出。
- 应用场景:Gemini 2.5 Pro已集成到多个产品中,包括Gemini应用、Android Studio的Journeys功能等。
Gemini 2.5 Flash
- 高效性:专为速度和低成本设计,2.5 Flash在推理、多模态、代码和长上下文等关键基准上都得到了改进,同时使用的token减少了20-30%。
- 应用场景:2.5 Flash已在Google AI Studio、Vertex AI和Gemini app中提供预览。
Gemini Live
- 功能扩展:Gemini Live现已在Android和iOS平台推出,支持摄像头和屏幕共享功能,用户可以通过语音与Gemini进行更自然的交互。
- 集成能力:Gemini Live将集成地图、日历、任务等应用,用户只需在聊天中提出请求,便可调用相关应用。
Gemini Nano
- 设备端任务:Gemini Nano用于执行常见的设备端任务,具有增强的隐私性、更低的延迟和成本。
- Gemma 3n:Gemma 3n模型可在低至2GB RAM的设备上运行,为下一代Gemini Nano提供支持。
AI模式(AI Mode)
- 搜索体验:AI Mode是谷歌最强大的AI搜索功能,能够通过后续问题和实用的网络链接进行更深入的分析。
- 购物体验:AI Mode还带来了全新的购物体验,包括价格跟踪和虚拟试穿工具。
Project Astra
- 多模态能力:Project Astra展示了近乎实时的多模态AI能力,能够通过摄像头识别物体、回答相关问题,甚至提供实时翻译。
- 硬件合作:谷歌与三星和Warby Parker合作开发Project Astra眼镜,但尚未确定发布日期。
2. 视觉生成工具的更新
Veo 3
- 视频生成:Veo 3能够生成音效、背景噪音甚至对话来配合其创建的视频,质量比其前身Veo 2有所提升。
- 应用场景:订阅谷歌每月249.99美元AI Ultra计划的用户可在Gemini聊天机器人应用中使用Veo 3。
Imagen 4
- 图像生成:Imagen 4的速度比上一代快10倍,能够渲染织物、水滴和动物皮毛等“精细细节”,支持多种纵横比和最高2K分辨率。
- 应用场景:Veo 3和Imagen 4都将用于支持Flow——谷歌面向电影制作的AI视频工具。
3. Android和硬件创新
Android XR
- 智能眼镜:谷歌首次现场演示了Android XR眼镜,展示了其实时语言翻译等功能。
- 合作伙伴:谷歌与Gentle Monster和Warby Parker合作,共同打造搭载Android XR系统的时尚眼镜。
Android 16
- 个性化表达:Android 16在个性化表达、设备互联(电视、手表、汽车等)以及安全与隐私方面进行了更新。
- 新功能:包括垃圾信息检测和新的位置共享工具。
Wear OS 6
- 设计改进:Wear OS 6为磁贴引入了统一字体,使应用外观更简洁,Pixel手表将支持动态主题。
4. 开发者工具和福利
Android Studio
- AI功能:Android Studio将集成新的人工智能功能,包括与Gemini 2.5 Pro模型同步推出的“Journeys”(一种“代理人工智能”功能)。
- 崩溃洞察:新增的“崩溃洞察”功能由Gemini驱动,将分析应用源代码以识别崩溃的潜在原因并提出修复建议。
Jules
- 代码修复:Jules是一款旨在帮助开发者修复代码错误的人工智能代理,可帮助开发者理解复杂代码、在GitHub上创建拉取请求,并处理某些待办事项和编程任务。
Project Mariner
- 任务处理:Project Mariner是谷歌的实验性人工智能代理,可浏览和使用网站,允许代理一次处理近十二项任务。
开发者福利
- AI福利:谷歌开发者计划扩展了AI福利,包括Gemini Code Assist Standard、新的GenAI开发者年度积分以及三个月的Google One AI Premium。
5. 其他重要发布
Google Beam
- 3D视频会议:Google Beam结合了软件和硬件(包括六摄像头阵列和定制光场显示器),使用户能够与他人交谈,仿佛对方就在同一间会议室里。
- 实时翻译:Google Beam具备“近乎完美”的毫米级头部跟踪和60帧/秒的视频流,与Google Meet配合使用时,提供人工智能驱动的实时语音翻译功能。
Chrome与Web开发
- 内置AI API:Chrome 138稳定版将内置基于Gemini Nano的新AI API,包括Summarizer API、Language Detector API、Translator API和Prompt API for Chrome Extensions。
- CSS和HTML改进:Chrome 135引入了新的CSS原语,使构建轮播图和其他屏幕外UI变得更容易。
6. 订阅服务
Google AI Pro和Google AI Ultra
- Google AI Pro:每月19.99美元,包含之前Gemini Advanced套餐的内容,还包括Flow、NotebookLM等产品。
- Google AI Ultra:每月249.99美元,提供对谷歌AI应用和服务的“最高级别访问”,包括Veo 3视频生成器、Flow视频编辑应用等。
总结
2025年Google I/O开发者大会展示了谷歌在AI、Android、硬件和开发者工具等领域的全面进展。从强大的基础模型到创新的应用工具,再到前沿的硬件探索,谷歌正在加速将前瞻性研究转化为实际产品,致力于通过更智能、更自然的人机交互方式重塑用户体验和开发者生态。