心流logo

Grok升级视觉功能:可实时识别场景物体

视觉功能升级

xAI(xAI)的Grok(Grok)聊天机器人现已具备回答智能手机摄像头所见内容的能力,这一功能与谷歌Gemini(Gemini)和ChatGPT(ChatGPT)的实时视觉功能类似。

4月20号,xAI正式发布Grok Vision(Grok Vision)功能,用户可以将手机对准产品、标识和文档等物体并进行相关提问。目前,该功能仅在iOS版Grok应用程序中可用,Android版本暂未支持。

https://t.co/cmtINP8yp6

多语言与搜索升级

除视觉功能外,Grok还同步推出语音模式中的多语言音频和实时搜索功能。Android版本用户可通过订阅每月30美元的SuperGrok(SuperGrok)计划使用这些新功能。

https://t.co/lcaSyty2n5

功能持续优化

在4月初,xAI为Grok增添了"记忆"组件,使其能够调用历史对话信息。同时,Grok还获得了一个类似画布的工具,支持创建文档和应用程序。