Dear user, we place great importance on your browsing experience. However, we regret to inform you that the current version of your browser might not fully support all functions and design features of our website. To ensure a faster, safer, and more enhanced online experience, we strongly recommend upgrading to the latest version of your browser or trying alternatives such as Chrome or Edge

尊敬的用户,我们非常重视您的浏览体验,但遗憾地通知您,当前您使用的浏览器版本可能无法完全支持我们网站的所有功能和设计效果。为了确保您能够享受到更快捷、更安全、及更加丰富的网络体验,我们强烈建议您升级到最新版本的浏览器或者尝试包括但不限于 Chrome Edge

Or, scan the QR code below to experience our app.

或者扫描下面的二维码尝试我们的 App。

XinLiu App

分享

英伟达发布拟人化AI桌面助手R2X

摘要
英伟达在2025年CES展上发布桌面AI虚拟助手R2X原型,支持GPT-4o或Grok等大语言模型,可通过文字和语音交互,具备屏幕查看和文件处理功能。该产品使用RTX神经面部算法和Audio2Face™-3D模型实现虚拟形象渲染,但目前存在面部表情僵硬、指令错误等技术局限。英伟达计划在2025年上半年开源这些虚拟形象,期望打造新型AI助手用户界面。
总结知识点

1. R2X虚拟助手支持文字和语音交互,可搭配OpenAI的GPT-4o或xAI的Grok等主流大语言模型使用,具备上传文件处理和实时查看屏幕或摄像头内容的功能。

2. R2X在演示中出现面部表情停留在奇怪位置、语气咄咄逼人等"恐怖谷"现象,且在使用GPT-4o模型时出现过错误指令和无法查看屏幕的问题。

3. 英伟达使用RTX神经面部算法生成虚拟形象,面部、嘴唇和舌头动作由Audio2Face™-3D模型自动化完成,未来计划使R2X能够加入微软Teams会议并在桌面执行操作。

4. 英伟达计划在2025年上半年开源这些虚拟形象,允许开发者构建新的用户界面,支持用户接入不同AI软件产品并实现本地运行。

全文内容

产品概述

英伟达(Nvidia)在2025年消费电子展(CES)上发布了一款创新型桌面AI助手R2X原型。这款助手采用类似游戏角色的视觉形象,能够协助用户进行电脑应用程序操作。

核心技术与功能

R2X采用英伟达自主研发的AI模型进行渲染和动画制作,可与OpenAI的GPT-4o或xAI的Grok等主流大语言模型集成。用户可通过文字、语音进行交互,支持文件处理功能,还可启用实时屏幕监控和摄像头访问功能。
系统支持持续屏幕截图分析功能,该功能默认处于关闭状态。启用后,R2X可对运行中的应用程序提供实时反馈,特别适用于复杂编程任务的辅助。

技术挑战

在TechCrunch的演示中暴露出多个技术问题:
面部表情呈现"恐怖谷"效果,偶现异常停滞
语音交互时语气偶有不自然
屏幕内容识别功能不稳定
指令准确性有待提升

实际应用演示

在Adobe Photoshop操作演示中,R2X展示了协助使用生成式填充功能的能力。测试中使用了一张英伟达CEO黄仁勋与餐厅员工的合影。虽然最初使用GPT-4o模型时出现了指令错误,但切换到Grok模型后性能得到改善。
系统还展示了文档处理能力,能够读取PDF文件并回答相关问题,这得益于本地检索增强生成技术的支持。

技术实现细节

R2X的视觉呈现依托于:
RTX神经面部算法:负责虚拟形象生成
Audio2Face™-3D模型:控制面部、嘴唇和舌头动作

未来发展规划

英伟达计划在2025年上半年开源R2X虚拟形象系统,并正在开发更多功能:
支持接入Microsoft Teams会议
开发桌面操作的主动能力
提供开发者API接口
支持本地部署运行
目前,R2X的声音生成机制尚未公开,使用GPT-4o时的声音独特性引发关注,而Grok模型目前尚未支持语音功能。
AI拟人化是否真的能提升人机交互体验?
如何平衡AI助手的功能性与隐私保护?
R2X会成为未来桌面交互的新范式吗?
评论(1)
150****6836
这个真有这么厉害吗
6小时前 · 北京
回复
0