心流AI助手 · 英伟达发布拟人化AI桌面助手R2X

心流知识库上线啦！点击这里体验吧～ 🌹

搜索

阅读

知识库

发现

历史

插件

APP



摘要

英伟达在2025年CES展上发布桌面AI虚拟助手R2X原型，支持GPT-4o或Grok等大语言模型，可通过文字和语音交互，具备屏幕查看和文件处理功能。该产品使用RTX神经面部算法和Audio2Face™-3D模型实现虚拟形象渲染，但目前存在面部表情僵硬、指令错误等技术局限。英伟达计划在2025年上半年开源这些虚拟形象，期望打造新型AI助手用户界面。

总结知识点

1. R2X虚拟助手支持文字和语音交互，可搭配OpenAI的GPT-4o或xAI的Grok等主流大语言模型使用，具备上传文件处理和实时查看屏幕或摄像头内容的功能。

2. R2X在演示中出现面部表情停留在奇怪位置、语气咄咄逼人等"恐怖谷"现象，且在使用GPT-4o模型时出现过错误指令和无法查看屏幕的问题。

3. 英伟达使用RTX神经面部算法生成虚拟形象，面部、嘴唇和舌头动作由Audio2Face™-3D模型自动化完成，未来计划使R2X能够加入微软Teams会议并在桌面执行操作。

4. 英伟达计划在2025年上半年开源这些虚拟形象，允许开发者构建新的用户界面，支持用户接入不同AI软件产品并实现本地运行。

全文内容

英伟达发布拟人化AI桌面助手R2X英伟达发布拟人化AI桌面助手R2X
产品概述
英伟达（Nvidia）在2025年消费电子展（CES）上发布了一款创新型桌面AI助手R2X原型。这款助手采用类似游戏角色的视觉形象，能够协助用户进行电脑应用程序操作。
核心技术与功能
R2X采用英伟达自主研发的AI模型进行渲染和动画制作，可与OpenAI的GPT-4o或xAI的Grok等主流大语言模型集成。用户可通过文字、语音进行交互，支持文件处理功能，还可启用实时屏幕监控和摄像头访问功能。
系统支持持续屏幕截图分析功能，该功能默认处于关闭状态。启用后，R2X可对运行中的应用程序提供实时反馈，特别适用于复杂编程任务的辅助。
技术挑战
在TechCrunch的演示中暴露出多个技术问题：
●面部表情呈现"恐怖谷"效果，偶现异常停滞
●语音交互时语气偶有不自然
●屏幕内容识别功能不稳定
●指令准确性有待提升
实际应用演示
在Adobe Photoshop操作演示中，R2X展示了协助使用生成式填充功能的能力。测试中使用了一张英伟达CEO黄仁勋与餐厅员工的合影。虽然最初使用GPT-4o模型时出现了指令错误，但切换到Grok模型后性能得到改善。
https://pic.twitter.com/CDLjbduBEw
系统还展示了文档处理能力，能够读取PDF文件并回答相关问题，这得益于本地检索增强生成技术的支持。
https://pic.twitter.com/LtFCGGbHXt
技术实现细节
R2X的视觉呈现依托于：
●RTX神经面部算法：负责虚拟形象生成
●Audio2Face™-3D模型：控制面部、嘴唇和舌头动作
未来发展规划
英伟达计划在2025年上半年开源R2X虚拟形象系统，并正在开发更多功能：
●支持接入Microsoft Teams会议
●开发桌面操作的主动能力
●提供开发者API接口
●支持本地部署运行
目前，R2X的声音生成机制尚未公开，使用GPT-4o时的声音独特性引发关注，而Grok模型目前尚未支持语音功能。
powered by 钉钉文档 仓颉

AI拟人化是否真的能提升人机交互体验？

如何平衡AI助手的功能性与隐私保护？

R2X会成为未来桌面交互的新范式吗？



150****6836

这个真有这么厉害吗

6小时前 · 北京



没有更多评论

●