新AI助手IronCurtain：安全可控不失控

像OpenClaw等AI助手因能够管理用户数字生活而迅速走红。这些AI助手可以提供个性化新闻摘要、处理客服沟通、管理待办事项等服务。然而，在带来便利的同时也引发了严重问题，包括错误删除重要邮件、发布不当言论，甚至对用户发起网络钓鱼攻击。

资深安全工程师和研究员尼尔斯·普罗沃斯（Niels Provos）推出了开源安全AI助手IronCurtain。该系统采用创新设计，将AI助手置于隔离的虚拟机中运行，所有操作都需遵循用户制定的安全策略。系统能够将用户用自然语言描述的规则，通过大语言模型（LLM）转换为可执行的安全策略。

IronCurtain采用简明的策略制定方式。例如，用户可以设定："该助手可以阅读所有邮件；可以直接给联系人发送邮件；与非联系人通信需要审批；禁止永久删除任何内容。"系统通过在虚拟机中的助手与模型上下文协议服务器之间建立调解机制，实现了有效的访问控制。

IronCurtain具备自我完善机制，能够根据实际使用场景不断优化用户制定的规则体系。系统可以与任何大语言模型配合使用，并保持完整的策略决策审计记录。著名网络安全研究员迪诺·戴·佐维（Dino Dai Zovi）认为，相比传统的权限确认机制，IronCurtain的约束方式更加可靠。

戴·佐维指出，严格的安全约束实际上是实现AI更大自主性的基础。他通过类比说明："要实现更高速度和自主性，必须有相应的支撑结构。就像火箭发动机必须安装在专业火箭结构中才能安全运行，而不是简单地背在背上。"