心流logo

苹果用合成数据改进AI模型 合成数据如何确保用户隐私安全? 差分隐私技术能否成为AI发展新方向? 如何平衡AI性能提升与数据隐私保护?

背景与目标

针对其AI产品性能表现欠佳,特别是在通知摘要等功能方面遭受批评,苹果于周一公布了改进计划。该公司将通过合成数据进行私密用户数据分析来提升AI模型性能。

技术方案

苹果采用差分隐私(Differential Privacy)技术,首先生成合成数据,随后向已选择分享设备分析数据的用户设备发送数据片段,通过比对来评估和提升模型准确性。

数据处理流程

苹果在博客中解释:"合成数据模仿用户数据的格式和重要特性,但不包含任何实际用户生成内容。为构建具代表性的合成邮件集,我们首先创建涵盖多个主题的合成消息,并为每条消息生成嵌入表示,捕获语言、主题和长度等关键维度。"

这些嵌入数据会被发送到少量已选择参与设备分析的用户设备上,通过与实际邮件样本比较,帮助苹果确定最准确的嵌入方式。

应用范围

苹果目前正在通过这一方法改进简笑表情(Genmoji)模型。未来还将扩展至图像游乐场(Image Playground)、图像魔棒(Image Wand)、回忆创建(Memories Creation)、写作工具(Writing Tools)以及视觉智能(Visual Intelligence)等功能。此外,苹果还计划通过合成数据改进电子邮件摘要功能。