ChatGPT新增锁定模式,以缓解提示注入和数据泄露攻击

发布时间:2026/6/7 20:54:49

ChatGPT新增锁定模式,以缓解提示注入和数据泄露攻击 OpenAI最近给ChatGPT装上了一道新保险。这道名为锁定模式的安全机制已经开始向个人用户、自助式企业版以及托管工作区推送。它的核心目标很明确掐断提示注入攻击里最关键的一环——防止敏感数据通过出站网络请求外泄。说起提示注入攻击这大概是当前AI安全领域最让人头疼的顽疾之一。攻击者把恶意指令藏进网页缓存、PDF文档或者任何能被模型读取的内容里一旦ChatGPT处理这些材料就可能被暗中操控。锁定模式要做的不是拦截这些混进来的坏代码而是封死数据被偷偷送出去的通道。开启锁定模式之后ChatGPT的网络行为会发生明显收缩。实时网页浏览功能只能调用缓存内容搜索结果可能滞后甚至无法加载。模型也不能再在回复里拉取外部图像深度研究和代理模式这两个重度依赖网络的功能会被直接关闭。Canvas生成的代码如果涉及网络请求用户也无法点击批准。就连外部文件下载也会被切断不过手动上传的本地文件倒是不受影响。值得注意的是记忆功能、文件上传、对话共享和模型训练设置并不在锁定模式的管辖范围内。这几项可以照常独立配置互不影响。OpenAI把应用和连接器的风险做了分级梳理。对不受信任的应用进行读写操作或者对可见范围模糊的信任应用执行写入都被划入高风险区域明确不建议在锁定模式下进行。同步连接器和读取信任应用属于中等风险虽然泄露概率较低但仍可能暴露敏感源数据。只有当副作用确认仅对信任方可见时写入操作才被允许放行。对于托管工作区的企业用户来说锁定模式不会一股脑禁用所有已连接应用。管理员得手动搭建基于角色的访问控制把应用标记为受信任状态再逐个审核连接器权限这套组合拳打下来防护才算真正落地。企业管理员可以通过创建一个名为锁定模式的自定义角色把特定成员或用户组分配进去实现强制生效。合规性API日志平台是个独立的存在。无论锁定模式开没开它都会持续审计应用使用情况、共享数据和连接来源给企业提供一份不间断的可见性报告。有个细节需要留意锁定模式和开发者模式是互斥的打开其中一个另一个就会自动关闭。另外Codex的网络访问不受锁定模式约束这一点在部署时要单独评估。OpenAI在这件事上表现得颇为坦诚。他们直言锁定模式并非铜墙铁壁已启用的第三方应用、未曾预料的功能组合以及新型攻击手法都可能留下残余风险。即便开了锁定模式藏在上传文件里的提示注入依然可能让AI输出错误或被篡改的结果。个人用户和自助服务企业版可以在设置里找到入口依次进入设置—安全—高级安全—锁定模式即可开启。企业管理员则需要查阅OpenAI的RBAC文档和合规性API指南才能完成工作区级别的批量部署。说到底锁定模式更像是一道有针对的闸门而非全方位的护盾。它解决了数据外泄路径的问题但源头上的内容污染仍然需要用户保持警惕。在AI安全这场持久战里技术加固和人的谨慎缺一不可。

相关新闻