企业 AI / Agent / RAG 上线前检查清单:6 层合规审计、工具越权与 FAQ

发布时间:2026/6/11 4:18:55

企业 AI / Agent / RAG 上线前检查清单:6 层合规审计、工具越权与 FAQ 企业 AI 应用上线后最容易被低估的风险不是模型偶尔回答错误而是模型接入知识库、外部检索、工单系统、邮件工具之后在真实业务链路中被不可信输入带偏并进一步触发错误输出或错误动作。如果你的 AI 应用已经具备以下能力就不应该只做“模型效果测试”而应该同步做 AI 合规审计接入内部知识库或外部网页检索读取客户资料、工单、邮件、合同、配置等业务数据能调用工具、插件、API 或自动化流程输出内容会被客服、销售、运营、研发或管理层直接采用影响客户沟通、权限、隐私、资金、合规边界或业务决策。本文给出一套更偏工程落地的 AI 合规审计方法适合用于上线前检查、上线后巡检和周度复盘。核心结论AI 合规审计不是补材料而是确认 AI 系统在真实运行链路中是否可信、可控、可追溯。1. 先明确AI 合规审计到底审什么很多团队会把 AI 审计理解成“看模型是否安全”或“看制度是否写完”。这两件事都重要但不够。企业 AI 应用真正的风险通常出现在链路中用户输入 / 外部内容↓检索 / 知识库 / 工具返回↓模型上下文↓模型输出↓系统执行 / 人工采用↓日志 / 复盘 / 回归因此审计对象不是单个模型而是模型、数据、工具、权限、输出、人工确认和日志回放组成的完整系统。从工程实践上可以拆成 6 层层级审计对象核心问题输入层用户输入、外部网页、邮件、知识库、上传文件输入来源是否可信是否与系统指令隔离工具层插件、API、工单、邮件、CRM、配置系统工具权限是否最小化是否存在越权调用输出层自由文本、结构化结果、自动执行内容哪些输出可执行哪些只能作为建议留痕层检索日志、tool call、模型输出、人工确认出问题后是否可回放、可定位复核层reviewer、人工确认、双重验证高风险动作是否有人兜底回归层攻击样本、异常样本、规则库、周度抽检上线后是否持续检查风险漂移这 6 层缺任何一层AI 系统都可能出现“上线时看起来没问题运行一段时间后无法解释”的情况。2. 第一步做系统盘点审计之前先把系统盘点清楚。建议至少建立一张表字段示例说明系统名称客服 AI 助手哪个 AI 应用业务场景客户问题总结、回复建议服务什么流程负责人客服产品负责人 / 技术负责人谁负责上线和复盘数据源知识库、工单、客户沟通记录模型能读什么工具权限查询工单、生成回复、读取客户标签模型能调用什么输出去向客服确认后发送给客户输出会被谁使用风险等级L2 / L3是否影响客户、权限、隐私或合规日志状态已记录 / 未记录 / 不完整是否可追溯注意如果企业内部已经有多个团队在试用 AI这一步非常重要。很多风险不是来自单个系统而是来自“谁都接了一点没人知道全貌”。如果你正在整理上线评审表可以先收藏这张系统盘点表。需要完整可复用版本可以在评论区留言「AI审计清单」获取《企业 AI 合规审计 Checklist》。3. 第二步检查输入层区分可信与不可信内容Prompt Injection 风险的核心不是用户输入了一句“请忽略之前指令”这么简单。更常见的情况是间接注入恶意指令藏在网页、邮件、知识库片段、文档或工具返回值里被模型当作任务上下文读取。输入层建议检查以下问题检查项推荐处理外部网页是否默认可信默认不可信进入上下文前标记来源用户上传文件是否默认可信默认不可信必要时做内容扫描和隔离知识库内容是否区分来源区分内部认证内容、人工维护内容、外部同步内容工具返回值是否可能包含指令工具返回只作为数据不作为系统指令系统指令和外部内容是否混在一起必须分层处理避免被外部内容覆盖一个基本原则外部内容只能作为被处理的数据不能变成新的系统指令。4. 第三步检查工具权限避免“过度代理”当模型可以调用工具时风险会明显放大。尤其是这些能力查询客户信息修改工单状态发送邮件或消息修改系统配置访问敏感数据触发审批、退款、授权等流程。工具层审计的重点不是“模型能不能完成任务”而是“为什么必须给它这个权限”。建议按最小权限原则设计工具类型风险建议只读查询工具中低允许使用但记录查询日志客户数据查询中高限定字段屏蔽敏感信息消息发送工具高必须人工确认后发送配置修改工具高默认禁止自动执行支付、退款、权限变更高不允许模型单独闭环必须双重验证如果一个 AI Agent 同时具备“能查、能改、能发”的能力就必须重点审计。因为一旦模型被带偏影响范围会比普通问答系统大很多。5. 第四步检查输出层切断错误自动执行链路企业 AI 应用里最危险的输出不是“回答错了”而是“回答错了以后被系统执行了”。输出层建议做三件事能结构化的输出尽量结构化高风险输出必须降级为建议自动执行前必须有人或规则兜底。示例输出结构{ suggestion: 建议客服回复客户说明当前问题已进入排查流程, risk_level: L2, requires_human_review: true, source_refs: [ticket_1024, kb_88], blocked_actions: [send_email, close_ticket] }这种结构的好处是可以强制标记风险等级可以明确是否需要人工确认可以保留来源引用可以把高风险动作从输出中隔离出来。不要让模型直接输出“可执行命令”再由下游系统无条件执行。这是很多 AI 应用风险扩大的关键原因。6. 第五步检查留痕层保证可回放没有日志就没有审计。AI 系统至少要记录以下内容日志类型必要字段请求日志request_id、user_id、system_id、timestamp输入日志输入来源、可信等级、是否命中风险规则检索日志query、召回内容、来源、排序结果工具调用日志tool_name、参数、返回结果、调用人 / 调用系统输出日志模型输出、风险等级、是否需要人工确认人工确认日志reviewer、确认结果、修改记录、时间一个简化日志结构可以这样设计{ request_id: ai_audit_20260609_001, system_id: customer_success_agent, user_id: u_1001, input_source: external_email, input_trust_level: untrusted, retrieved_refs: [kb_23, ticket_889], tool_calls: [ { tool: ticket_query, permission: read_only, result_logged: true } ], output_risk_level: L2, requires_human_review: true, reviewer: cs_manager_01, final_action: edited_and_sent, timestamp: 2026-06-09T10:30:0008:00 }日志的目标不是“存下来”而是出问题后能回答三个问题问题从哪个输入引入哪个工具调用扩大了影响哪个人或规则在最后一步做了确认7. 第六步建立复核和回归机制AI 审计不能只做上线前一次。因为上线后会持续发生变化知识库内容会更新工具权限会调整用户输入方式会变化业务流程会变化风险样本会增加。建议建立周度回归机制周度检查项要回答的问题新增 AI 场景本周是否新增系统、Agent、插件新增数据源是否接入外部网页、邮件、用户上传文件新增工具权限是否新增可查询、可修改、可发送的工具异常输出是否出现不符合预期的输出高风险动作是否绕过人工确认日志回放是否能回放关键请求链路样本回归是否把新风险样本写入测试集这一步的关键是持续性。一次审计只能证明上线当时的状态持续回归才能证明系统上线后仍然可控。8. 风险分级建议可以直接把 AI 使用场景分成三档风险等级场景处理方式L1 低风险摘要、会议纪要、头脑风暴、内部知识整理可高频使用 AI重点关注效率和复用L2 中风险需求分析、技术方案初稿、外发内容草稿、测试样例必须有 reviewer 和验证环节L3 高风险权限策略、客户沟通定稿、隐私与合规数据处理、生产代码核心逻辑不允许 AI 生成后直接采用必须人工主写或双重验证这个分级可以直接用于上线评审表、需求评审表和内部 AI 使用规范。9. 整改动作表风险典型问题整改动作外部内容与系统指令混在一起模型把网页或邮件里的恶意指令当成任务要求外部内容默认标记为不可信与系统指令分层处理工具权限过大模型既能查客户信息又能发消息、改工单权限最小化高风险工具默认关闭输出可直接自动执行错误输出被下游系统直接执行高风险输出只能作为建议执行前必须人工确认日志不完整出问题后无法定位输入、检索、调用、输出链路为检索、tool call、输出和人工确认建立日志只上线前审计一次上线后风险随数据源和权限变化而漂移建立每周抽检和红队样本回归10. 总结企业 AI 合规审计的重点不是证明“模型没有问题”而是证明整条 AI 业务链路可控。如果要落地可以按这个顺序执行盘点所有 AI 系统和工具链区分可信输入和不可信输入收敛工具权限约束输出边界建立可回放日志增加人工复核做周度回归。真正能让 AI 放心上线的不是制度写得厚而是系统能持续证明自己可信、可控、可追溯。如果你正在做企业 AI 应用、RAG、Agent 或内部 AI 工具上线可以收藏这篇文章并在评论区留言「AI审计清单」获取《企业 AI 合规审计 Checklist》。这份 Checklist 会覆盖系统盘点、输入分层、工具权限、输出边界、日志字段、人工复核和周度回归适合直接放进上线评审、技术方案评审或安全复盘流程。

相关新闻