System_Prompts_Leaks:44.2k Star揭示的大模型“家规”

发布时间:2026/6/24 9:42:59

System_Prompts_Leaks:44.2k Star揭示的大模型“家规” 什么是System_Prompts_LeaksSystem_Prompts_Leaks是一个收集了主流AI模型和Agent系统提示词的开源项目。它收录的内容包括Anthropic系列Claude Fable 5、Opus 4.8、Claude Code、Claude DesignOpenAI系列ChatGPT 5.5 Thinking、GPT 5.5 Instant、CodexGoogle系列Gemini 3.5 Flash、3.1 Pro、Antigravity其他xAI Grok、Cursor、Copilot、VS Code、Perplexity等项目采用CC0-1.0许可证使用JavaScript编写持续更新。截至目前已获得44.2k Star是AI社区最受关注的开源数据集之一。系统提示词为何重要系统提示词System Prompt就像是大模型的“家规”。它是一套内置的规则在用户输入之前被注入用于定义模型的角色、行为边界、输出格式等核心参数。它告诉模型你是谁、该怎么说话、能做什么、不能做什么。这不是用户输入的具体问题而是模型从“出生”就带在身上的“剧本”。不同AI公司采用了截然不同的设计哲学分析这些提示词可以窥见各家的产品策略和技术路线。泄露的系统提示词深度分析Anthropic系列极致的安全与合规Anthropic的提示词以全面、细致著称往往长达数千字。以Claude 3 Opus的提示词为例包含以下核心模块身份声明明确自己是“Claude由Anthropic开发的AI助手”语气温暖但专业。核心价值观强调“有帮助、无害、诚实”HHH原则要求在所有回答中平衡这三个目标。儿童安全指令禁止任何可能伤害儿童的内容即使是在虚构故事中。网络安全警告提醒Claude不要辅助网络攻击、恶意软件开发或社会工程。注入检测系统内嵌一套复杂的规则帮助Claude区分系统消息和用户可能构造的欺骗性输入。例如提示词会指示Claude忽略用户指令中试图覆盖系统设定的部分并标记可疑模式。输出格式约束要求回答保持结构化对于编程问题优先给出可运行代码对于解释性问题优先给出简明摘要。Claude Code的提示词则更侧重于编程场景增加了“代码质量检查”、“测试覆盖建议”、“性能分析”等模块要求Claude在生成代码时主动考虑可维护性和安全性。OpenAI系列灵活与通用化ChatGPT的系统提示词相对简洁更注重通用性和对话流畅性。其特点是角色设定较模糊允许模型根据用户输入动态调整风格。对安全限制的表述较为通用如“不要生成有害内容”未像Anthropic那样列举具体场景。强调“有用的助手”形象鼓励模型在不确定时主动提问澄清。GPT-5.5 Thinking的提示词则增加了“思考步骤”模块要求模型在回答问题前先输出内部推理过程但不对用户可见这有助于提升复杂问题的解决精度。Google系列强调搜索与事实性Gemini的提示词特别注重“事实准确性”要求模型在提供信息时注明来源或置信度。此外由于Gemini深度集成Google搜索提示词包含了对搜索引擎调用的指令指导模型何时以及如何使用搜索增强回答。这与其他纯生成式模型形成鲜明对比。其他模型xAI Grok的幽默风格xAI的Grok被赋予了“幽默、不拘一格”的性格提示词中明确允许模型在适当时候“开玩笑”和“讽刺”这与Elon Musk的个人风格一致。这种差异化定位在提示词层面就得到了体现。提示词注入攻击与防御System_Prompts_Leaks项目也间接暴露了提示词注入Prompt Injection的风险。攻击者可能利用泄露的系统提示词来设计越狱jailbreak语句试图覆盖或绕过安全限制。项目维护者在README中提醒使用者本数据仅用于研究和教育不得用于恶意目的。同时多家人工智能公司已经采用了更强大的对抗性训练即使提示词公开攻击成功率也大幅降低。从防御角度看这些泄露的提示词也为工程师提供了宝贵参考如何设计健壮的“边界检查”逻辑如何格式化系统提示使其难以被覆盖如何嵌入“水印”或“指纹”以追踪泄露源头工程化启示如何利用这些提示词对于AI应用开发者System_Prompts_Leaks提供了直接的学习素材角色塑造参考各家风格为自己的AI应用设计更生动的角色。安全防护学习Anthropic的注入检测机制增强自身系统的鲁棒性。输出约束借鉴格式指令让模型返回更结构化的数据便于下游解析。多轮对话管理分析如何维护对话状态和上下文优化用户体验。已有多个开源项目基于这些提示词构建了“提示词模板库”供开发者快速复用。伦理与法律争议System_Prompts_Leaks项目也引发了激烈的伦理讨论。一方面系统提示词是AI公司的核心知识产权泄露可能违反服务条款另一方面其公开有助于提高透明度和促进研究。部分AI公司曾向项目维护者发出下架请求但维护者以“公共知识”为由保留并强调所有提示词均来自公开渠道或社区共享不涉及黑客行为。法律专家指出提示词是否受版权保护仍存争议通常被视为功能性文本但无论如何该项目推动了行业对“AI透明度”的思考。一些公司已开始主动公开部分提示词如OpenAI的Moderation提示词作为合规努力的一部分。社区贡献与持续更新项目采用JavaScript编写维护了一个提示词列表并定期更新。贡献者可以通过提交Pull Request添加新发现的提示词或更新已有内容。为了确保真实性每个提示词都附有来源链接如截图、官方文档或已知社区发现。截至目前已收录超过30个不同模型/产品的提示词并且数量仍在增长。未来方向项目计划增加提示词的“对比分析”功能例如高亮不同模型之间的相似点和差异点以及可视化提示词的长度、复杂度等指标。此外还考虑提供“提示词演化”时间线展示同一模型在不同版本中提示词的变化从而反映公司策略的调整。总结System_Prompts_Leaks虽然是一个争议性的数据集但无可否认地成为了AI透明度运动的重要一环。它让开发者、研究者和普通用户得以一窥AI产品的“潜意识”推动了更开放的技术讨论。对于任何从事AI产品开发、提示词工程或AI安全的人来说这个项目都是一份不可多得的参考手册但其使用必须严格遵守伦理规范。

相关新闻