
1. messages 对话数组底层原理大模型无独立数据库存储对话,所有交互依托标准messages数组传输。数组内每条元素标记角色(system/user/assistant)+ 对应文本,模型仅解析该数组内容生成回复;数组为空时,无输入上下文,模型不会输出内容。应用方法格式规范:遵循通用结构,区分角色位json[ {"role":"system","content":"人设/规则"}, {"role":"user","content":"用户提问"}, {"role":"assistant","content":"AI历史回复"} ]实操规则:每一轮对话都追加新消息到数组尾部;多轮对话完整保留历史消息。典型场景所有对话类应用、Agent 会话、接口调用;避坑:数组乱序、角色标注错误会导致语义理解错乱。2. 上下文窗口(Context Window)底层原理模型单次推理有固定字符 / Token 上限,不存在持久记忆。实现 “记忆” 的唯一方式:把完整历史对话 + 当前问题全部拼接进 messages 数组,一次性投喂给模型。超出窗口上限会自动截断内容,造成记忆丢失。应用方法基础用法:短对话直接全量传递历史消息;进阶优化(长会话):滑动窗口:只保留最近 N 轮对话;摘要压缩:用模型把老旧对话浓缩为简短摘要,减少 Token 占用;选型参考:小模型窗口小,长链路 Agent 优先选用