第5讲：部署架构,性能预判与数据设计-尧图网站设计

上一节课我们定义了代码层次的架构包括模块怎么分代码怎么组织外部调用怎么处理。这一讲我们进入系统层面当前怎么部署瓶颈在哪未来怎么扩展数据怎么存储。很多工程师认为这都是上线前的事情但是部署架构从第一天就影响了你的设计决策缓存放在哪里数据库怎么连接服务之间怎么通信全部取决于你的部署形态提前想清楚不然后面得返工。当前部署架构先把当前的部署原貌画出来Gdify是模块化单体技术栈spring bootvuepostgresSqlredispgvector。目标50人使用生产环境都可加K8S部署。帮我设计当前阶段的部署架构有哪些组件请求怎么流转每个组件之间的职责是什么用户请求经Nginx分流静态资源直接返回API请求转发给Spring BootSpring Boot按需读写PostgresSQL业务数据、Redis缓存会话、pgvector向量检索。K8s只作为部署壳不引入服务网格和多副本等复杂机制。这个架构基本上不错没有什么大问题就是我们需要的。性能瓶颈预判大部分工程师不会停眼响性能瓶颈等到出现了问题再救。但是身为架构师你应该在设计阶段就知道瓶颈可能在哪里。即使一期不做处理也要心里有数。让AI编辑器帮我们来分析基于Hify当前的部署架构Nginx Spring Boot PostgresSQL Redis pgvector 外部LLM API帮我分析这个系统的性能瓶颈可能在哪按严重程度排序每个瓶颈给出触发条件和一期是否需要处理。扩展架构一期50人如果Gdify做得好可能要推广到更大范围。架构上不能堵死这条路但也不能演进过早过早优化比性能瓶颈本身的破坏力更大如果Gdify要从50人扩展到几千人当前架构需要怎么演进帮我设计一个分阶段的扩展路径每一步的触发条件是什么、改什么、不改什么。这个表就是你的扩展路线图现在你不需要做任何一步但是每一步的出发条件改什么难点在哪里全部写清楚了。前面模块化单体让微服务拆分成本可控接口隔离让调用方式可平滑切换会话存redis让多副本不需要改动代码数据模型概览核心表有哪些关系怎么样先列出来具体字段设计等后面每个模块开发再定现在定太细了后面一定会改基于Gdify的功能范围模型管理Agent对话工作流知识库MCP工具帮我梳理和核心数据表和他们之间的关系只要表名和关系不展开字段我们要学会一个点你要清晰的知道AI能干什么干什么干得好而你要做什么。我们跟AI不是敌人不是竞争者而是合作者。我们要学会和他一起协作释放我们自己最大的效率从而给我们提高更大的现实收益。数据库性能规范表结构后面再定但数据库性能规范现在就要定,后面AI编辑器每次建表写查询都要遵循。Gdify用PostgresSQLpgvector。帮我定义数据库层面的性能规范覆盖索引设计原则大表预判和对应策略分页查询注意事项通用字段约定。要具体到AI键表时能直接执行Codex 给了以下的建表规范数据库性能规范 1. 索引设计原则只为“已确认的查询模式”建索引不为未来想象建索引。默认先用 B-tree适合等值、范围、排序、唯一约束。组合索引默认不超过 3 列列顺序按“等值过滤 - 范围过滤 - 排序/去重”排列。多列索引必须匹配同一条 AND 查询链路且尽量命中左前缀。软删除表的热路径索引一律做部分索引WHERE deleted 0。只读/少变表优先做覆盖索引 INCLUDE(...)让列表和详情尽量走索引只读。生产环境建索引必须优先用 CREATE INDEX CONCURRENTLY。索引重建优先用 REINDEX CONCURRENTLY。 pgvector 向量索引和业务索引分开建不要混在同一个索引思路里。 vector 小表可先不建 ANN 索引先走精确检索大表再上 HNSW/IVFFlat。 2. 大表预判判定为大表的标准 1000万行或日增 10万行或表索引 20GB或分页/检索 p95 明显上升。 Gdify 里优先按大表管理的表conversation_message、conversation_run、workflow_run、workflow_run_node、mcp_call_log、knowledge_chunk、knowledge_embedding。纯配置类表通常不是大表agent、llm_model、mcp_server、knowledge_base。时间序列表优先按月分区。只有极少数状态值会被查询时用部分索引不要造一堆互斥 partial index。如果按很多不同维度过滤优先考虑分区而不是堆很多 partial index。大表尽量避免硬删和级联删改成软删异步清理。向量表和业务主表分离embedding 单独存。 3. 大表策略 conversation_message、workflow_run_node、mcp_call_log按 created_at 月分区热分区保留近 3 到 6 个月冷分区归档。 knowledge_chunk、knowledge_embedding先单表索引超过容量阈值后按 tenant_id 或 knowledge_base_id 评估分区。 audit_log、call_log 类表只追加不更新适合时间分区归档。向量检索表HNSW 适合更好的召回/查询性能IVFFlat 适合更快建索引/更省内存。 IVFFlat 建议在有数据后再建lists 可先按 rows / 1000 起步百万内更大规模可按 sqrt(rows)。查询时 HNSW 用 hnsw.ef_searchIVFFlat 用 ivfflat.probes 做召回/性能平衡。 4. 分页规范默认用“游标分页 / keyset pagination”不要把 OFFSET 作为核心接口方案。只有小列表、低页数后台页面才允许 LIMIT/OFFSET。所有分页查询必须有唯一且稳定的排序推荐 created_at DESC, id DESC。分页条件要和索引一致例如(tenant_id, status, created_at DESC, id DESC)。高页码深翻页禁止使用 OFFSET。向量检索不要做传统 offset 翻页只做 top-k必要时用游标续查。如果是过滤向量检索优先把过滤条件收进 CTE 或分区裁剪里。 5. 通用字段约定 idbigint主键单调递增或雪花型不用 varchar 当主键。 tenant_id多租户场景必备没有租户就不要硬塞。 created_at / updated_attimestamptz统一存 UTC。 deleted软删字段推荐 0 表示未删除1 表示已删除。 created_by / updated_by审计字段能留就留。 version乐观锁字段默认 0。 status状态字段尽量用小整数。 sort_no人工排序字段只在确实需要时加。 ext / metadata只放低频扩展信息别拿来做高频过滤。表名和字段名统一用 snake_case业务表尽量用单数名词。 6. AI 直接执行模板先判断表类型主数据表 / 关系表 / 日志表 / 向量表 / 工作流运行表。再判断访问模式详情 / 列表 / 时间范围 / 状态过滤 / 相似度检索。然后按下面规则落索引主数据表1 个主键 1 到 2 个业务唯一索引。列表表(tenant_id, status, created_at DESC, id DESC) 这类复合索引。软删表所有热路径索引都加 WHERE deleted 0。向量表单独建 ANN 索引不和业务字段混在一起。大表先定分区再定索引最后定归档。上线建索引用 CONCURRENTLY不要锁表硬建。 7. 可直接套用的索引模板 CREATE INDEX CONCURRENTLY idx_conversation_tenant_created_id ON conversation (tenant_id, created_at DESC, id DESC) WHERE deleted 0; CREATE INDEX CONCURRENTLY idx_message_conv_created_id ON conversation_message (conversation_id, created_at ASC, id ASC); CREATE INDEX CONCURRENTLY idx_kb_doc_base_status_created ON knowledge_document (knowledge_base_id, status, created_at DESC, id DESC) WHERE deleted 0; CREATE INDEX CONCURRENTLY idx_run_tenant_status_created ON workflow_run (tenant_id, status, created_at DESC, id DESC) WHERE deleted 0; CREATE INDEX CONCURRENTLY idx_embedding_hnsw ON knowledge_embedding USING hnsw (embedding vector_cosine_ops);写入AGENT.mdGdify 运行与数据策略补充本章是 Gdify 当前阶段的默认执行规范。除非明确说明否则新增代码、数据表、索引和查询都必须遵守。 1. 部署与请求流转 - 当前默认部署形态为 Nginx Spring Boot PostgreSQL Redis pgvector 外部 LLM API。 - Nginx 只负责入口治理、HTTPS、静态资源和反向代理不承载业务逻辑。 - Vue 前端作为静态资源独立部署API 请求统一转发到 Spring Boot。 - Spring Boot 负责鉴权、业务编排、事务控制、缓存读写、向量检索协调和外部 LLM 调用。 - Redis 负责缓存、会话、限流、热点数据与分布式协调不作为主数据源。 - PostgreSQL pgvector 是唯一可信业务数据源向量数据与业务数据同库管理但职责分离。 - 外部 LLM API 必须被视为慢、贵、不可控的远程依赖所有调用都要设置超时、重试、熔断和降级。 - 文件类数据优先进入对象存储数据库只保存元数据和引用地址。 - 面向 K8S 时应用层必须尽量无状态状态统一下沉到数据库、缓存和对象存储。请求流转约定 1. 用户访问域名先到 Nginx。 2. 静态资源直接返回前端文件。 3. API 请求转发到 Spring Boot。 4. 后端先做鉴权、参数校验和限流判断。 5. 先查 Redis未命中再查 PostgreSQL。 6. 如涉及知识检索再走 pgvector 向量查询。 7. 如涉及模型生成再调用外部 LLM API。 8. 文件上传先写对象存储再落库元数据。 9. 结果统一由后端组装后返回前端。 2. 核心数据模型 - Gdify 的核心域按模型 / Agent / 对话 / 工作流 / 知识库 / MCP 六类组织。 - 数据表设计优先围绕“谁拥有数据、谁引用谁”来建模不按界面拆表。 - 以下为推荐的核心表名与关系不展开字段。用户与权限 - sys_user - sys_role - sys_permission - sys_user_role - sys_role_permission - sys_team - sys_team_member 模型管理 - llm_provider - llm_model - llm_model_config - llm_model_credential Agent - agent - agent_version - agent_model_binding - agent_tool_binding - agent_knowledge_binding 对话 - conversation - conversation_message - conversation_run 知识库 - knowledge_base - knowledge_document - knowledge_chunk - knowledge_embedding 工作流 - workflow_definition - workflow_version - workflow_node - workflow_edge - workflow_run - workflow_run_node MCP - mcp_server - mcp_tool - mcp_tool_schema - mcp_tool_binding - mcp_call_log 关键关系约定 - llm_provider 1:N llm_model - llm_model 1:N llm_model_config - llm_model 1:N llm_model_credential - agent 1:N agent_version - agent N:M llm_model 通过 agent_model_binding - agent N:M mcp_tool 通过 agent_tool_binding - agent N:M knowledge_base 通过 agent_knowledge_binding - agent 1:N conversation - conversation 1:N conversation_message - conversation 1:N conversation_run - knowledge_base 1:N knowledge_document - knowledge_document 1:N knowledge_chunk - knowledge_chunk 1:N knowledge_embedding - workflow_definition 1:N workflow_version - workflow_version 1:N workflow_node - workflow_version 1:N workflow_edge - workflow_definition 1:N workflow_run - workflow_run 1:N workflow_run_node - mcp_server 1:N mcp_tool - mcp_tool 1:N mcp_tool_schema - mcp_tool 1:N mcp_call_log 3. 数据库性能规范 3.1 索引设计原则 - 只为明确存在的查询模式建索引不为未来猜测建索引。 - 默认先用 B-tree适合等值、范围、排序和唯一约束。 - 组合索引优先控制在 3 列以内列顺序按“等值过滤 - 范围过滤 - 排序”排列。 - 查询中经常带软删除条件的表热路径索引优先加 WHERE deleted 0。 - 列表和详情类查询优先做覆盖索引不要让查询频繁回表。 - 生产环境建索引必须优先使用 CREATE INDEX CONCURRENTLY。 - 索引重建优先使用 REINDEX CONCURRENTLY。 - pgvector 索引要单独设计不要和业务索引混建思路。 3.2 大表预判与策略 - 满足以下任一条件时默认按大表处理 1000万行、日增 10万行、表索引 20GB、分页或检索 p95 明显上升。 - Gdify 中优先按大表管理的表包括conversation_message、conversation_run、workflow_run、workflow_run_node、mcp_call_log、knowledge_chunk、knowledge_embedding。 - 大表优先考虑按时间分区时间序列表默认按月分区。 - 日志类、运行轨迹类表只追加不更新优先做归档和冷数据迁移。 - 高写入、高追加表尽量避免硬删优先软删异步清理。 - 需要相似度检索的向量表和业务主表分离建模避免向量数据污染主业务表。 3.3 分页查询注意事项 - 默认使用游标分页 / keyset pagination不把 OFFSET 作为主分页方案。 - 只有小列表、后台低频页面才允许 LIMIT/OFFSET。 - 所有分页查询必须有稳定且唯一的排序推荐 created_at DESC, id DESC。 - 深分页禁止使用高 OFFSET。 - 过滤排序必须和索引结构尽量一致避免全表扫描和临时排序。 - 向量检索只做 top-k不要做传统意义上的深分页。 3.4 通用字段约定 - id 使用 bigint 主键不用字符串主键。 - tenant_id 在多租户场景必须保留。 - created_at / updated_at 使用统一时间类型默认按 UTC 存储。 - deleted 作为软删除标记0 表示未删除1 表示已删除。 - created_by / updated_by 用于审计场景能保留尽量保留。 - version 作为乐观锁字段。 - status 尽量用小整数。 - sort_no 只在确实需要排序控制时添加。 - ext / metadata 只放低频扩展信息不承担高频过滤职责。 4. AI 生成约束 - AI 生成表、索引、分页 SQL 之前必须先判断该对象属于哪个业务模块。 - AI 生成代码时必须先判断是“写操作”还是“读操作”。 - AI 生成 DDL 时必须先判断表类型主数据表、关系表、日志表、向量表、运行表。 - AI 生成索引时必须先判断访问模式详情、列表、时间范围、状态过滤、相似度检索。 - AI 生成的索引必须匹配真实查询而不是把所有字段都塞进联合索引。 - AI 生成分页 SQL 时默认禁止 OFFSET 深翻页。 - AI 生成向量表结构时必须单独考虑 embedding 列、向量索引和检索策略。 - AI 生成表结构时如果出现软删除字段热路径索引必须同步考虑部分索引。 - AI 生成生产环境索引时必须默认使用并发建索引语法。 - AI 生成代码前必须遵守现有模块边界不允许跨模块直连 Mapper、DO 或 RepositoryImpl。总结这一节课我们干了4件事设计了当前部署架构预判了性能瓶颈规划了扩展路径定义了数据模型和数据库规范。其中最有价值的是性能瓶颈预判大部分工程师不会提前想这个觉得一期跑起来再说。但是你作为架构师脑子里就需要有一张地图瓶颈在哪里什么时候会触发到时候改什么有了这张地图你对系统的掌控力完全不一样。而这张地图不需要你从零开化让AI编辑器均于你的架构分析你判断它说的对不对另一个值得强调的点就是数据库规范这些内容索引原则分页注意事项大表预判对有经验的工程师来说是常识但对AI编辑器来说却不是你不写它不会自动遵守这些规范在花10分钟内定好。后面每一次建表每一次查

第5讲：部署架构,性能预判与数据设计

相关新闻

DevOps 生态介绍（六）：超详细！Jenkins Pipeline 实战教程，构建你的第一个 CI 项目

AudioSet数据集国内镜像下载与预处理避坑指南（附Python脚本）

不止于Demo：将CarSim平行泊车仿真升级，应对更复杂车位与动态障碍物

技术美术实战：手把手教你为Unity定制Substance Painter贴图自动化导入管线

我的两次Pattern Recognition投稿经历：一篇半年录用，一篇拖了26个月，给后来者的避坑指南

别再死记硬背了！用Metasploitable2靶机+VMware，手把手带你玩转Kali Linux渗透测试实战

AD9226+AD8421实战：手把手教你搭建一个0-3.3V正弦信号调理与采集电路

用 XGBoost 解决客户流失预测的正确姿势

从收音机到锁相环：聊聊模拟乘法器这个“老古董”在通信系统里的关键作用

ShaderGraph从入门到放弃？新手最容易踩的5个坑及避坑指南（基于Unity 2021.3）

零基础3步打造专业AI翻唱：AICoverGen完全指南

基于Arduino与DS1302的实时时钟系统：硬件连接、代码实现与调试全指南

让 AI 做代码 Review（CR）：测试如何提前在代码提交阶段发现 Bug？

问题不是要不要审，而是审查放在哪条路径

水纹真实度提升300%的关键技巧，深度拆解--style raw、--chaos 45与自定义tile texture协同机制

别再手动点关了！用PowerShell永久关闭Windows Defender的保姆级教程（含Server 2016/2019）

别再只换芯片了！BP2832A替换CL1502，你的电感参数算对了吗？

全平台智能资源下载工具：res-downloader 完整使用教程