
在现代软件工程中随着敏捷开发的普及与微服务架构的演进测试环节面临着前所未有的压力需求变动频繁文档稍有修改测试用例便需要推倒重来人工维护成本极高自动化测试门槛高、成本大编写 Playwright/Selenium 自动化脚本需要深厚的编码功底且由于 DOM 结构和 URL 的动态变化维护成本居高不下AI 工具割裂、流于形式市面上的大模型辅助测试往往只停留在“静态文本生成”阶段缺乏真正的项目上下文感知与系统级交互能力无法形成执行闭环。针对这些行业痛点WHartTest 正式宣布开源其 v2.3.0 版本WHartTest 绝非普通的测试管理工具而是一个基于Django 5.2 DRF与Vue 3打造、深度融合LangChain/LangGraph 多智能体编排与MCP (Model Context Protocol, 模型上下文协议)的全栈 AI 驱动智能测试平台。它真正打通了“需求理解 - 用例生成 - AI 自动生成 UI 自动化 - 协作编辑 - 分布式执行 - 深度 Trace 可视化回放”的完整闭环让测试回归智能与高效。 核心王牌AI 闭环自动创建 UI 自动化测试全程无感100% 可执行传统自动化测试脚本的编写需要人工审查元素、提取定位器XPath/CSS Selector、编写步骤代码并不断进行调试。而在 WHartTest 中这一繁琐的过程被AI Agent 闭环自动化流程彻底颠覆。当测试人员在平台中执行测试用例并勾选“生成 UI 自动化用例”时系统会启动以下高能级 Agentic 闭环流┌─────────────────┐ 1. 触发任务 ┌───────────────────────┐ │ Django Backend │ ─────────────────────── │ LangGraph AI Agent │ └─────────────────┘ └───────────────────────┘ ▲ │ │ 5. 自动提交并落库 │ 2. 交互式执行与观察 │ (Modules/Pages/Elements/Steps) ▼ ┌─────────────────┐ ┌───────────────────────┐ │ SQLite/Postgres│ │ Playwright MCP Server │ └─────────────────┘ └───────────────────────┘ ▲ │ │ 4. 真实数据校验 自动纠错 │ 3. 实时捕获真实DOM、 │ (确保断言与Selector完全精准) │ URL与页面状态 └───────────────────────────────────────────────┘ 核心实现步骤剖析多智能体交互执行Active Interaction后端加载预设的 UI 自动化生成指令PLAYWRIGHT_SCRIPT_INSTRUCTION启动具备浏览器操作能力的 AI Agent。AI Agent 通过 Playwright 真实打开目标应用网页模拟人工依次点击、输入和跳转。运行时 DOM 动态观测Runtime Observation与静态生成代码不同AI Agent 在模拟执行的每一步中都会实时捕获浏览器渲染后的真实 DOM 结构、元素可见性、页面 URL 以及真实的文本值。这彻底杜绝了传统 AI 基于想象“胡乱编造元素 ID 或 CSS Selector”的幻觉Hallucination问题。断言与定位器自适应生成Adaptive Selector GenerationAI 能够智能分析当前页面的最佳定位策略如优先选用语义化标签、Role、Text、Label其次选用稳定 CSS/XPath并结合执行过程中真实观察到的 URL 和页面状态生成高鲁棒性的断言规则。系统强制规定禁止猜测 URL 通配符必须基于运行态观察值构建断言。运行态自校验与闭环纠错Self-Correction LoopAgent 在生成步骤后会自发进行试运行校验。如果某个 Selector 发生变化或执行失败Agent 会捕获错误日志动态修正脚本配置直到在真实浏览器中试跑 100% 通过后才会输出最终可用的低代码自动化步骤。平台资产自动落库Zero-Code Database Commit校验通过后AI 会自动调用平台内置的ui-automation专属工具接口自动在后台数据库中建好对应的“功能模块 - 页面模型 - 元素库 - 自动化步骤”树形关系。测试人员打开界面即可直接看到一套完全配置妥当、随时可以并发执行的低代码 UI 自动化用例 WHartTest v2.3.0 重磅升级解析除了AI 自动生成自动化测试外v2.3.0 开源版本还在功能深度与企业级工程化方面实现了多项跨越式升级1. 集成 ONLYOFFICE需求文档“在线精细化编辑”项目演进过程中需求文档随时在变频繁的上传下载不仅效率低下还极易导致版本错乱。原生文档协作v2.3.0 在平台内深度集成了ONLYOFFICE DOCX 在线编辑器。测试人员可以直接在系统内查看和精细编辑 Word 需求文档格式支持无损解析。健壮的降级保障系统内置服务探针一旦外部文档服务因网络等原因不可用会自动降级为静态预览模式并友好提示保障主测试流程的平滑推进。2. 拥抱多模态需求文档图片规范化解析文字永远无法完全表达软件交互的所有细节原型设计图、逻辑流程图是需求的重要载体。多图同时上传平台支持知识库与需求管理的多图异步上传。多模态 Agent 需求理解v2.3.0 支持规范化处理用户消息中的图片资源。结合多模态大语言模型如支持 Vision 的模型AI Agent 能够同时处理“文字说明 系统原型图 / 业务流程图”从而提取出更加隐蔽边界条件、生成极其细致的测试点。3. 多模块联合上下文消灭系统“信息孤岛”传统的 AI 用例生成一次只能关注一个单一需求无法处理跨业务模块的集成场景和端到端业务流。跨模块用例多选生成v2.3.0 支持测试人员在界面上多选多个关联模块。联合上下文生成机制后端模板生成引擎自动将多个模块的上下文、依赖关系、前置条件拼装成全局提示词。大模型借此站在全局高度自动分析业务流向生成高质量的集成测试与系统端到端E2E测试用例。4. 精细化 Token 账单与 Prompt Caching (缓存命中) 追踪企业级部署 AI 应用Token 开销直接决定了项目能否长久落地。缓存命中Cache Hit深度追踪v2.3.0 在AgentLoopStreamAPIView中率先引入了对大模型Prompt Caching如 Anthropic Claude 或 DeepSeek 缓存机制的统计支持。每次对话都能清晰呈现有多少 Token 命中了缓存。真实 Token 精确开销管理引入了系统提示词与工具定义的物理 Token 真实开销计算智能裁剪多余的上下文为企业运营成本控制提供极为精确的数据看板。5. 高性能分布式架构与优雅的生命周期管理极速数据序列化与标准分页重构了大数据量下的用例列表查询推出轻量级专属列表序列化器与动态页面大小配置的分页类接口响应速度较上一代提升 70% 以上。Django Signal 驱动技能生命周期闭环弃用了不安全的物理删除操作改为基于 Django 信号Signal流驱动。无论是批量删除用例还是级联删除 Skill 目录后台均能确保物理文件被干净清除。提供安全实用的dry-run清理命令保障服务器存储空间整洁。️ 开箱即用极具人性的国内开发构建加速部署WHartTest 采用前后端分离的容器化部署架构为了让国内开发和测试人员享受到极致顺畅的“开箱即用”体验团队专门重构了run_compose.sh构建脚本具备以下极其亮眼的设计一键部署命令# 1. 克隆项目gitclone https://github.com/MGdaasLab/WHartTest.gitcdWHartTest# 2. 拷贝示例配置文件cp.env.example .env# 3. 运行智能部署脚本./run_compose.sh⚡ 革命性的“国内源测速择优”机制镜像拉取秒级响应 (remote)选择 remote 模式启动时脚本会自动对国内几大主流 Docker 镜像加速源官方、1Panel、DaoCloud、1ms、轩辕等进行并发毫秒级测速智能选择当前网络环境下最快的那一个源去拉取镜像彻底告别拉取镜像超时。本地构建秒级提速 (local)如果选择本地构建local模式脚本会自动检测国内各大高校与大厂镜像如清华、阿里、中科大、npmmirror、hf-mirror 等。容错与回退机制Python 的 pip 和 Node 的 npm 依赖构建支持自动回退机制。当某个库在优选源下载超时或失败时构建引擎会自动回退并按顺序切换备用源继续安装极大程度降低构建报错率即使是新手也能在 1 分钟内完成全栈环境的快速搭建让测试更智能开发更高效WHartTest 已经在 GitHub 完全开源。我们致力于打造体验最优秀、架构最合理的 AI 智能测试管理平台。无论您是期望引入 AI 来提效降本的测试主管、追求高效测试的开发工程师还是对 AI Agent 充满热情的开发者WHartTest 都非常期待您的关注与共建GitHub 开源地址https://github.com/MGdaasLab/WHartTest 您的Star是开源团队持续维护和打磨这款智能工具的最大动力联系交流欢迎在 GitHub 提交 Issue 或 Pull Request。添加项目作者微信时请备注github我们将拉您进入核心微信技术交流群。操作手册https://docs.wharttest.mgdaas.cn:4430/