阿里云无影Agent开发套件AgentBay对接使用完全指南

发布时间:2026/6/16 1:46:14

阿里云无影Agent开发套件AgentBay对接使用完全指南 阿里云无影Agent开发套件AgentBay从零到一的对接与使用完全指南 本文导读第一章理解AgentBay——AI Agent的云端基础设施第二章对接前的准备工作第三章MCP协议接入第四章SDK编程接入与Web SDK集成第五章模型服务配置与API管理第六章实战案例表单填写代理 自动化测试代理第七章高级配置与运维第一章理解AgentBay——AI Agent的云端基础设施1.1 什么是无影AgentBay无影AgentBay是阿里云无影推出的AI Agent云端执行基础设施。它以Sandbox沙箱为核心载体为智能体框架和应用提供浏览器自动化、代码执行、桌面应用操控、移动应用自动化在内的多样化执行能力。AgentBay定位为AI时代的Agent云基础设施面向企业、开发者和AI厂商提供从开发、测试到规模化运行的全生命周期服务。从技术架构来看AgentBay底层基于阿里云无影资源池全球部署就近接入提供Serverless服务能力客户可以一键调度环境会话。它集成了Browser、File、Terminal等标准MCP工具集支持通过SDK加API或者MCP Server快速接入两者均兼容。与传统的虚拟机不同AgentBay是一个完整的AI Agent云基础设施平台不是简单的虚拟机。1.2 核心能力解读AgentBay集成云上沙箱环境、算力调度、持久化数据存储和企业级安全多项核心能力功能丰富接入简单扩展灵活。具体而言其核心能力包括沙箱环境覆盖Linux、Windows、Android系统层的Computer Use、Mobile Use到Browser Use、Code Space等应用层的多个主流环境为Agent的自动化应用提供全方位支持。数据持久化方面升级了跨平台数据漫游系统支持状态和内存级别的持久化确保任务切换时的状态连续性资源可以按需加载、实时切换完全不需要重启机器。企业级安全方面采用数据加密传输和权限严格隔离实现本地环境零侵入为用户和厂商设置双重保险。1.3 为什么需要AgentBay对于AI Agent开发者而言本地设备难以支撑高并发、高算力需求的Agent任务尤其是需要大量GPU运算的工作普通办公电脑难以胜任。AgentBay将AI分配的任务直接接入高性能的云端环境自带海量MCP工具和环境在云端轻松完成任务执行、算力弹性扩容让运行时间大幅缩短。Agent执行各种任务时经常消耗大量本地算力AgentBay通过云端执行机制任务在阿里云的资源池中执行不占用本地计算资源提供Serverless服务按需分配计算资源支持弹性扩展根据任务需求自动调整资源。在安全与隐私层面无影AgentBay为每个用户提供完全隔离的VM环境环境会话结束后即重置不留存任何数据。通过API Key进行身份认证提供安全的访问控制机制本地数据不会上传到云端云端数据不会被保留除非用户明确授权和要求。第二章对接前的准备工作2.1 账号准备使用无影AgentBay需要先注册阿里云账号并完成实名认证。新用户可享受试用权益首次试用可申请新用户试用资格获得一定额度的免费体验资源。需要先登录阿里云控制台点击阿里云控制台在产品列表中找到无影Agent开发套件AgentBay并开通服务。2.2 申请API KeyAPI Key是无影AgentBay身份认证的核心凭证。在左侧导航栏中单击服务管理在服务管理页面上单击创建API KEY在创建API KEY对话框中输入名称并单击确定。为保障数据安全请勿共享API Key。如需使用国际站服务需将API Key替换为阿里云国际站无影AgentBay服务创建的API KEY。2.3 镜像选择镜像定义了AgentBay沙箱运行的操作系统环境和预装软件。根据业务需求在MCP地址的IMAGEID字段中指定合适的镜像。目前支持以下几类镜像云电脑Windowswindows_latest云电脑Linuxlinux_latest云浏览器browser_latest代码沙箱code_latest云手机mobile_latest将IMAGEID字段设置为指定版本的系统镜像包括系统镜像和自定义镜像。在左侧导航栏选择镜像管理Beta在系统镜像页签或自定义镜像页签中获取镜像ID。第三章MCP协议接入3.1 MCP协议介绍AgentBay平台基于开源标准化协议MCPModel Context Protocol为AI模型与运行环境之间提供了统一的交互接口。该平台实现了与云端运行环境的深度集成使开发者能够通过MCP直接访问会话管理、文件操作、命令执行、应用管理及窗口控制等云端功能。无影AgentBay完全支持MCP协议提供标准化的MCP接口确保与现有MCP生态兼容。它提供了主流的MCP工具集包括Browser工具支持浏览器操作、File工具支持文件操作、Terminal工具支持终端操作。这一设计使得AgentBay可以与现有的MCP Server生态系统无缝集成支持现有MCP Server的功能扩展提供统一的接口标准便于管理和集成。3.2 在Cursor中配置MCP以Cursor V0.50.5版本为例展示如何在MCP工具中添加无影AgentBay的MCP Server步骤一打开Cursor Settings在左侧导航栏中单击MCP 步骤二在MCP Servers面板上单击Add new global MCP server 步骤三在mcp.json文件中粘贴MCP地址代码块3.3 SSE方式配置SSEServer-Sent Events方式适用于WebSocket流式传输场景配置代码如下{ mcpServers: { wuying_mcp_server: { url: https://agentbay.wuying.aliyuncs.com/v2/sse?APIKEYYOUR_API_KEYIMAGEIDbrowser_latest } } }其中YOUR_API_KEY替换为步骤一获取的API KEYIMAGEID替换为所选的镜像ID。3.4 Stdio方式配置Stdio方式适用于本地命令行执行配置代码如下{ mcpServers: { wuying_mcp_server: { command: npx, args: [-y, wuying-agentbay-mcp-server], env: { APIKEY: akm—*****, IMAGEID: browser_latest } } } }npx命令会自动下载并运行wuying-agentbay-mcp-server包通过环境变量传递API密钥和镜像ID。接入完成后执行命令即可让Agent建立AgentBay云浏览器会话在浏览器中打开阿里云官网。第四章SDK编程接入与Web SDK集成4.1 SDK接入方式概述AgentBay支持Python、Java、TypeScript等多种语言的SDK接入。无影AgentBay推出Java SDK助力Java应用安全接入AI Agent通过云端沙箱隔离执行环境解决本地执行的安全、并发与依赖难题支持Spring AI、LangChain4j等主流框架实现高并发、可扩展的智能体开发。Python SDK则简化了与MCP服务器的交互提供易于使用的接口来连接MCP服务器、读取资源和调用工具。4.2 Python SDK安装与初始化# 安装无影AgentBay Python SDK pip install wuying-agentbay-sdk # 基础初始化示例 from wuying_agentbay import AgentBayClient client AgentBayClient( api_keyYOUR_API_KEY, image_idbrowser_latest ) # 创建会话 session client.create_session() # 执行浏览器自动化任务 result session.run_browser_action( actionnavigate, urlhttps://www.aliyun.com ) print(result)4.3 Web SDK前端集成无影Web SDK是用于连接无影AgentBay智能沙箱的Web端开发工具。通过集成Web SDK用户可以根据业务需求快速定制和搭建使用无影AgentBay的Web客户端。SDK的目录结构如下├── WuyingWebDemo.html // SDK示例 ├── WuyingWebSDK.js // SDK的接口文件 └── sdk // iframe内嵌资源文件 └── ASP └── container.html4.4 Web SDK Session创建通过Ticket创建Session的代码示例// 通过Ticket来创建session var userInfo { ticket: xxx, }; var appInfo { osType: Android, appId: android, appInstanceId: ai-xxxxxx, productType: AndroidCloud, connectionProperties: JSON.stringify({ authMode: Session }) }; var sessionParam { openType: openType, iframeId: sessionIframe, resourceType: local, connectType: app, userInfo: userInfo, appInfo: appInfo, }; var wuyingSdk Wuying.WebSDK; session wuyingSdk.createSession(appstream, sessionParam);通过authCode创建Session的代码示例// 通过authCode来创建session var userInfo { sessionId: sessionId, authCode: authCode, }; var appInfo { osType: Android, appId: android, resourceId: p-xxxxxx, productType: AndroidCloud, connectionProperties: JSON.stringify({ authMode: Session }) }; var sessionParam { openType: openType, iframeId: sessionIframe, resourceType: local, connectType: app, userInfo: userInfo, appInfo: appInfo, }; var wuyingSdk Wuying.WebSDK; session wuyingSdk.createSession(appstream, sessionParam);第五章模型服务配置与API管理5.1 模型分组管理在无影Agent管理中心中创建模型分组用于管理Agent可调用的模型服务商和模型范围。创建后可将模型分组绑定至云电脑作为Agent执行任务的推理引擎配置。模型分组创建API如下POST /api/CreateModelTemplate Content-Type: application/json { BizType: 1, AgentProvider: OpenClaw, Name: model-template-001, Description: 测试模型分组 }调用成功后返回信息示例{ Data: { ModelTemplateId: mt-xxxx }, RequestId: 1CBAFFAB-B697-4049-A9B1-67E1FC5F**** }5.2 批量创建模型模板在模型服务商模板下批量创建模型模板支持一次性添加多个模型并指定其中一个为默认模型。已存在的模型将自动跳过不会重复创建。批量创建API如下POST /api/BatchCreateLlmTemplates Content-Type: application/json { ProviderTemplateId: mpt-xxxx, LlmTemplateItems: [ { LlmCode: qwen3.6-plus, Name: Qwen3.6-Plus, Description: 千问Plus系列模型, Config: { id: qwen3.6-plus, maxTokens: 65536, contextWindow: 1000000 }, IsDefaultModel: true } ] }5.3 创建模型服务商模板在模型模板下创建模型服务商模板用于配置Agent可调用的模型服务如阿里云百炼、Token Plan、月之暗面等的连接信息和密钥。5.4 模型配置优先级当Agent运行时自身配置了模型分组且其所在的资源组也配置了模型分组时资源组绑定的模型分组生效。即资源组设置优先级高于Agent运行时设置。第六章实战案例6.1 实战一表单填写代理使用无影AgentBay SDK创建表单填写代理将HTML表单上传至AgentBay并在浏览器中打开表单根据自然语言指令自动填写数据。from wuying_agentbay import AgentBayClient def create_form_filling_agent(): # 初始化AgentBay客户端 client AgentBayClient( api_keyYOUR_API_KEY, image_idbrowser_latest ) # 创建新会话 session client.create_session() # 上传HTML表单到AgentBay环境 form_html form idcontactForm input namename typetext / input nameemail typeemail / input namephone typetel / button typesubmit提交/button /form session.upload_form(form_html, filenamecontact_form.html) # 打开表单页面 session.navigate_to(https://agentbay-domain/contact_form.html) # 根据自然语言指令自动填写 instructions 请帮我填写姓名张三邮箱zhangsanexample.com电话13800138000 session.fill_form_with_llm( instructionsinstructions, llm_modelqwen-plus ) # 提交表单 session.click_button(提交) # 获取提交结果 result session.get_page_content() return result6.2 实战二自动化测试代理使用无影AgentBay SDK创建测试代理扫描Python项目使用LLM生成测试用例并在隔离的云环境中执行。项目结构如下├── README.md ├── .env ├── common/ # 公共核心功能 │ ├── sample_project/ # 用于测试的示例项目 │ └── src/ │ └── base_auto_testing_agent.py # 基础测试代理类 ├── langchain/ # LangChain集成 │ ├── data/ # 输出数据目录 │ ├── src/ │ │ ├── auto_testing_agent.py │ │ └── auto_testing_agent_example.py │ └── requirements.txt# auto_testing_agent.py示例 from wuying_agentbay import AgentBayClient from langchain.agents import initialize_agent class AutoTestingAgent: def __init__(self, api_key: str, project_path: str): self.client AgentBayClient(api_keyapi_key, image_idcode_latest) self.project_path project_path self.session None def scan_project(self): 扫描Python项目识别需要测试的模块 session self.client.create_session() session.upload_directory(self.project_path, /workspace) modules session.run_command( find /workspace -name *.py -not -name test_* ) return modules.split(\n) def generate_test_cases(self, modules): 使用LLM生成测试用例 test_cases [] for module in modules: prompt f为模块{module}生成pytest测试用例 test_code self.session.generate_with_llm( promptprompt, llm_modelqwen-plus, output_formatpython ) test_cases.append(test_code) return test_cases def execute_tests(self, test_cases): 在隔离的云环境中执行测试 results [] for test_case in test_cases: result self.session.execute_pytest(test_case) results.append({ status: result.exit_code, output: result.stdout, duration: result.duration }) return results def run(self): modules self.scan_project() test_cases self.generate_test_cases(modules) test_results self.execute_tests(test_cases) return test_results运行示例如下# 使用LangChain集成运行示例 python langchain/src/auto_testing_agent_example.py第七章高级配置与运维7.1 SDK Endpoint配置无影AgentBay SDK默认使用上海Endpoint。如需通过其他区域例如新加坡进行连接需要配置不同的端点以获得更好的网络性能。配置方法如下# Linux/macOS环境下配置 $ export AGENTBAY_ENDPOINTwuyingai.ap-southeast-1.aliyuncs.com # Windows环境配置 set AGENTBAY_ENDPOINTwuyingai.ap-southeast-1.aliyuncs.com目前支持的Endpoint区域上海默认wuyingai.cn-shanghai.aliyuncs.com新加坡wuyingai.ap-southeast-1.aliyuncs.com。7.2 自定义镜像制作使用在线镜像制作器以直观的方式制作自定义云电脑镜像。使用云电脑或快照创建自定义镜像或者将本地源镜像导入无影云电脑企业版控制台并生成自定义镜像。步骤如下步骤一在左侧导航栏选择资源管理 云电脑企业版 步骤二在云电脑企业版页面上找到目标云电脑 步骤三在操作列中单击更多选择创建镜像 步骤四填写镜像名称和描述选择镜像范围系统盘及数据盘 或 仅系统盘 步骤五选择是否清理个人用户数据残留 步骤六单击创建镜像名称长度为2~128个英文或中文字符必须以大小写字母或中文开头不能以http://或https://开头可以包含数字、半角冒号、下划线或者短划线。创建镜像需要一定的时间所需时间取决于云电脑系统包含的数据大小使用云电脑创建镜像的过程中请勿关机或者重启云电脑以避免镜像创建失败。7.3 安全与数据隔离无影AgentBay的安全机制包括为每个用户提供完全隔离的VM环境环境会话结束后即重置不留存任何数据通过API Key进行身份认证提供安全的访问控制机制本地数据不会上传到云端云端数据不会被保留除非用户明确授权和要求提供安全的数据传输通道支持数据加密存储。7.4 计费与成本控制无影AgentBay采用基础权益包、订阅权益包与后付费相结合的计费模式。基础权益包免费提供支持使用无影AgentBay的基本功能。订阅权益包按月订阅包含Pro权益包和Ultra权益包两种类型使用时优先消耗订阅权益包内赠送的资源额度超出部分将自动转为后付费。后付费根据实际资源使用量进行计量并实时扣费。新用户可0.01元领取100积分体验券用于抵扣资源消耗适用于金融分析、跨境电商、医疗诊断等多场景。7.5 常见问题排查API Key无效错误请检查API Key是否正确填写确认未过期且未被禁用。Image ID不存在确认镜像ID正确所选镜像在当前区域可用。Session超时AgentBay会话默认有时效限制长时间未活动会自动销毁需在代码中配置超时重连机制或延长会话时长。权限不足某些操作需要特定模型分组或资源组授权请检查模型分组配置优先级确保资源组设置正确。网络延迟可通过配置Endpoint选择就近区域以获得更好的网络性能。问答环节Q1无影AgentBay和普通的云电脑有什么区别A1无影AgentBay不是简单的虚拟机而是一个完整的AI Agent云基础设施平台。它集成了Browser、File、Terminal等标准MCP工具集预集成大量面向Agent任务执行的标准工具并以MCP封装以便企业快速集成。而普通云电脑仅提供基础的桌面环境不具备Agent执行所需的标准工具集和任务调度能力。Q2市场上的AI Agent产品如何接入无影AgentBayA2AI Agent产品可以通过以下方式接入申请API Key → 完成自定义镜像制作和资源池定义配置 → 完成MCP服务配置可选→ 集成无影WEB SDK可选→ 客户端或服务端发起工具使用请求。接入方式包括通过无影服务端SDK加API接入或通过MCP Server接入。Q3无影AgentBay支持哪些语言的SDKA3目前支持Python SDK、Java SDK支持Spring AI和LangChain4j无缝集成、TypeScript/Web SDK等。Java SDK助力Java应用安全接入AI Agent通过云端沙箱隔离执行环境实现高并发、可扩展的智能体开发。Q4如何在MCP工具中使用无影AgentBayA4支持SSE、Stdio、Streamable三种连接方式。以Cursor为例打开Cursor Settings → MCP → Add new global MCP server在mcp.json中粘贴MCP地址代码块配置APIKEY和IMAGEID即可。Q5AgentBay如何保障用户数据安全A5无影AgentBay为每个用户提供完全隔离的VM环境环境会话结束后即重置不留存任何数据通过API Key进行身份认证本地数据不会上传到云端云端数据不会被保留除非用户明确授权和要求支持数据加密存储。Q6无影AgentBay的计费方式是什么A6采用基础权益包免费、订阅权益包Pro/Ultra按月订阅与后付费相结合的计费模式。优先消耗订阅权益包内赠送的资源额度超出部分自动转为后付费。新用户可0.01元领取100积分体验券。本文为阿里云无影Agent开发套件AgentBay对接使用的原创技术教程内容基于官方文档与最佳实践整理供开发者参考使用。

相关新闻