教你如何让claude code cli+deepseek进行识图|保姆级教程

发布时间:2026/5/31 19:52:21

教你如何让claude code cli+deepseek进行识图|保姆级教程 小白也能看懂的全流程教程零成本。一句话说清楚DeepSeek 是纯文本模型没有眼睛不能看图。但可以给它嫁接一个免费的视觉模型小米 MiMo让它长出眼睛。整个过程不花一分钱。架构原理你发图片 ──→ Claude Code ──→ DeepSeek纯文本不碰图片 │ └──→ MiMo MCP Server ──→ MiMo API看图返回文字描述 │ Claude Code ←── 把描述塞回给 DeepSeek ←──┘DeepSeek 从来不看图片本身 —— 它看的是MiMo 替它读出来的文字描述。你要准备的东西东西说明费用MiMo API Key小米 AI 开放平台注册即送额度免费Claude CodeAnthropic 官方 AI 编程 CLI免费Python本机已装好的 Python3.8免费第一步获取 MiMo API Key打开 https://mimo.xiaomi.com/用小米账号登录没有就注册一个进入控制台 →「API 密钥」→ 创建 API Key复制备用填写yaoqing码W9CT4W在控制台左下角填写。MiMo 目前注册就送额度足够日常识图。第二步写 MiMo MCP 服务器2.1 创建文件在C:\Users\你的用户名\mcp-mimo-vision\目录下创建server.py目录不存在就新建importbase64importjsonimportmimetypesimportosimportsysfrompathlibimportPathimporthttpxdef_get_config():api_keyos.environ.get(MIMO_API_KEY,)ifnotapi_key:raiseRuntimeError(MIMO_API_KEY 环境变量未设置)return{api_key:api_key,base_url:os.environ.get(MIMO_BASE_URL,https://api.xiaomimimo.com/v1),model:os.environ.get(MIMO_MODEL,mimo-v2.5),}TOOLS[{name:describe_image,description:识别图片内容。传入本地图片路径返回 MiMo 模型对图片的文字描述。,inputSchema:{type:object,properties:{image_path:{type:string,description:图片文件的本地路径,},prompt:{type:string,description:识图提示词默认为请详细描述这张图片的内容,},},required:[image_path],},}]defencode_image(image_path:str)-str:pathPath(image_path)ifnotpath.exists():raiseFileNotFoundError(f图片文件不存在:{image_path})mime_type,_mimetypes.guess_type(str(path))ifmime_typeisNoneornotmime_type.startswith(image/):mime_typeimage/pngdatapath.read_bytes()b64base64.b64encode(data).decode(ascii)returnfdata:{mime_type};base64,{b64}defcall_mimo(image_path:str,prompt:str)-str:config_get_config()data_urlencode_image(image_path)body{model:config[model],messages:[{role:user,content:[{type:text,text:prompt},{type:image_url,image_url:{url:data_url}},],}],}resphttpx.post(f{config[base_url]}/chat/completions,headers{Authorization:fBearer{config[api_key]},Content-Type:application/json,},jsonbody,timeout60.0,)ifresp.status_code!200:returnfMiMo API 调用失败: HTTP{resp.status_code}\n{resp.text[:500]}dataresp.json()contentdata.get(choices,[{}])[0].get(message,{}).get(content,)ifnotcontent:returnMiMo 返回空内容。该模型可能不支持视觉输入。returncontentdefsend_json(data:dict)-None:sys.stdout.write(json.dumps(data,ensure_asciiFalse)\n)sys.stdout.flush()defhandle_request(msg:dict)-None:msg_idmsg.get(id)methodmsg.get(method,)paramsmsg.get(params,{})ifmethodinitialize:send_json({jsonrpc:2.0,id:msg_id,result:{protocolVersion:2024-11-05,capabilities:{tools:{}},serverInfo:{name:mimo-vision,version:1.0.0},},})returnifmethodtools/list:send_json({jsonrpc:2.0,id:msg_id,result:{tools:TOOLS}})returnifmethodtools/call:tool_nameparams.get(name,)argumentsparams.get(arguments,{})iftool_namedescribe_image:try:image_patharguments[image_path]promptarguments.get(prompt,请详细描述这张图片的内容)result_textcall_mimo(image_path,prompt)send_json({jsonrpc:2.0,id:msg_id,result:{content:[{type:text,text:result_text}]},})exceptFileNotFoundErrorase:send_json({jsonrpc:2.0,id:msg_id,result:{content:[{type:text,text:str(e)}]},})exceptExceptionase:send_json({jsonrpc:2.0,id:msg_id,result:{content:[{type:text,text:f调用 MiMo API 出错:{e}}]},})returnsend_json({jsonrpc:2.0,id:msg_id,error:{code:-32601,message:fUnknown tool:{tool_name}},})returnifmsg_idisNone:returnsend_json({jsonrpc:2.0,id:msg_id,error:{code:-32601,message:fUnknown method:{method}},})defmain()-None:forlineinsys.stdin:lineline.strip()ifnotline:continuetry:msgjson.loads(line)handle_request(msg)exceptjson.JSONDecodeError:passif__name____main__:main()2.2 安装依赖pip install httpx第三步配置 MCP 服务器方式 A推荐用 claude mcp 命令一键添加在终端执行claude mcp add mimo-vision--pythonC:/Users/你的用户名/mcp-mimo-vision/server.py然后手动添加环境变量打开C:\Users\你的用户名\.claude.json找到mimo-vision配置把env: {}改成env:{MIMO_API_KEY:你的MiMo_API_Key填这里,MIMO_MODEL:mimo-v2.5}方式 B手动创建 .mcp.json在C:\Users\你的用户名\.claude\目录下创建.mcp.json文件{mcpServers:{mimo-vision:{command:python,args:[C:/Users/你的用户名/mcp-mimo-vision/server.py],env:{MIMO_API_KEY:你的MiMo_API_Key填这里,MIMO_MODEL:mimo-v2.5}}}}路径里的反斜杠\要换成正斜杠/否则 JSON 解析报错。如果python命令找不到改用 Python 的完整路径command: C:/Users/你的用户名/AppData/Local/Programs/Python/Python312/python.exe第四步验证关闭所有 Claude Code 窗口重新打开。在终端输入claude mcp list看到这行就说明成功了mimo-vision: python C:/Users/.../server.py - ✓ Connected如果显示✗ Disconnected检查pip install httpx装了没有.mcp.json里的路径和 API Key 写对了没有Python 能不能在终端直接用python命令调用试试python --version第五步使用方式一粘贴图片到对话打开 Claude CodeCtrlV粘贴图片Claude Code 自动保存到本地缓存。然后说读取这张图片的内容流程MiMo MCP 收到describe_image调用MiMo 看图返回文字描述DeepSeek 基于文字描述回答你的问题全程无感就像 DeepSeek 本来就能看图一样。方式二指定本地图片路径claude分析 C:\screenshots\error.png 里的报错信息给出修复方案Claude Code 会自动调用describe_image工具。方式三备选不用 Claude Code纯 Python 直接调如果只想认图不需要 AI 编程环境这个精简版直接跑importbase64importhttpxdefdescribe_image(image_path,api_key,modelmimo-v2.5):withopen(image_path,rb)asf:b64base64.b64encode(f.read()).decode(ascii)resphttpx.post(https://api.xiaomimimo.com/v1/chat/completions,headers{Authorization:fBearer{api_key}},json{model:model,messages:[{role:user,content:[{type:text,text:请详细描述这张图片},{type:image_url,image_url:{url:fdata:image/png;base64,{b64}}}]}]},timeout60.0)returnresp.json()[choices][0][message][content]print(describe_image(你的图片.png,sk-你的key))常见问题Q: MiMo 哪个模型支持图片模型识图支持mimo-v2-omni✅ 支持多模态专精mimo-v2.5✅ 支持mimo-v2.5-pro❌ 不支持mimo-v2-pro❌ 不支持推荐用mimo-v2.5速度比 omni 快。需要更强识别能力选mimo-v2-omni。Q: 报错 “No endpoints found that support image input”模型选错了。把MIMO_MODEL改成mimo-v2.5或mimo-v2-omni。Q: Python 报 SSL 错误Windows 常见Windows 上 Anaconda Python 的 SSL 库有时跟 MiMo 服务器握手失败。解决方案# 方法1用系统 Python 而不是 Anaconda 的where python# 看看有几个 Python换一个# 方法2用 curl 替代MiMo 支持 curl 直接调用Q: 图片太大怎么办MiMo 单次限制约 20MB。超了先压缩fromPILimportImage imgImage.open(大图.png)img.thumbnail((1920,1920))img.save(压缩后.png,quality85)装 Pillowpip install PillowQ: 免费额度用完了DeepSeek充值 10 块钱够个人用几个月API 单价极低MiMo目前注册送额度后续收费换其他免费视觉模型即可Q: 不想装 Claude Code 怎么办见上文「方式三」纯 Python 10 行代码就能看图无需任何额外工具。总结角色谁干的费用文本对话DeepSeek送额度 / 极便宜图片识别MiMo小米注册送额度编排调度Claude Code免费MCP 桥接190 行 Python免费DeepSeek 不会看图本质上只是缺一个视觉皮层。外挂免费视觉模型 MiMo通过 MCP模型上下文协议桥接到 Claude Code。整个过程不改变 DeepSeek 本身只是让它多了一个能看图的外援。零元搭建多模态 AI 编程环境完成。写于 2026-05-31 · 实测通过 · 每一步都亲测可跑

相关新闻