
Phi-3-mini-128k-instruct环境部署详解UbuntuDockervLLMChainlit完整步骤1. 环境准备与系统要求在开始部署Phi-3-mini-128k-instruct模型之前我们需要确保系统满足以下要求操作系统Ubuntu 20.04或22.04 LTS版本硬件配置至少16GB内存推荐32GB以上至少20GB可用磁盘空间NVIDIA GPU推荐RTX 3090或更高性能显卡软件依赖Docker 20.10或更高版本NVIDIA Container ToolkitPython 3.8或更高版本1.1 安装必要依赖首先更新系统并安装基础依赖sudo apt update sudo apt upgrade -y sudo apt install -y python3-pip python3-dev git curl wget安装Docker和NVIDIA Container Toolkit# 安装Docker sudo apt install -y docker.io sudo systemctl enable --now docker # 安装NVIDIA Container Toolkit distribution$(. /etc/os-release;echo $ID$VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list sudo apt update sudo apt install -y nvidia-container-toolkit sudo systemctl restart docker2. 部署Phi-3-mini-128k-instruct模型2.1 拉取预构建的Docker镜像我们将使用vLLM来高效部署Phi-3-mini-128k-instruct模型docker pull vllm/vllm-openai:latest2.2 启动模型服务容器运行以下命令启动模型服务docker run -d --gpus all \ -p 8000:8000 \ -v /path/to/models:/models \ --name phi3-mini \ vllm/vllm-openai:latest \ --model microsoft/Phi-3-mini-128k-instruct \ --dtype auto \ --max-model-len 128000 \ --tensor-parallel-size 1参数说明--gpus all使用所有可用的GPU-p 8000:8000将容器端口映射到主机-v /path/to/models:/models模型存储路径替换为实际路径--model指定模型名称--max-model-len设置最大上下文长度2.3 验证模型服务检查服务是否正常运行curl http://localhost:8000/v1/models正常响应应显示模型信息{ object: list, data: [ { id: microsoft/Phi-3-mini-128k-instruct, object: model, created: 1710000000, owned_by: vllm } ] }3. 使用Chainlit构建前端界面3.1 安装Chainlit创建一个Python虚拟环境并安装Chainlitpython3 -m venv phi3-env source phi3-env/bin/activate pip install chainlit openai3.2 创建Chainlit应用创建一个名为phi3_app.py的文件import chainlit as cl from openai import OpenAI client OpenAI(base_urlhttp://localhost:8000/v1, api_keyno-key) cl.on_message async def main(message: cl.Message): response client.chat.completions.create( modelmicrosoft/Phi-3-mini-128k-instruct, messages[ {role: system, content: You are a helpful AI assistant.}, {role: user, content: message.content} ], temperature0.7, max_tokens2048 ) await cl.Message(contentresponse.choices[0].message.content).send()3.3 启动Chainlit应用运行以下命令启动前端界面chainlit run phi3_app.py -w在浏览器中访问http://localhost:8000即可与模型交互。4. 常见问题解决4.1 模型加载失败如果模型服务无法启动检查日志docker logs phi3-mini常见问题显存不足尝试减小--max-model-len值模型下载失败确保网络连接正常或手动下载模型到本地路径4.2 Chainlit连接问题如果Chainlit无法连接到模型服务确认模型服务正在运行docker ps检查端口是否正确映射确保Chainlit配置中的base_url正确4.3 性能优化建议对于多GPU环境增加--tensor-parallel-size参数调整--max-model-len以适应不同上下文长度需求使用--quantization参数进行量化以降低显存占用5. 总结通过本教程我们完成了Phi-3-mini-128k-instruct模型在Ubuntu系统上的完整部署流程包括系统环境准备与依赖安装使用Docker和vLLM部署模型服务构建Chainlit前端界面常见问题排查与性能优化Phi-3-mini-128k-instruct作为一个轻量级但性能强大的模型特别适合需要长上下文支持的场景。通过vLLM的高效推理和Chainlit的友好界面我们可以轻松地将模型能力集成到各种应用中。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。