
Lychee-Rerank部署教程Kubernetes集群中部署高可用rerank微服务1. 项目概述Lychee-Rerank是一个基于Qwen2.5-1.5B模型的本地检索相关性评分工具专门用于处理查询与文档的匹配度打分任务。这个工具完全在本地运行不需要网络连接确保了数据隐私和安全。核心功能特点支持自定义指令、查询语句和候选文档集输出按相关性分数降序排列的结果提供可视化进度条和颜色分级显示纯本地推理无网络依赖无使用次数限制适用场景文档检索系统中的相关性排序智能问答系统中的答案匹配内容推荐系统中的相似度计算任何需要查询-文档匹配度评分的场景2. 环境准备与要求在开始部署之前请确保你的环境满足以下要求2.1 系统要求Kubernetes集群版本1.20至少8GB可用内存20GB可用存储空间NVIDIA GPU可选推荐用于加速推理2.2 必要工具确保已安装以下工具kubectlKubernetes命令行工具HelmKubernetes包管理器Docker容器运行时2.3 模型文件准备下载Qwen2.5-1.5B模型权重文件# 创建模型存储目录 mkdir -p /data/models/lychee-rerank # 下载模型文件请替换为实际下载链接 wget -O /data/models/lychee-rerank/model.safetensors 模型下载链接3. Kubernetes部署步骤3.1 创建命名空间首先为Lychee-Rerank创建一个独立的命名空间# lychee-rerank-namespace.yaml apiVersion: v1 kind: Namespace metadata: name: lychee-rerank labels: name: lychee-rerank应用配置kubectl apply -f lychee-rerank-namespace.yaml3.2 创建配置文件创建ConfigMap存储应用配置# lychee-configmap.yaml apiVersion: v1 kind: ConfigMap metadata: name: lychee-rerank-config namespace: lychee-rerank data: config.yaml: | model_path: /app/models/model.safetensors device: cuda # 或 cpu batch_size: 8 max_length: 512 temperature: 0.73.3 创建持久化存储创建PersistentVolumeClaim用于模型存储# lychee-pvc.yaml apiVersion: v1 kind: PersistentVolumeClaim metadata: name: lychee-model-pvc namespace: lychee-rerank spec: accessModes: - ReadWriteMany resources: requests: storage: 20Gi storageClassName: standard3.4 部署应用创建Deployment配置# lychee-deployment.yaml apiVersion: apps/v1 kind: Deployment metadata: name: lychee-rerank namespace: lychee-rerank labels: app: lychee-rerank spec: replicas: 2 selector: matchLabels: app: lychee-rerank template: metadata: labels: app: lychee-rerank spec: containers: - name: lychee-rerank image: lychee-rerank:latest # 替换为实际镜像 ports: - containerPort: 8501 volumeMounts: - name: model-storage mountPath: /app/models - name: config mountPath: /app/config resources: requests: memory: 8Gi cpu: 2 limits: memory: 12Gi cpu: 4 volumes: - name: model-storage persistentVolumeClaim: claimName: lychee-model-pvc - name: config configMap: name: lychee-rerank-config3.5 创建服务暴露应用服务# lychee-service.yaml apiVersion: v1 kind: Service metadata: name: lychee-rerank-service namespace: lychee-rerank spec: selector: app: lychee-rerank ports: - protocol: TCP port: 80 targetPort: 8501 type: LoadBalancer3.6 应用所有配置一次性应用所有配置kubectl apply -f lychee-rerank-namespace.yaml kubectl apply -f lychee-configmap.yaml kubectl apply -f lychee-pvc.yaml kubectl apply -f lychee-deployment.yaml kubectl apply -f lychee-service.yaml4. 验证部署4.1 检查Pod状态kubectl get pods -n lychee-rerank预期输出应该显示所有Pod都处于Running状态。4.2 检查服务状态kubectl get svc -n lychee-rerank4.3 访问应用获取服务的外部IPkubectl get svc lychee-rerank-service -n lychee-rerank -o jsonpath{.status.loadBalancer.ingress[0].ip}通过浏览器访问该IP地址即可使用Lychee-Rerank工具。5. 使用指南5.1 输入配置指令Instruction自定义评分规则默认为基于查询检索相关文档示例找出与人工智能相关的文档查询Query输入待匹配的查询语句示例什么是机器学习的基本概念候选文档每行输入一条候选文档支持批量输入多条文档示例机器学习是人工智能的一个分支。 深度学习是机器学习的一个子领域。 Python是一种编程语言。 神经网络模仿人脑的工作方式。5.2 计算评分点击「计算相关性分数」按钮系统会批量计算每条文档与查询的相关性分数使用进度条显示处理进度实时显示处理状态5.3 查看结果结果页面显示排名Rank文档的相关性排名分数保留6位小数的相关性分数颜色标识绿色分数 0.8高相关性橙色分数 0.4-0.8中等相关性红色分数 0.4低相关性进度条直观展示分数占比文档内容以代码块形式展示便于查看6. 高级配置6.1 资源调整根据实际需求调整资源分配# 在Deployment中调整resources部分 resources: requests: memory: 12Gi cpu: 4 nvidia.com/gpu: 1 # 如果使用GPU limits: memory: 16Gi cpu: 8 nvidia.com/gpu: 16.2 自动扩缩容配置Horizontal Pod Autoscaler# lychee-hpa.yaml apiVersion: autoscaling/v2 kind: HorizontalPodAutoscaler metadata: name: lychee-rerank-hpa namespace: lychee-rerank spec: scaleTargetRef: apiVersion: apps/v1 kind: Deployment name: lychee-rerank minReplicas: 2 maxReplicas: 10 metrics: - type: Resource resource: name: cpu target: type: Utilization averageUtilization: 706.3 监控配置集成监控和日志# 添加sidecar容器用于日志收集 - name: log-sidecar image: fluentd:latest volumeMounts: - name: app-logs mountPath: /var/log/lychee7. 故障排除7.1 常见问题Pod启动失败检查模型文件路径是否正确验证存储卷挂载是否正确服务无法访问检查Service配置验证网络策略性能问题调整batch_size参数考虑使用GPU加速7.2 日志查看# 查看Pod日志 kubectl logs -f pod-name -n lychee-rerank # 查看Deployment状态 kubectl describe deployment lychee-rerank -n lychee-rerank8. 总结通过本教程你已经成功在Kubernetes集群中部署了高可用的Lychee-Rerank微服务。这个部署方案提供了核心优势高可用性多副本部署确保服务稳定性弹性伸缩根据负载自动调整资源易于维护容器化部署简化管理资源隔离独立命名空间确保环境整洁最佳实践建议定期备份模型文件和配置监控资源使用情况并及时调整设置合适的资源限制防止资源耗尽定期更新镜像版本获取最新功能现在你可以通过浏览器访问部署好的Lychee-Rerank服务开始使用这个强大的本地检索相关性评分工具了。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。