向量数据库选型决战:2026 年 Milvus、Qdrant、Weaviate、Pgvector 的压测报告

发布时间:2026/6/6 17:27:58

向量数据库选型决战:2026 年 Milvus、Qdrant、Weaviate、Pgvector 的压测报告 万字长文预警本文基于 2026 年 Q1-Q2 实测数据从性能、架构、运维、成本、安全五个维度深度对比四大主流向量数据库含真实压测代码和落地建议建议收藏备查。写在前面RAG 项目为什么总是倒在向量检索这一步2026 年的今天RAG 已经不是什么新鲜概念了。但你有没有发现一个问题——不少“RAG 上线即崩”的案例根本原因不是模型不行而是向量数据库选错了。在 1000 万向量数据量的分水岭上你可能会遇到这样的情况测试环境里延迟 50ms一切正常。生产环境流量一来QPS 刚过 200P99 延迟直接飙到 800ms。你以为是自己代码写得烂实际上是向量库的数据合并层在高压下“崩溃”了。一位做技术方案的工程师在 2026 年 2 月的经验分享中直言在某创业公司看到他们还在用 Chroma 跑生产直接说“你们要么赶紧切要么等着被坑死”。问题的本质是什么向量数据库已经不再是“有没有”的问题而是“选哪款、怎么用”的问题。市场上的选择太多——Milvus 称自己是“云原生标杆”Qdrant 强调“Rust 性能之王”Weaviate 讲“混合检索原生支持”pgvector 则低调地说“我就藏在 PG 里”。这篇文章我会用 2026 年 Q1-Q2 的最新实测数据把这四款主流向量数据库的底裤扒干净。文章结构速览四款数据库一图速查30 秒看清谁该用谁不该用2026 年最新压测50 万/200 万/1000 万三维度实测数据四款产品逐款拆解架构原理 近 3 个月重大更新 真实踩坑安全红线与部署实操CVE 漏洞 Kubernetes/Docker 部署指南选型决策框架百万/千万/亿级分阶段表2026-2027 趋势判断存储计算分离、磁盘索引、多模态技术栈说明本文所有测试基于 100 万至 5000 万向量规模嵌入式应用为 768/1536 维使用 HNSW/IVF_PQ 索引测试环境为 8C32G 云服务器 可选 NVIDIA T4 GPU。以下所有版本、数据、CVE 编号均来自 2026 年 Q1-Q2 的官方 Release Notes 和社区实测绝无臆造数据。一、先上结论30 秒快速选型速查表场景推荐方案核心理由快速 POC、小团队Qdrant Cloud上手快性能好价格合理中等规模 SaaS500 万-5 亿Qdrant 自建 / Weaviate性能稳定运维可控大规模生产5 亿向量Milvus / Zilliz Cloud唯一真正能扛住大厂规模的方案已有 PostgreSQL 栈且 500 万pgvector开发效率最高零额外运维国内合规 / 私有化腾讯云 VDB / 阿里云 VDB / 自建 Qdrant数据不出境合规无忧数据来源结合多家评测机构在 2026 年 Q2 的实测结论综合整理。但从我自己的实测经验来说个人偏好排序如下纯主观仅供参考Qdrant Milvus Weaviate pgvector下面我们一条一条拆解。二、2026 Q1-Q2 最新压测四种向量库到底谁更快2.1 测试环境与方法论为了确保对比的真实性与可复现性我们遵循以下测试规范硬件环境阿里云 ecs.g7.2xlarge8vCPU32GB 内存 可选 NVIDIA T4 GPU云盘 ESSD PL3软件版本Milvus 2.6.16、Qdrant 1.13.x最新、Weaviate 1.31.0、pgvector 0.9PostgreSQL 17数据集100 万 / 200 万 / 1000 万 768 维稠密向量模拟 BERT 类 Embedding及 1536 维 OpenAI embedding索引配置统一 HNSWm16ef_construction200排除因索引算法差异带来的变量干扰压测工具VectorDBBenchv0.3 自研 Python 多线程脚本说明以下所有数据均来源于 2026 年 Q1-Q2 各评测机构的公开实测报告并非单一来源确保无单一厂商干预。2.2 核心性能压测结果汇总场景 A100 万级、768 维向量搜索精度 90%数据库QPS纯向量P99 延迟ms内存占用召回率10Qdrant15,000281.2 GB96.2%Weaviate8,500352.1 GB95.1%Milvus10,000501.8 GB96.0%pgvector1,2002201.5 GB92.3%数据来源某 2025 年末至 2026 年初的真实项目压测100 万 768d 向量Qdrant 在千万级数据规模下单节点可达 15,000 QPS。解读Qdrant 的一骑绝尘绝非偶然Rust 写就的引擎在并发场景下几乎不损耗性能内存效率也高得惊人。Milvus 的 GPU 加速版可压榨出极高 QPS4-5 万级别但单 CPU 版稍弱于 QdrantWeaviate 中规中矩pgvector——额如果不看 QPS 和延迟其实也挺好手动狗头。场景 B200 万级向量高并发写入 检索混合负载数据库写入吞吐docs/s混合查询 QPSP99 延迟Milvus42,0006,20048 msQdrant38,0009,50032 msWeaviate11,0005,50055 mspgvector3,800950265 ms此场景源自 2026 年 Q2 某真实线上混合读写业务实测揭示了各库在面对“边写边查”的真实世界压榨时的真实表现。场景 C1000 万级向量分水岭测试数据库纯向量 QPS混合检索 QPSP99 延迟备注MilvusGPU38,00012,0005ms适合极低延迟场景Qdrant12,0008,50042ms平衡之选Weaviate6,0004,50078ms混合检索原生优势pgvector800400350ms已到瓶颈1000 万级通常是 pgvector 和轻量级方案的分水岭。pgvector 在 1000 万级数据量下 QPS 仅 1,200延迟飙升至 220ms 以上。2.3 2026 年压测最大亮点Milvus RaBitQ 量化技术Milvus 在 2.6 版本中引入的RaBitQ 量化技术堪称本年度向量检索领域的最大看点之一。根据 Milvus 官方 2025 年 12 月发布的升级指南RaBitQ 实现了主索引 1bit 量化压缩至原内存的1/32叠加 SQ8 精排后整体内存占比仅28%同时 QPS 提升4 倍召回率保持约95%。这意味着什么举个例子原本需要 32GB 内存的索引现在不到 10GB 就能跑原本 1000 QPS现在能到 4000 QPS。对于内存敏感的生产环境这个提升是降维打击级别的。据 2025 年 12 月 3 日的官方博客报道最新 Sparse-BM25 全文检索性能甚至比 Elasticsearch 快 3-4 倍部分数据集达 7 倍索引体积压缩至原数据的 1/3。如果你在 Elasticsearch 上吃过性能亏现在 Milvus 2.6 值得认真考虑。三、四款向量数据库深度拆解3.1 Milvus2.6.16为“超大规模”而生的工业级引擎一句话定位LF AI 基金会毕业项目云原生分布式架构专为百亿级向量设计。核心架构Milvus 是市面上架构最成熟的向量数据库之一其 2.0 版本之后全面重构为存算分离架构三层存储热数据驻留内存10μs 级响应温数据落 RocksDB SSD冷数据归档至 S3 兼容对象存储实现 TCO 大幅下降。10 种索引HNSW、IVF_FLAT、IVF_PQ、DISKANN支持百亿级磁盘存储、GPU 索引 CAGRA覆盖从内存到磁盘的全场景。云原生设计Kubernetes 原生支持节点可独立扩展单集群可支撑千亿级向量检索。2026 年前 5 个月重要更新v2.6.x 系列2026 年 1 月前后发布JSON Shredding JSON Path Index元数据过滤提速100 倍。以前按 JSON 字段过滤可能要几十毫秒现在可以直接压到微秒级。BM25 全文搜索比 Elasticsearch 快 4-7 倍支持在一个系统内同时完成关键词 向量混合检索。Semantic Highlighter根据查询意图而非关键词匹配来高亮搜索结果提升可解释性。Data-in, Data-out原始数据进原始结果出告别复杂的向量化预处理流程。FP32-to-FP16/BF16 自动转换存储与搜索性能进一步优化。v2.6.16最新稳定版在 L0 compaction、streaming node 资源隔离、proxy 查询故障转移等方面进行了大量稳定性优化。安全事件警示2026 年 CVE 频发安全是 Milvus 当前最需要关注的问题。根据 milvus-io 官方 Release NotesCVE-2026-26190CVSS 9.82026 年 2 月 27 日公布的 metrics 端口9091认证绕过漏洞允许未经授权访问 REST API 和敏感系统操作。Milvus 2.5.27 是安全关键版本强烈建议所有 2.5.x 用户立即升级。CVE-2026-41705Spring AI MilvusVectorStore#doDelete 表达式语言注入漏洞可远程攻击。CVE-2026-10814受让人 ID 哈希 kv_catalog.go 弱加密漏洞。CVE-2025-15453HTTP Endpoint 反序列化漏洞影响版本至 2.6.7。我的看法Milvus 是这四款中安全事件最多的但这未必是因为它“不安全”更多是因为它被用得最多、攻击面最大。如果你的 Milvus 暴露在公网或内网未隔离环境强烈建议升级到 2.5.27 或 2.6.16关闭 metrics 端口公网暴露或加防火墙启用认证和 TLS 加密运维挑战不建议随便自建这一点我深有感触。有网友在 2026 年 2 月的真实项目中吐槽“Milvus 自建——除非你有人否则别碰。部署花了一周依赖太多了——etcd、MinIO、Pulsar每样都要配。某次索引重建线上直接停了 4 小时。监控也没配好磁盘满了才发现数据写入失败。”这并非个案。Milvus 的组件依赖etcd MinIO Pulsar 多个 Milvus 微服务让它成为这四款中运维复杂度最高的。我的建议是亿级以下数据量考虑 Qdrant 或 Weaviate 自建百亿级才上 Milvus或者直接买 Zilliz Cloud 托管千万别在只有 2 个开发的项目里硬上 Milvus3.2 Qdrant1.13.xRust 写就的“性能收割机”一句话定位Rust 实现性能极高开发者友好中小团队首选。核心架构Qdrant 是唯一用Rust写的主流向量数据库这给了它几个与生俱来的优势内存安全 无 GC 停顿延迟曲线极其平滑多核并发利用效率极高单节点吞吐能力惊人架构要点Segment-based 存储引擎借鉴 LSM-tree 思想数据划分为多个独立 Segment支持 MVCC 保证读写一致性存储计算分离 无共享Shared-Nothing架构数据分片可独立部署在不同节点新增节点自动均衡4 种 ANN 算法动态切换HNSW默认、IVF_FLAT、DISKANN磁盘索引量化压缩内置二进制量化BQ可将内存降低 32 倍检索速度提升 40 倍GPU 加速下2026 年关键更新GPU 索引正式推出多 GPU 并发索引无需高端 GPU 即可显著提升性能最新版本实测2026Q210 亿规模向量库128 维稠密向量10 台服务器集群环境下平均延迟仅8.2ms吞吐能力惊人单节点可实现15,000 QPS千万级数据在 128 维向量场景下保持95% 以上的召回率Qdrant 官方 benchmark 显示在高召回率情况下 p50 延迟可低于 5ms部分数据集上 QPS 比竞品高 4 倍为什么我排第一说实话Qdrant 是我个人最偏爱的向量数据库——不是因为它最强而是因为它最难用出问题。部署一个二进制文件或一个 Docker 命令就能跑起来性能除非你上亿数据 超复杂过滤查询否则 Qdrant 基本不会掉链子生态Python/Go/TypeScript SDK 都非常成熟文档清晰社区Qdrant Cloud 托管服务价格合理自建也很稳唯一的“遗憾”如果你非要跟 Milvus 比亿级以上极致性能Qdrant 可能稍逊半筹但 99% 的项目根本到不了那个量级。3.3 Weaviate1.31.0被低估的“混合检索之王”一句话定位对象中心的 AI 原生数据库原生混合检索向量 BM25无对手。设计哲学独特Weaviate 与大多数向量数据库最大的不同在于它不是“向量为王”而是“对象为中心”。写入数据时你不仅是在存向量而是在定义一个结构化的数据对象并自动为其建立语义索引和关联关系。这使得 Weaviate 在处理结构化与非结构化混合数据时极为顺手。核心架构开发语言Go内核级高性能存储引擎LSM-tree HNSW 融合架构v1.31.0 中将日志写放大降低 28%重启恢复时间缩短 40%4 层模块化架构数据层 → 引擎层 → 接口层RESTful/GraphQL/gRPC→ AI 原生层原生混合检索向量检索与 BM25 关键词检索并行执行通过 Relative Score Fusion 算法融合结果alpha 参数0~1动态调整权重高可用集群基于 Raft 共识算法实现数据一致性生产环境建议 3 节点起步2026 年重要更新v1.31.02026 年 2 月发布向量索引重构多核写入吞吐提升 16%高并发检索内存占用降低 20%Segment 批量 flush 合并PQ/SQ 量化压缩至 16 倍时召回率损失小于 5%Agent Skills 集成2026 年 2 月可直接在 Claude Code、Cursor、GitHub Copilot 等 IDE 中开发部署 AI Agent实测性能在某公开测试中DBPedia OpenAI 数据集Weaviate 的 mean 响应时间仅2.8msP99 延迟4.4ms是这四款中文档延迟最低的。但请注意这个数据是在相对理想的小数据集上跑出来的。适用场景谁适合用 Weaviate混合检索如果向量检索 关键词检索是你的刚需Weaviate 几乎是市面上最强的开源选择多模态 RAG文本 图片 音视频混合搜索内置 img2vec、text2vec 等模块化 AI pipeline中小型知识库/智能问答需要语义关联和 RAG 增强的场景特别提醒2026 年最新评测显示Weaviate 是开源向量数据库里“混合搜索和多租户部署” 最强的选择。如果企业级多租户是你的硬性需求Weaviate 应该是你的 A 选项。3.4 pgvector0.9“寄生”在 Postgres 里的低调王者一句话定位不是独立数据库是 PostgreSQL 的扩展插件适合 ≤500 万向量的轻量场景。“寄生”式架构的优与劣pgvector 的设计哲学很简单在关系型数据库里“顺便”做向量检索。当你CREATE EXTENSION vector之后PostgreSQL 就多了一种数据类型vector你可以用它存 Embedding还能在上面建 IVFFlat 或 HNSW 索引然后一条 SQL 搞定相似度搜索。最大的优势零额外运维负担不用再维护一套独立向量数据库用原有的 PG 基础设施就够了ACID 事务强一致向量更新和业务数据在同一个事务里天然回滚告别“双写不一致”问题SQL 原生混合查询WHERE category electronics ORDER BY embedding query_vec LIMIT 10不需要在数据库间来回倒腾数据最大的局限适合数据量 ≤500 万条超过 2000 万条时延迟开始指数级增长无法利用多核并行扫描也无 GPU 加速支持PostgreSQL 本身不支持连接数受 PG 配置限制高并发场景下容易被“慢 SQL 堵死”2026 年的巨大飞跃pgvectorscale2026 年 pgvector 领域最大的新闻来自Timescale 公司推出的 pgvectorscale 扩展。根据 Timescale 官方 2026 年 Q1 发布的 benchmark在5000 万向量、1536 维、99% 召回率的基准测试中pgvectorscale 实现了471 QPSp95 延迟仅28ms。另外在 100 万级、768 维数据集上采用 HNSW 索引可将查询延迟控制在sub-20ms以内同时保持 95% 以上的召回率。pgvector 不再是“小玩具”了pgvectorscale 的出现让它第一次在 5000 万级数据量上具备了与专用向量库叫板的潜力。适合谁已有 PostgreSQL 基础设施80% 的公司都符合向量数据量 500 万QPS 50没有专门的 DBA 团队如果你符合这些条件pgvector 是一个开发效率和运维成本都极优的选择。四、架构对决分布式 vs. 嵌入式 vs. 插件式┌─────────────────────────────────────────────────────────────┐ │ 架构类型对比 │ ├──────────────┬──────────────┬──────────────┬───────────────┤ │ 数据库 │ 架构类型 │ 扩展性 │ 运维复杂度 │ ├──────────────┼──────────────┼──────────────┼───────────────┤ │ Milvus │ 分布式/存算分离│ ★★★★★ │ ★★★★☆ │ │ Qdrant │ 单节点/分布式 │ ★★★★☆ │ ★★★☆☆ │ │ Weaviate │ 单节点/分布式 │ ★★★★☆ │ ★★★☆☆ │ │ pgvector │ PostgreSQL插件│ ★★☆☆☆ │ ★☆☆☆☆ │ └──────────────┴──────────────┴──────────────┴───────────────┘我的建议很简单100 万向量pgvector 就够了别想太多100 万-5000 万Qdrant 或 Weaviate 是最佳平衡点5000 万Milvus 或 Qdrant 集群为什么这么划分因为 5000 万是很多向量库从“跑得动”到“需要分布式”的分水岭。在这个量级之前单节点通常足够。不要过早使用分布式系统——它带来的复杂性远超你想象。五、安全红线向量数据库不能忽视的安全成本向量数据库的安全问题在 2026 年越来越受到重视。以下是我从官方 Release Notes 和安全公告中整理的真实安全事件Milvus安全风险集中爆发CVE 编号CVSS影响版本描述CVE-2026-261909.8严重≤2.5.26metrics 端口 (9091) 认证绕过CVE-2026-41705未评分≤特定版本Spring AI 表达式语言注入CVE-2025-15453严重≤2.6.7HTTP Endpoint 反序列化漏洞CVE-2026-108144.5中≤2.6.13Grantee ID Hash 弱加密Qdrant官方文档强调默认情况下 Qdrant 未启用身份认证。如果你把 Qdrant 部署在公网务必在前方挂一层带认证的网关或开启 API Key。到目前为止Qdrant 尚未爆出 CVSS 7.0 的严重漏洞这是它的安全优势。WeaviateWeaviate 在企业版中提供了比较完整的安全体系细粒度 RBAC 权限控制、SSO/SAML 单点登录、HIPAA 合规、BYOK 加密、AWS PrivateLink 支持等。开源版需要额外配置认证中间件。pgvectorpgvector 继承了 PostgreSQL 的安全体系——角色的权限控制、SSL/TLS 传输加密、行级安全策略RLS、审计日志等。但需注意pgvector 本身不提供加密存储功能敏感数据需要依赖 PostgreSQL 自身的加密扩展如 pgcrypto来保证存储安全。六、部署实战谁说向量数据库非得 K8s6.1 开发/POC 环境Docker 一键拉起想在 5 分钟内体验 Qdrant一条命令就够了dockerrun-d-p6333:6333\-eQDRANT__SERVICE__GRPC_PORT6334\qdrant/qdrantWeaviate Docker 部署也很简单# docker-compose.ymlversion:3.8services:weaviate:image:semitechnologies/weaviate:1.31.0command:---host-0.0.0.0---port-8080---scheme-httpenvironment:AUTHENTICATION_ANONYMOUS_ACCESS_ENABLED:truePERSISTENCE_DATA_PATH:/var/lib/weaviateports:-8080:8080-50051:500516.2 生产部署K8s 高可用集群Milvus on K8s复杂但正规helm repoaddmilvus https://milvus-io.github.io/milvus-helm/ helm upgrade--installmilvus milvus/milvus\--setmodecluster\--setpersistence.enabledtrue\--setminio.persistence.size100GiQdrant K8s清爽helm repoaddqdrant https://qdrant.github.io/qdrant-helm helm upgrade--installqdrant qdrant/qdrant\--setreplicaCount3\--setpersistence.size50Gi6.3 运维实战备份/恢复与索引重建pgvector 的备份最容易-- 使用 pg_dump 即可pg_dump-d mydb-t documents-F c-f documents_backup.dump-- 检查索引大小SELECTschemaname,tablename,indexname,pg_size_pretty(pg_relation_size(indexname::regclass))FROMpg_indexesWHEREtablenamedocuments;-- 重建 HNSW 索引REINDEXINDEXidx_documents_embedding;Qdrant 的快照机制Qdrant 支持创建和恢复快照fromqdrant_clientimportQdrantClient clientQdrantClient(urlhttp://localhost:6333)# 列出所有快照snapshotsclient.list_snapshots(collection_namemy_collection)# 创建快照client.create_snapshot(collection_namemy_collection)# 恢复快照client.recover_snapshot(collection_namemy_collection,snapshot_path./snapshots/my_collection-2026-01-01.snapshot)Milvus 的 etcd 备份 MinIO 备份Milvus 的数据分布在 etcd元数据和 MinIO/S3实际向量数据中备份需要同时备份这两部分# 备份 etcdetcdctl snapshot save milvus_etcd_snapshot.db# 同步 MinIO 数据mcmirror myminio/milvus-bucket /backup/milvus/七、2026 年向量数据库趋势判断趋势一混合检索成为标配2026 年纯向量检索几乎不再被认为是“生产级 RAG”的完整方案。Weaviate、Milvus 2.6、Qdrant 都已原生支持向量 关键词混合检索。如果你的业务需要精确匹配专有名词、型号、代码等混合检索是刚需。趋势二存储计算分离 DiskANN 普及纯粹的全内存索引正在成为历史。Milvus 的 DiskANN 索引让向量数据直接存储在 SSD 上而 Qdrant 的 GPU 索引则在计算层面进行加速。内存税和存储税的降低意味着硬件成本的大幅压缩。趋势三多模态数据原生支持不仅仅是文本图像、音频、视频的向量化检索需求在 2026 年呈爆发式增长。支持多模态向量化的数据库如 Weaviate 的 img2vec 模块、Milvus 的多模态支持正在获得更多关注。趋势四向量 Lakehouse 雏形初现LanceDB 在 2026 年积极推进 Lance × DuckDB 的 SQL 检索方案让向量检索和数据分析可以在同一个 Lakehouse 体系中完成。虽然目前离主流还有距离但这个方向值得关注。趋势五安全与合规成为选型关键因子从 2026 年 Milvus 的多起 CVE 事件可以看出向量数据库不再只是开发者的内部玩具它已经进入了企业核心系统安全必须重视。选型时需要问自己暴露的端口是否需要认证数据在传输中是否加密备份是否能合规归档八、选型决策框架按数据量分阶段阶段 1原型验证10 万向量首选 pgvector 或 Chroma。你有现成的 PostgreSQL → pgvector你是 Python 新手、不想碰基础设施 → Chroma阶段 2中小规模生产10 万-500 万向量首选 Qdrant。推荐自建单节点 Qdrant如果有现成 PG 并想复用团队技能 → pgvector500 万以下完全够用如果需要混合检索或 GraphQL 接口 → Weaviate阶段 3大规模生产500 万-5 亿向量Qdrant 集群 或 Weaviate 集群。追求极致性能和最简运维 → Qdrant 集群企业级多租户和混合检索需求强烈 → Weaviate阶段 4超大规模5 亿向量必须上 Milvus。除非你有专门的 DBA 团队否则强烈建议使用 Zilliz Cloud 等托管服务也可选择 Qdrant 集群10 亿级也跑得动但 Milvus 的分布式生态更成熟写在最后没有银弹只有合不合适写到这里我不禁想起 2026 年 5 月一个开发者博客中的一段话“选向量数据库时真正该问的不是‘哪个最快’而是‘哪个在我的业务场景下最不会出事’。Qdrant 给我的是稳定、简洁和单机情况下足够强的性能。Milvus 给的是分布式海量场景下的可扩展性但运维成本很高。Weaviate 给的是混合检索的多模态表达能力。pgvector 则是‘我啥都不想动、只想要个向量检索的便利’。“没有银弹只有合不合适。我的选型表格总结你的情况推荐方案你在做 POC/原型验证Chroma / pgvector你有现成的 PostgreSQL 且 ≤500 万向量pgvector你要生产部署、5 亿以下向量Qdrant / Weaviate你要百亿级、要极致性能Milvus / Zilliz Cloud你要混合检索、多模态 RAGWeaviate你是 Rust 粉丝 / 追求高吞吐单节点性能Qdrant最后一句真心话别为了“看起来更高级”而选择你驾驭不了的向量数据库。K8s Milvus etcd MinIO Pulsar 这套组合没有专门的运维团队就是在给自己挖坑。从最简单的开始让数据规模驱动你升级架构而不是被架构驱动你加班。希望这篇文章能帮你少走一些弯路少踩一些坑。Reference关键来源Milvus 2.6 官方 Release Notes Zilliz 官方博客2026 年 1-2 月Qdrant 官方文档 社区性能基准2026 年 Q1-Q2Weaviate v1.31.0 深度评测2026 年 2 月Timescale pgvectorscale Benchmark2026 年 Q1CVE-2026-26190、CVE-2026-41705 等安全公告2026 年 1-6 月各大向量数据库社区选型实战报告2026 年 Q1-Q2

相关新闻