Postgres 结合 pgvector 与 Pinecone 对比：面向五千万向量的生产环境基准测试

你在网上看到的大多数“向量数据库对比”文章都写于 2023 年，当时 pgvector 还只是一个研究层面的新奇事物，而 Pinecone 则是默认选择。两年后，pgvector 能够处理我们曾认为只有 Pinecone 才能胜任的工作负载。我们在真实客户数据的生产环境下对两者进行了基准测试，结果改变了我们对向量基础设施的推荐方式。

这不是一篇营销文章。我们实际部署过这两种方案。我们有自己的观点。我们将向你展示具体数据。

太长不看版

对于使用 HNSW 索引且向量数量少于约 5,000 万的工作负载，Postgres + pgvector 在成本、运维简单性和查询灵活性方面优于 Pinecone，同时在延迟方面与之持平。 当向量数量超过 1 亿，且具有持续高每秒查询率、多区域复制和零运维需求时，Pinecone 的优势则非常明显。

如果你正在启动一个新的检索增强生成项目，且你的团队已经在使用 Postgres，那么除非有明确的反面证据，否则默认选择应该是 pgvector。我们将解释我们是如何得出这一结论的。

基准测试设置

我们在 2026 年初为一家美国客户交付的生产级法律文档检索增强生成系统上运行了此基准测试。文档语料库：230 万份法律文档中的 4,700 万个分块。嵌入模型：OpenAI text-embedding-3-large（3072 维）。工作负载：混合搜索（向量相似度 + 按日期范围、文档类型、司法管辖区进行的结构化过滤）。

硬件

Postgres 设置：

AWS RDS for PostgreSQL 16.2
db.r7g.4xlarge（16 vCPU，128GB 内存，ARM Graviton3 处理器）
1TB gp3 固态硬盘存储，预配置 12,000 IOPS
pgvector 0.7.0，配备 HNSW 索引
单可用区用于基准测试（生产环境：多可用区 + 只读副本）
成本：每月基础费用 1,420 美元 + 每月存储费用 115 美元 + 0 出站流量费 = 约每月 1,535 美元

Pinecone 设置：

Pinecone 标准层
用于索引的 p1.x4 节点（1 个副本）
4,700 万个向量，3072 维
成本：节点费用约每月 650 美元，加上检索查询产生的每 GB 0.05 美元的出站流量费
在我们的查询量下的总有效成本：约每月 1,800-2,100 美元

工作负载定义

三种反映真实生产流量的查询模式：

纯 Top-K 向量搜索。** 给定查询嵌入向量，返回最相似的 10 个向量。无过滤条件。（占生产流量的 40%。）
带过滤条件的 Top-K 搜索。** 返回最相似的 10 个向量，其中司法管辖区 IN ('CA', 'NY', 'TX') 且创建时间 > '2024-01-01'。（占生产流量的 45%。）
批量检索。通过已知的 ID 获取 100 个向量，用于批处理作业。（占生产流量的 15%。）

我们在三个并发级别下测量了每种模式：1 个并发查询、10 个并发和 50 个并发。每次测试在 60 秒的热身期后运行 5 分钟。

结果：延迟

数据为 P95 延迟，单位为毫秒。数值越低越好。

纯 Top-K 搜索（无过滤条件）