PageIndex：无向量数据库的推理型 RAG 基础设施

Fri, 08 May 2026 03:11:04 +0800

学习目标

读完这篇文章后，你应该能够：

解释为什么传统基于向量的 RAG 在复杂推理任务中存在瓶颈，以及 PageIndex 的推理型检索如何绕过这一限制。
理解 PageIndex 的核心设计：不建向量索引、不做文档分块、直接利用 LLM 推理能力做上下文感知识别。
掌握 PageIndex 的 MCP 协议集成方式和 API 调用方法，能够在自己的应用中添加 PageIndex 支持。
判断 PageIndex 适合哪些场景，不适合哪些场景，以及它与普通向量 RAG 的取舍。

一、项目概述

1.1 什么是 PageIndex

PageIndex（VectifyAI/PageIndex，29.4k Stars）是一个基于推理（Reasoning-based）的 RAG 框架。与传统 RAG 将文档切成片段、映射到高维向量空间不同，PageIndex 直接利用 LLM 的推理能力做文档索引和检索，声称可以实现"无向量数据库"（Vectorless）的 RAG 方案。

OpenKB：开源 LLM 知识库——无向量检索的长文档处理新范式

Wed, 29 Apr 2026 20:13:00 +0800

项目概览

OpenKB（Open LLM Knowledge Base）是一个 2026 年 4 月刚刚发布就登上 GitHub Trending 的开源项目，截至 4 月 29 日已收获 851 Stars 和 81 Forks。它将自己定位为"Scale to long documents • Reasoning-based retrieval • Native multi-modality • No Vector DB"的知识库系统——没有向量数据库，是它最显著的区别于传统 RAG（Retrieval-Augmented Generation）方案的特性。

PageIndex on Text Matrix

PageIndex：无向量数据库的推理型 RAG 基础设施

学习目标

一、项目概述

1.1 什么是 PageIndex

OpenKB：开源 LLM 知识库——无向量检索的长文档处理新范式

项目概览