<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>PageIndex on Text Matrix</title><link>https://txtmix.com/tags/pageindex/</link><description>Recent content in PageIndex on Text Matrix</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Sat, 23 May 2026 08:55:34 +0800</lastBuildDate><atom:link href="https://txtmix.com/tags/pageindex/index.xml" rel="self" type="application/rss+xml"/><item><title>PageIndex：无向量数据库的推理型 RAG 基础设施</title><link>https://txtmix.com/posts/tech/pageindex-vectorless-reasoning-rag-guide/</link><pubDate>Fri, 08 May 2026 03:11:04 +0800</pubDate><guid>https://txtmix.com/posts/tech/pageindex-vectorless-reasoning-rag-guide/</guid><description>&lt;h2 id="学习目标">学习目标&lt;/h2>
&lt;p>读完这篇文章后，你应该能够：&lt;/p>
&lt;ol>
&lt;li>解释为什么传统基于向量的 RAG 在复杂推理任务中存在瓶颈，以及 PageIndex 的推理型检索如何绕过这一限制。&lt;/li>
&lt;li>理解 PageIndex 的核心设计：不建向量索引、不做文档分块、直接利用 LLM 推理能力做上下文感知识别。&lt;/li>
&lt;li>掌握 PageIndex 的 MCP 协议集成方式和 API 调用方法，能够在自己的应用中添加 PageIndex 支持。&lt;/li>
&lt;li>判断 PageIndex 适合哪些场景，不适合哪些场景，以及它与普通向量 RAG 的取舍。&lt;/li>
&lt;/ol>
&lt;hr>
&lt;h2 id="一项目概述">一、项目概述&lt;/h2>
&lt;h3 id="11-什么是-pageindex">1.1 什么是 PageIndex&lt;/h3>
&lt;p>&lt;strong>PageIndex&lt;/strong>（&lt;a href="https://github.com/VectifyAI/PageIndex" target="_blank" rel="noopener noreffer ">VectifyAI/PageIndex&lt;/a>，29.4k Stars）是一个基于推理（Reasoning-based）的 RAG 框架。与传统 RAG 将文档切成片段、映射到高维向量空间不同，PageIndex 直接利用 LLM 的推理能力做文档索引和检索，声称可以实现&amp;quot;无向量数据库&amp;quot;（Vectorless）的 RAG 方案。&lt;/p></description></item><item><title>OpenKB：开源 LLM 知识库——无向量检索的长文档处理新范式</title><link>https://txtmix.com/posts/tech/openkb-open-llm-knowledge-base-guide/</link><pubDate>Wed, 29 Apr 2026 20:13:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/openkb-open-llm-knowledge-base-guide/</guid><description>&lt;h2 id="项目概览">项目概览&lt;/h2>
&lt;p>OpenKB（Open LLM Knowledge Base）是一个 2026 年 4 月刚刚发布就登上 GitHub Trending 的开源项目，截至 4 月 29 日已收获 &lt;strong>851 Stars&lt;/strong> 和 &lt;strong>81 Forks&lt;/strong>。它将自己定位为&amp;quot;Scale to long documents • Reasoning-based retrieval • Native multi-modality • No Vector DB&amp;quot;的知识库系统——没有向量数据库，是它最显著的区别于传统 RAG（Retrieval-Augmented Generation）方案的特性。&lt;/p></description></item></channel></rss>