VLLM on Text Matrix

MinivLLM：从零理解vLLM推理引擎的完整指南

Tue, 12 May 2026 10:50:00 +0800

MinivLLM：从零理解 vLLM 推理引擎的完整指南

如果想理解 vLLM 背后的工程原理，却没有数万平方米的代码库让你望而生畏，MinivLLM 或许是一个合适的起点。这个仓库基于 Nano-vLLM，从头实现了一个最小化的 vLLM 推理引擎，将完整的技术路径拆解为六个步骤——从最基础的神经网络层，到最终的调度器和 Engine 顶层 API，每一步都有对应的代码和中文学习指南。

RTX 3090 本地运行 LLM 实战：vLLM 与 llama.cpp 双引擎对比

Wed, 29 Apr 2026 20:35:22 +0800

RTX 3090 本地运行 LLM 实战：vLLM 与 llama.cpp 双引擎对比

前言

消费级 GPU 跑大语言模型，这事在 2024 年还属于"勉强能跑但体验糟糕"的范畴。到了 2026 年，量化技术、工程优化和推理引擎的共同进步，让这个目标变得真正实用了。

DFlash：块扩散模型加速LLM推理——让大模型推理速度提升2-3倍

Fri, 17 Apr 2026 16:35:00 +0800

DFlash：块扩散模型加速LLM推理

目标读者：LLM推理优化工程师、ML平台架构师、MLOps实践者 前置知识：深度学习基础、LLM原理、对投机解码有基本了解 技术栈：Python / PyTorch / vLLM / SGLang / Transformers / MLX 难度定位：⭐⭐⭐⭐ 专家设计

Pi Mono：统一LLM API的AI Agent全栈工具箱

Mon, 06 Apr 2026 11:30:00 +0800

Pi Mono：统一LLM API的AI Agent全栈工具箱

§1 学习目标

通过本文，您将掌握：

Pi Mono的核心功能与架构设计
如何使用Pi Mono的编码Agent CLI
统一LLM API的配置与使用
TUI与Web UI的部署方法
Slack机器人与vLLM Pod的集成
最佳实践与开发扩展指南

§2 原理分析

2.1 什么是Pi Mono？

Pi Mono（GitHub: badlogic/pi-mono）是一款开源AI Agent工具箱，由知名开发者badlogic创建。该工具箱将多个AI开发组件整合到一个统一的框架中：

Pi Monorepo：开源 AI Agent 工具包专家级技术文档

Mon, 30 Mar 2026 13:03:00 +0800

Pi Monorepo：开源 AI Agent 工具包专家级技术文档

预计阅读时间：35分钟 | 难度：⭐⭐⭐⭐

目标读者：想要掌握 Pi Monorepo 的开发者、AI 应用工程师和技术决策者