<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>RTX 3090 on Text Matrix</title><link>https://txtmix.com/tags/rtx-3090/</link><description>Recent content in RTX 3090 on Text Matrix</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Sat, 23 May 2026 08:55:34 +0800</lastBuildDate><atom:link href="https://txtmix.com/tags/rtx-3090/index.xml" rel="self" type="application/rss+xml"/><item><title>RTX 3090 本地运行 LLM 实战：vLLM 与 llama.cpp 双引擎对比</title><link>https://txtmix.com/posts/tech/club-3090-rtx-3090-llm-local-serving-guide/</link><pubDate>Wed, 29 Apr 2026 20:35:22 +0800</pubDate><guid>https://txtmix.com/posts/tech/club-3090-rtx-3090-llm-local-serving-guide/</guid><description>&lt;h1 id="rtx-3090-本地运行-llm-实战vllm-与-llamacpp-双引擎对比">RTX 3090 本地运行 LLM 实战：vLLM 与 llama.cpp 双引擎对比&lt;/h1>
&lt;h2 id="前言">前言&lt;/h2>
&lt;p>消费级 GPU 跑大语言模型，这事在 2024 年还属于&amp;quot;勉强能跑但体验糟糕&amp;quot;的范畴。到了 2026 年，量化技术、工程优化和推理引擎的共同进步，让这个目标变得真正实用了。&lt;/p></description></item></channel></rss>