<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Quantization on Text Matrix</title><link>https://txtmix.com/tags/quantization/</link><description>Recent content in Quantization on Text Matrix</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Sat, 23 May 2026 08:55:34 +0800</lastBuildDate><atom:link href="https://txtmix.com/tags/quantization/index.xml" rel="self" type="application/rss+xml"/><item><title>Quantization 量化技术完全指南：从原理到 LLM 实战</title><link>https://txtmix.com/posts/tech/llm/quantization-llm-model-compression-guide/</link><pubDate>Sun, 29 Mar 2026 23:28:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/llm/quantization-llm-model-compression-guide/</guid><description>&lt;hr>
&lt;h2 id="一先看一个惊人的事实">一、先看一个惊人的事实&lt;/h2>
&lt;p>&lt;strong>Qwen-3-Coder-Next&lt;/strong> 是一个 800 亿参数的模型：&lt;/p>
&lt;ul>
&lt;li>&lt;strong>体积：159.4GB&lt;/strong>&lt;/li>
&lt;li>需要至少 159GB 内存才能运行&lt;/li>
&lt;li>这还不算「大型」模型——据说前沿模型超过 &lt;strong>1 万亿&lt;/strong>参数，需要 &lt;strong>2TB+&lt;/strong> 内存&lt;/li>
&lt;/ul>
&lt;p>&lt;strong>但如果我告诉你：&lt;/strong>&lt;/p></description></item></channel></rss>