<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>FP8 on Text Matrix</title><link>https://txtmix.com/tags/fp8/</link><description>Recent content in FP8 on Text Matrix</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Sat, 23 May 2026 08:55:34 +0800</lastBuildDate><atom:link href="https://txtmix.com/tags/fp8/index.xml" rel="self" type="application/rss+xml"/><item><title>DeepGEMM：深势科技6577 Stars的高性能FP8 GEMM内核库——从入门到精通</title><link>https://txtmix.com/posts/tech/deepgemm-high-performance-fp8-gemm-kernels/</link><pubDate>Sun, 19 Apr 2026 21:00:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/deepgemm-high-performance-fp8-gemm-kernels/</guid><description>&lt;h1 id="deepgemm深势科技6577-stars的高性能fp8-gemm内核库从入门到精通">DeepGEMM：深势科技6577 Stars的高性能FP8 GEMM内核库——从入门到精通&lt;/h1>
&lt;blockquote>
&lt;p>&lt;strong>目标读者&lt;/strong>：GPU内核工程师、深度学习框架开发者、高性能计算研究员、LLM推理优化工程师
&lt;strong>预计阅读时间&lt;/strong>：60-80分钟
&lt;strong>前置知识&lt;/strong>：CUDA编程基础、GEMM计算原理、深度学习训练/推理流程
&lt;strong>难度定位&lt;/strong>：⭐⭐⭐⭐ 专家设计&lt;/p></description></item></channel></rss>