<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>图像生成 on Text Matrix</title><link>https://txtmix.com/tags/%E5%9B%BE%E5%83%8F%E7%94%9F%E6%88%90/</link><description>Recent content in 图像生成 on Text Matrix</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Sat, 23 May 2026 08:20:36 +0800</lastBuildDate><atom:link href="https://txtmix.com/tags/%E5%9B%BE%E5%83%8F%E7%94%9F%E6%88%90/index.xml" rel="self" type="application/rss+xml"/><item><title>SANA：线性扩散Transformer驱动的高分辨率图像生成</title><link>https://txtmix.com/posts/tech/sana-high-resolution-image-synthesis/</link><pubDate>Mon, 18 May 2026 19:56:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/sana-high-resolution-image-synthesis/</guid><description>&lt;h1 id="sana线性扩散transformer驱动的高分辨率图像生成">SANA：线性扩散Transformer驱动的高分辨率图像生成&lt;/h1>
&lt;p>说起高分辨率图像生成，很多人第一时间会想到 FLUX 或者 Stable Diffusion。但这两个模型要么体积庞大（FLUX-12B），要么生成速度感人。NVIDIA 实验室开源的 &lt;strong>SANA&lt;/strong> 给出了一种截然不同的路线——用线性注意力（Linear Attention）替换 Transformer 中的标准注意力机制，配合 32× 压缩率的 DC-AE 自编码器，在仅 1.6B 参数规模下实现 &lt;strong>4K 分辨率、20 倍体积压缩、100 倍速度提升&lt;/strong>。&lt;/p></description></item><item><title>Sana - NVIDIA高效高分辨率图像合成与视频生成框架</title><link>https://txtmix.com/posts/tech/nvlab-sana-efficient-image-video-generation/</link><pubDate>Mon, 18 May 2026 00:00:00 +0000</pubDate><guid>https://txtmix.com/posts/tech/nvlab-sana-efficient-image-video-generation/</guid><description>&lt;h1 id="sananvidia高效率高分辨率图像与视频生成框架">Sana：NVIDIA高效率高分辨率图像与视频生成框架&lt;/h1>
&lt;p>&lt;strong>Stars: 6,331&lt;/strong> | &lt;strong>今日: +447&lt;/strong> | &lt;strong>Python&lt;/strong>&lt;/p>
&lt;p>GitHub: &lt;a href="https://github.com/NVlabs/Sana" target="_blank" rel="noopener noreffer ">NVlabs/Sana&lt;/a>&lt;/p>
&lt;h2 id="一句话评价">一句话评价&lt;/h2>
&lt;p>Sana 是 NVIDIA MVFX 实验室出品的效率优先型图像/视频生成框架，支持 4K 分辨率、1.6B 参数模型可在 8GB GPU 显存运行，ICLR 2025 Oral / 2026 Oral 双 Oral 论文，并在 diffusers / SGLang / ComfyUI 均有原生集成。&lt;/p></description></item><item><title>GPT Image 2 提示词完全指南：四大开源库精华合集</title><link>https://txtmix.com/posts/tech/gpt-image-2-prompts-complete-guide/</link><pubDate>Fri, 01 May 2026 13:11:58 +0800</pubDate><guid>https://txtmix.com/posts/tech/gpt-image-2-prompts-complete-guide/</guid><description>&lt;blockquote>
&lt;p>&lt;strong>目标读者&lt;/strong>：已经在用 AI 生图，想把提示词从“能出图”提升到“更稳定、更可复用”的设计师、运营、独立开发者与内容创作者
&lt;strong>核心问题&lt;/strong>：四个热门 GPT Image 2 提示词仓库，到底该先看哪一个？优秀案例真正值得抄的是什么？如何把零散 prompt 提炼成自己的稳定模板？
&lt;strong>数据说明&lt;/strong>：文中仓库规模、 stars 与仓库结构，均以 2026 年 5 月 2 日可公开访问的 GitHub 页面为准；本文统一使用官方命名 &lt;strong>GPT Image 2&lt;/strong>，不沿用社区里的非官方代称
&lt;strong>预计阅读时间&lt;/strong>：18 - 25 分钟&lt;/p></description></item></channel></rss>