<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Transformer on Text Matrix</title><link>https://txtmix.com/tags/transformer/</link><description>Recent content in Transformer on Text Matrix</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Sat, 23 May 2026 08:55:34 +0800</lastBuildDate><atom:link href="https://txtmix.com/tags/transformer/index.xml" rel="self" type="application/rss+xml"/><item><title>TabPFN：表格数据的 GPT 时刻，革命性 AutoML 基础模型</title><link>https://txtmix.com/posts/tech/tabpfn-foundation-model-tabular-data-guide/</link><pubDate>Fri, 08 May 2026 03:11:04 +0800</pubDate><guid>https://txtmix.com/posts/tech/tabpfn-foundation-model-tabular-data-guide/</guid><description>&lt;h2 id="学习目标">学习目标&lt;/h2>
&lt;p>读完这篇文章后，你应该能够：&lt;/p>
&lt;ol>
&lt;li>理解 TabPFN 作为&amp;quot;表格数据基础模型&amp;quot;的设计理念，以及它与传统 AutoML 管道的本质区别。&lt;/li>
&lt;li>解释 TabPFN 如何通过 In-Context Learning 在不更新参数的情况下完成新任务。&lt;/li>
&lt;li>掌握 TabPFN 的 Python API 使用方法，能够在真实数据集上快速完成分类/回归任务。&lt;/li>
&lt;li>判断 TabPFN 与传统 AutoML（如 AutoGluon、FLAML）以及深度学习表格模型（如 FT-Transformer）的各自适用场景。&lt;/li>
&lt;li>了解 TabPFN 的当前限制和团队的未来路线图。&lt;/li>
&lt;/ol>
&lt;hr>
&lt;h2 id="一项目概述">一、项目概述&lt;/h2>
&lt;h3 id="11-什么是-tabpfn">1.1 什么是 TabPFN&lt;/h3>
&lt;p>&lt;strong>TabPFN&lt;/strong>（&lt;a href="https://github.com/PriorLabs/TabPFN" target="_blank" rel="noopener noreffer ">PriorLabs/TabPFN&lt;/a>，6.7k Stars）全称是 &amp;ldquo;Tabular Prior-Data Fitted Network&amp;rdquo;，是一个专为表格数据（Tabular Data）设计的预训练 Transformer 模型。&lt;/p></description></item><item><title>TabPFN: 表格数据的 Foundation Model 完整指南</title><link>https://txtmix.com/posts/tech/tabpfn-tabular-foundation-model-guide/</link><pubDate>Wed, 06 May 2026 10:07:31 +0800</pubDate><guid>https://txtmix.com/posts/tech/tabpfn-tabular-foundation-model-guide/</guid><description>&lt;h1 id="tabpfn-表格数据的-foundation-model-完整指南">TabPFN: 表格数据的 Foundation Model 完整指南&lt;/h1>
&lt;p>机器学习实践中，表格数据是最常见也最顽固的领域之一。长期以来，处理表格数据的标准流程是：选模型、调超参、反复训练——这一套下来，少则几十分钟，多则几天。面对一个陌生数据集，光是跑通一个 Baseline，就可能耗掉工程师大半天时间。&lt;/p></description></item><item><title>TensorLogic：Pedro Domingos论文实现·神经符号统一推理框架·FB15k-237基准MRR 0.347</title><link>https://txtmix.com/posts/tech/tensorlogic-ai-unified-reasoning-guide/</link><pubDate>Fri, 24 Apr 2026 19:10:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/tensorlogic-ai-unified-reasoning-guide/</guid><description>&lt;h1 id="tensorlogicpedro-domingos论文实现神经符号统一推理框架fb15k-237基准mrr-0347">TensorLogic：Pedro Domingos论文实现·神经符号统一推理框架·FB15k-237基准MRR 0.347&lt;/h1>
&lt;h2 id="一项目概述">一、项目概述&lt;/h2>
&lt;h3 id="11-tensorlogic是什么">1.1 TensorLogic是什么&lt;/h3>
&lt;p>&lt;strong>TensorLogic&lt;/strong> 是一个基于 &lt;strong>&amp;ldquo;Tensor Logic: The Language of AI&amp;rdquo;&lt;/strong> 论文（Pedro Domingos, arXiv:2510.12269）的 &lt;strong>Python实现&lt;/strong>，旨在通过 &lt;strong>Tensor方程&lt;/strong> 统一 &lt;strong>神经推理&lt;/strong> 和 &lt;strong>符号推理&lt;/strong>，为AI提供一种结合神经网络学习能力与逻辑推理可解释性的新范式。&lt;/p></description></item><item><title>Datawhale 大模型基础：从理论到实战的完整 LLM 知识体系</title><link>https://txtmix.com/posts/tech/datawhalechina-so-large-lm-guide/</link><pubDate>Thu, 23 Apr 2026 19:39:08 +0800</pubDate><guid>https://txtmix.com/posts/tech/datawhalechina-so-large-lm-guide/</guid><description>&lt;h1 id="datawhale-大模型基础从理论到实战的完整-llm-知识体系">Datawhale 大模型基础：从理论到实战的完整 LLM 知识体系&lt;/h1>
&lt;h2 id="项目概览">项目概览&lt;/h2>
&lt;p>&lt;a href="https://github.com/datawhalechina" target="_blank" rel="noopener noreffer ">Datawhale&lt;/a> 出品的 &lt;strong>so-large-lm&lt;/strong>（大模型基础）是一个开源、系统、深入的大规模预训练语言模型（LLM）教程项目。截至 2026 年 4 月，该项目已获得 &lt;strong>7,167 Stars&lt;/strong> 和 &lt;strong>593 Forks&lt;/strong>，成为中文社区最具影响力的 LLM 学习资源之一。&lt;/p></description></item><item><title>Flash Attention：40K Stars·Tri Dao发明·2-4倍加速·O(N)内存</title><link>https://txtmix.com/posts/tech/flash-attention-fast-exact-attention-guide/</link><pubDate>Sun, 12 Apr 2026 02:31:39 +0800</pubDate><guid>https://txtmix.com/posts/tech/flash-attention-fast-exact-attention-guide/</guid><description>&lt;h1 id="flash-attention40k-starstri-dao发明2-4倍加速on内存transformer标配llamamistralcodellama内置">Flash Attention：40K Stars·Tri Dao发明·2-4倍加速·O(N)内存·Transformer标配·Llama/Mistral/CodeLlama内置&lt;/h1>
&lt;h2 id="一项目概述">一，项目概述&lt;/h2>
&lt;h3 id="11-flash-attention-是什么">1.1 Flash Attention 是什么&lt;/h3>
&lt;p>&lt;strong>Flash Attention&lt;/strong> 是由 &lt;strong>Tri Dao&lt;/strong>（斯坦福大学）发明的&lt;strong>快速、内存高效、精确的注意力机制算法&lt;/strong>。&lt;/p></description></item><item><title>OpenAI Whisper：97.2k Stars 通用语音识别完全指南</title><link>https://txtmix.com/posts/tech/openai-whisper-speech-recognition-guide/</link><pubDate>Mon, 06 Apr 2026 22:50:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/openai-whisper-speech-recognition-guide/</guid><description>&lt;h2 id="学习目标">学习目标&lt;/h2>
&lt;p>通过本文，你将全面掌握以下核心能力：&lt;/p>
&lt;ul>
&lt;li>深入理解 Whisper 的技术原理和架构设计&lt;/li>
&lt;li>学会安装配置 Whisper 环境和依赖&lt;/li>
&lt;li>掌握不同模型规模的选择和性能对比&lt;/li>
&lt;li>学会使用命令行和 Python 进行语音识别&lt;/li>
&lt;li>理解 Whisper 的多语言翻译和语言识别功能&lt;/li>
&lt;li>掌握性能优化和微调技巧&lt;/li>
&lt;li>了解 Whisper 的生态集成和应用场景&lt;/li>
&lt;/ul>
&lt;hr>
&lt;h2 id="1-项目概述">1. 项目概述&lt;/h2>
&lt;h3 id="11-是什么">1.1 是什么&lt;/h3>
&lt;p>&lt;strong>Whisper&lt;/strong> 是 OpenAI 发布的通用语音识别模型。它在大规模多样化音频数据集上训练，是一个多任务模型，可以执行&lt;strong>多语言语音识别&lt;/strong>、&lt;strong>语音翻译&lt;/strong>和&lt;strong>语言识别&lt;/strong>。&lt;/p></description></item></channel></rss>