<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>深度学习 on Text Matrix</title><link>https://txtmix.com/tags/%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0/</link><description>Recent content in 深度学习 on Text Matrix</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Sat, 23 May 2026 08:20:36 +0800</lastBuildDate><atom:link href="https://txtmix.com/tags/%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0/index.xml" rel="self" type="application/rss+xml"/><item><title>AI Engineering From Scratch：一份从"会调用API"到"能独立构建AI系统"的完整路线图</title><link>https://txtmix.com/posts/tech/ai-engineering-from-scratch-guide/</link><pubDate>Wed, 20 May 2026 20:25:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/ai-engineering-from-scratch-guide/</guid><description>&lt;h2 id="这份教程真正在解决什么问题">这份教程真正在解决什么问题&lt;/h2>
&lt;p>AI学习材料的最大问题不是太少，而是太碎片。一篇论文解读、一个微调教程、一个Agent demo，各自独立，没有一条线把它们串起来。你学完可能能调用API，但说不清楚Attention在模型内部做了什么；能跑通一个RAG流程，但不知道tokenizer的BPE分词是怎么训练的。&lt;/p></description></item><item><title>LLMs-from-Scratch：从零构建 GPT -like LLM 的权威指南</title><link>https://txtmix.com/posts/tech/llms-from-scratch-build-gpt-from-ground-up/</link><pubDate>Thu, 14 May 2026 12:46:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/llms-from-scratch-build-gpt-from-ground-up/</guid><description>&lt;h2 id="项目概览">项目概览&lt;/h2>
&lt;p>LLMs-from-scratch 是知名 AI 研究者和教育者 Sebastian Raschka 的新作《Build a Large Language Model (From Scratch)》的官方配套代码仓库。与市面上大多数 LLM 科普或 API 使用教程不同，这本书（及其配套代码）的核心目标是&lt;strong>从零开始手写一个 GPT-like 大语言模型&lt;/strong>，让读者真正理解 LLM 内部每一层的工作原理，而非仅仅是调用别人的 API。&lt;/p></description></item><item><title>LLMs-from-Scratch：用 PyTorch 从零实现 ChatGPT 级大模型</title><link>https://txtmix.com/posts/tech/llms-from-scratch-pytorch-llm-from-scratch-guide/</link><pubDate>Wed, 13 May 2026 20:15:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/llms-from-scratch-pytorch-llm-from-scratch-guide/</guid><description>&lt;h1 id="llms-from-scratch用-pytorch-从零实现-chatgpt-级大模型">LLMs-from-Scratch：用 PyTorch 从零实现 ChatGPT 级大模型&lt;/h1>
&lt;p>很多人学习大语言模型（Large Language Model，LLM）时，会直接调用 &lt;code>transformers&lt;/code>、&lt;code>Hugging Face&lt;/code> 等现成库快速出结果。这种方式效率很高，但容易陷入&amp;quot;知其然不知其所以然&amp;quot;的困境——模型的内部机制、权重从何而来、注意力如何计算，很多人不甚了解。&lt;/p></description></item><item><title>TabPFN: 表格数据的 Foundation Model 完整指南</title><link>https://txtmix.com/posts/tech/tabpfn-tabular-foundation-model-guide/</link><pubDate>Wed, 06 May 2026 10:07:31 +0800</pubDate><guid>https://txtmix.com/posts/tech/tabpfn-tabular-foundation-model-guide/</guid><description>&lt;h1 id="tabpfn-表格数据的-foundation-model-完整指南">TabPFN: 表格数据的 Foundation Model 完整指南&lt;/h1>
&lt;p>机器学习实践中，表格数据是最常见也最顽固的领域之一。长期以来，处理表格数据的标准流程是：选模型、调超参、反复训练——这一套下来，少则几十分钟，多则几天。面对一个陌生数据集，光是跑通一个 Baseline，就可能耗掉工程师大半天时间。&lt;/p></description></item><item><title>AGI 的数学基础到底是什么：从流形假设、对称性到信息几何</title><link>https://txtmix.com/posts/tech/mathematical-foundations-deep-learning-agi-chern-simons/</link><pubDate>Thu, 23 Apr 2026 23:10:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/mathematical-foundations-deep-learning-agi-chern-simons/</guid><description>本文受 Wayland Zhang 同题博客与 B 站视频启发，结合 Neural ODE、几何深度学习、信息几何等文献，重新划清哪些数学视角已经进入深度学习主线，哪些仍属于结构类比或研究假说。</description></item><item><title>Magika：Google开源的AI文件类型检测神器——13.5K Stars、99%准确率、5ms/文件的深度学习检测方案</title><link>https://txtmix.com/posts/tech/magika-ai-file-type-detection/</link><pubDate>Thu, 16 Apr 2026 01:15:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/magika-ai-file-type-detection/</guid><description>&lt;h1 id="magikagoogle开源的ai文件类型检测神器135k-stars99准确率5ms文件的深度学习检测方案">Magika：Google开源的AI文件类型检测神器——13.5K Stars、99%准确率、5ms/文件的深度学习检测方案&lt;/h1>
&lt;blockquote>
&lt;p>&lt;strong>目标读者&lt;/strong>：安全工程师、后端开发者、文件系统维护者、AI研究者
&lt;strong>预计阅读时间&lt;/strong>：40-55分钟
&lt;strong>前置知识&lt;/strong>：Python 基础、了解机器学习分类任务、对文件类型有基本认识
&lt;strong>难度定位&lt;/strong>：⭐⭐⭐⭐ 专家设计&lt;/p></description></item><item><title>D2L-ZH动手学深度学习：77K Stars·全球500+高校教材·PyTorch/TensorFlow/JAX</title><link>https://txtmix.com/posts/tech/d2l-zh-dive-into-deep-learning-guide/</link><pubDate>Sun, 12 Apr 2026 02:31:39 +0800</pubDate><guid>https://txtmix.com/posts/tech/d2l-zh-dive-into-deep-learning-guide/</guid><description>&lt;h1 id="d2l-zh-动手学深度学习77k-stars全球500高校教材李沐沐神团队pytorchtensorflowjax三大框架">D2L-ZH 动手学深度学习：77K Stars·全球500+高校教材·李沐沐神团队·PyTorch/TensorFlow/JAX三大框架&lt;/h1>
&lt;h2 id="一项目概述">一，项目概述&lt;/h2>
&lt;h3 id="11-d2l-zh-是什么">1.1 D2L-ZH 是什么&lt;/h3>
&lt;p>&lt;strong>D2L-ZH（动手学深度学习）&lt;strong>是 &lt;strong>D2L.ai&lt;/strong> 项目的&lt;/strong>中文翻译版&lt;/strong>，由 &lt;strong>Aston Zhang&lt;/strong>、&lt;strong>Zachary C. Lipton&lt;/strong>、&lt;strong>Mu Li&lt;/strong> 和 &lt;strong>Alexander J. Smola&lt;/strong> 主编，是一本面向中文读者的&lt;strong>深度学习教材&lt;/strong>。&lt;/p></description></item><item><title>Flash Attention：40K Stars·Tri Dao发明·2-4倍加速·O(N)内存</title><link>https://txtmix.com/posts/tech/flash-attention-fast-exact-attention-guide/</link><pubDate>Sun, 12 Apr 2026 02:31:39 +0800</pubDate><guid>https://txtmix.com/posts/tech/flash-attention-fast-exact-attention-guide/</guid><description>&lt;h1 id="flash-attention40k-starstri-dao发明2-4倍加速on内存transformer标配llamamistralcodellama内置">Flash Attention：40K Stars·Tri Dao发明·2-4倍加速·O(N)内存·Transformer标配·Llama/Mistral/CodeLlama内置&lt;/h1>
&lt;h2 id="一项目概述">一，项目概述&lt;/h2>
&lt;h3 id="11-flash-attention-是什么">1.1 Flash Attention 是什么&lt;/h3>
&lt;p>&lt;strong>Flash Attention&lt;/strong> 是由 &lt;strong>Tri Dao&lt;/strong>（斯坦福大学）发明的&lt;strong>快速、内存高效、精确的注意力机制算法&lt;/strong>。&lt;/p></description></item><item><title>Scientific Agent Skills：AI科学家必备的134个科研技能库</title><link>https://txtmix.com/posts/tech/scientific-agent-skills-ai-scientist-complete-guide/</link><pubDate>Sun, 12 Apr 2026 02:31:39 +0800</pubDate><guid>https://txtmix.com/posts/tech/scientific-agent-skills-ai-scientist-complete-guide/</guid><description>&lt;h1 id="scientific-agent-skillsai科学家必备的134个科研技能库">Scientific Agent Skills：AI科学家必备的134个科研技能库&lt;/h1>
&lt;h2 id="一项目概述">一、项目概述&lt;/h2>
&lt;h3 id="11-scientific-agent-skills-是什么">1.1 Scientific Agent Skills 是什么&lt;/h3>
&lt;p>&lt;strong>Scientific Agent Skills&lt;/strong> 是 K-Dense 公司开发的&lt;strong>AI科学家技能库&lt;/strong>，包含 134 个精心策划的科研技能，覆盖生物信息学、药物研发、临床研究、机器学习等 17 个科学领域。&lt;/p></description></item><item><title>Unsloth：61K Stars·本地AI训练与推理平台·2倍速</title><link>https://txtmix.com/posts/tech/unsloth-ai-training-inference-platform-guide/</link><pubDate>Sun, 12 Apr 2026 02:31:39 +0800</pubDate><guid>https://txtmix.com/posts/tech/unsloth-ai-training-inference-platform-guide/</guid><description>&lt;h1 id="unsloth61k-stars本地ai训练与推理平台2倍速70显存节省完全指南">Unsloth：61K Stars·本地AI训练与推理平台·2倍速·70%显存节省完全指南&lt;/h1>
&lt;h2 id="一项目概述">一、项目概述&lt;/h2>
&lt;h3 id="11-unsloth-是什么">1.1 Unsloth 是什么&lt;/h3>
&lt;p>&lt;strong>Unsloth Studio&lt;/strong> 🦥 是一个强大的&lt;strong>本地 AI 训练与推理平台&lt;/strong>，支持在 Windows、Linux、macOS 上运行和微调文本、音频、embedding、视觉模型。&lt;/p></description></item><item><title>NeMo：NVIDIA 对话式 AI 框架完全指南</title><link>https://txtmix.com/posts/tech/nemo-nvidia-speech-ai-framework-guide/</link><pubDate>Wed, 01 Apr 2026 16:45:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/nemo-nvidia-speech-ai-framework-guide/</guid><description>&lt;blockquote>
&lt;p>&lt;strong>目标读者&lt;/strong>：希望构建语音 AI 应用的开发者、AI 工程师
&lt;strong>核心问题&lt;/strong>：如何使用 NVIDIA NeMo 构建语音识别和对话 AI 系统？
&lt;strong>难度&lt;/strong>：⭐⭐⭐（中级）&lt;/p>&lt;/blockquote>
&lt;h2 id="一项目概述">一、项目概述&lt;/h2>
&lt;h3 id="11-什么是-nemo">1.1 什么是 NeMo&lt;/h3>
&lt;p>&lt;strong>NeMo&lt;/strong> 是 NVIDIA 开源的对话式 AI 框架，专注于语音、音频和多模态大语言模型。提供从模型训练到部署的完整工具链，支持研究者快速构建和部署高级 AI 应用。&lt;/p></description></item><item><title>Chandra OCR：复杂表格、表单与手写内容的终极识别解决方案</title><link>https://txtmix.com/posts/tech/tools/chandra-ocr-complex-document-recognition/</link><pubDate>Sun, 29 Mar 2026 12:00:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/tools/chandra-ocr-complex-document-recognition/</guid><description>&lt;h1 id="chandra-ocr复杂表格表单与手写内容的终极识别解决方案">Chandra OCR：复杂表格、表单与手写内容的终极识别解决方案&lt;/h1>
&lt;blockquote>
&lt;p>&lt;strong>难度&lt;/strong>：⭐⭐（进阶）
&lt;strong>目标读者&lt;/strong>：需要处理复杂文档（表格、表单、手写）的开发者与企业用户
&lt;strong>前置知识&lt;/strong>：了解 OCR 基本概念，有 Python 开发经验
&lt;strong>预计阅读时间&lt;/strong>：约 20 分钟&lt;/p></description></item></channel></rss>