<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>LLM on Text Matrix</title><link>https://txtmix.com/tags/llm/</link><description>Recent content in LLM on Text Matrix</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Sat, 23 May 2026 08:20:36 +0800</lastBuildDate><atom:link href="https://txtmix.com/tags/llm/index.xml" rel="self" type="application/rss+xml"/><item><title>AI Engineering From Scratch：一份从"会调用API"到"能独立构建AI系统"的完整路线图</title><link>https://txtmix.com/posts/tech/ai-engineering-from-scratch-guide/</link><pubDate>Wed, 20 May 2026 20:25:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/ai-engineering-from-scratch-guide/</guid><description>&lt;h2 id="这份教程真正在解决什么问题">这份教程真正在解决什么问题&lt;/h2>
&lt;p>AI学习材料的最大问题不是太少，而是太碎片。一篇论文解读、一个微调教程、一个Agent demo，各自独立，没有一条线把它们串起来。你学完可能能调用API，但说不清楚Attention在模型内部做了什么；能跑通一个RAG流程，但不知道tokenizer的BPE分词是怎么训练的。&lt;/p></description></item><item><title>AI Engineering From Scratch：从零构建AI工程能力</title><link>https://txtmix.com/posts/tech/ai-engineering-from-scratch-complete-guide/</link><pubDate>Wed, 20 May 2026 20:00:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/ai-engineering-from-scratch-complete-guide/</guid><description>&lt;h2 id="项目概览">项目概览&lt;/h2>
&lt;p>&lt;a href="https://github.com/rohitg00/ai-engineering-from-scratch" target="_blank" rel="noopener noreffer ">AI Engineering From Scratch&lt;/a>是一个从零开始学习AI工程的免费教程，由Rohit Gupta创建并维护。与其他教程不同，它不是简单罗列概念，而是&lt;strong>真正带着你动手构建&lt;/strong>：从LLM基础到RAG实现，从提示工程到Agent开发，从模型微调到生产部署。&lt;/p></description></item><item><title>12-Factor Agents：构建可投产 AI 应用的全方位工程原则</title><link>https://txtmix.com/posts/tech/12-factor-agents-llm-production-principles/</link><pubDate>Mon, 18 May 2026 21:10:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/12-factor-agents-llm-production-principles/</guid><description>&lt;p>用 LLM 做产品，很多人容易掉进两个坑：要么迷信「给个 prompt、加一堆工具、循环到目标达成」的万能 Agent 范式；要么把 LLM 当成增强搜索，塞进一堆 if-else 里。&lt;/p>
&lt;p>Dex（humanlayer/12-factor-agents 作者）的观察是：&lt;strong>真正能交付给生产用户的 LLM 软件，大多数不是纯 Agent，而是软件 + LLM 步骤的混合体&lt;/strong>——好的 AI 产品，本质是软件，只是恰好在某些关键节点引入了 LLM。&lt;/p></description></item><item><title>Claude Code 在大型代码库中的工作原理：最佳实践与入门指南</title><link>https://txtmix.com/posts/tech/how-claude-code-works-in-large-codebases/</link><pubDate>Sat, 16 May 2026 11:55:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/how-claude-code-works-in-large-codebases/</guid><description>在数百万行代码的单体仓库、数十年历史的遗留系统、跨数十个代码库的分布式架构中，Claude Code 如何找到正确的上下文并完成工作？Anthropic 通过大量生产环境观察，总结出三大核心配置模式：让代码库可被导航、随模型进化维护 CLAUDE.md、以及为 Claude Code 管理分配明确的 Owner。</description></item><item><title>NVIDIA AI Blueprint：视频搜索与摘要系统实战</title><link>https://txtmix.com/posts/tech/nvidia-video-search-summarization-blueprint/</link><pubDate>Fri, 15 May 2026 10:25:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/nvidia-video-search-summarization-blueprint/</guid><description>&lt;h1 id="nvidia-ai-blueprint视频搜索与摘要系统实战">NVIDIA AI Blueprint：视频搜索与摘要系统实战&lt;/h1>
&lt;blockquote>
&lt;p>如果你曾经需要在一万小时的视频里找一个&amp;quot;穿红色衣服的人第三秒做了什么&amp;quot;，而你只有抓狂和快进两种选择——NVIDIA 的视频搜索和摘要（VSS）蓝图，就是为你准备的。&lt;/p></description></item><item><title>LLMs-from-Scratch：从零构建 GPT -like LLM 的权威指南</title><link>https://txtmix.com/posts/tech/llms-from-scratch-build-gpt-from-ground-up/</link><pubDate>Thu, 14 May 2026 12:46:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/llms-from-scratch-build-gpt-from-ground-up/</guid><description>&lt;h2 id="项目概览">项目概览&lt;/h2>
&lt;p>LLMs-from-scratch 是知名 AI 研究者和教育者 Sebastian Raschka 的新作《Build a Large Language Model (From Scratch)》的官方配套代码仓库。与市面上大多数 LLM 科普或 API 使用教程不同，这本书（及其配套代码）的核心目标是&lt;strong>从零开始手写一个 GPT-like 大语言模型&lt;/strong>，让读者真正理解 LLM 内部每一层的工作原理，而非仅仅是调用别人的 API。&lt;/p></description></item><item><title>LLMs-from-Scratch：用 PyTorch 从零实现 ChatGPT 级大模型</title><link>https://txtmix.com/posts/tech/llms-from-scratch-pytorch-llm-from-scratch-guide/</link><pubDate>Wed, 13 May 2026 20:15:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/llms-from-scratch-pytorch-llm-from-scratch-guide/</guid><description>&lt;h1 id="llms-from-scratch用-pytorch-从零实现-chatgpt-级大模型">LLMs-from-Scratch：用 PyTorch 从零实现 ChatGPT 级大模型&lt;/h1>
&lt;p>很多人学习大语言模型（Large Language Model，LLM）时，会直接调用 &lt;code>transformers&lt;/code>、&lt;code>Hugging Face&lt;/code> 等现成库快速出结果。这种方式效率很高，但容易陷入&amp;quot;知其然不知其所以然&amp;quot;的困境——模型的内部机制、权重从何而来、注意力如何计算，很多人不甚了解。&lt;/p></description></item><item><title>oMLX：macOS菜单栏管理13k星的LLM推理服务器，连续批处理+SSD缓存</title><link>https://txtmix.com/posts/tech/omlx-apple-silicon-llm-inference-server/</link><pubDate>Mon, 11 May 2026 13:10:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/omlx-apple-silicon-llm-inference-server/</guid><description>&lt;blockquote>
&lt;p>&amp;ldquo;我试过的每个 LLM 服务器都要我在便利性和控制性之间二选一。我想把常用模型常驻内存，把重的模型自动 swap 到 SSD，还能设置上下文限制——全部从菜单栏管理。这就是我造 oMLX 的原因。&amp;rdquo;&lt;/p></description></item><item><title>DFlash：块扩散加速的 LLM 推测解码技术</title><link>https://txtmix.com/posts/tech/dflash-block-diffusion-speculative-decoding-guide/</link><pubDate>Fri, 08 May 2026 03:11:04 +0800</pubDate><guid>https://txtmix.com/posts/tech/dflash-block-diffusion-speculative-decoding-guide/</guid><description>&lt;h2 id="学习目标">学习目标&lt;/h2>
&lt;p>读完这篇文章后，你应该能够：&lt;/p>
&lt;ol>
&lt;li>理解传统推测解码（Speculative Decoding）的基本原理及其自回归草案模型的局限性。&lt;/li>
&lt;li>解释 DFlash 的块扩散（Block Diffusion）草案模型是如何工作的，以及为什么块级别的扩散比逐 Token 自回归更快。&lt;/li>
&lt;li>查看官方支持模型列表，找到对应 Hugging Face 上的 DFlash 适配模型。&lt;/li>
&lt;li>在本地环境配置 DFlash 并测试其加速效果。&lt;/li>
&lt;li>判断 DFlash 适合哪些硬件配置和使用场景。&lt;/li>
&lt;/ol>
&lt;hr>
&lt;h2 id="一项目概述">一、项目概述&lt;/h2>
&lt;h3 id="11-什么是-dflash">1.1 什么是 DFlash&lt;/h3>
&lt;p>&lt;strong>DFlash&lt;/strong>（&lt;a href="https://github.com/z-lab/dflash" target="_blank" rel="noopener noreffer ">z-lab/dflash&lt;/a>，3.4k Stars）全称是 &amp;ldquo;Block Diffusion for Flash Speculative Decoding&amp;rdquo;——一种基于块扩散的 Flash 推测解码框架。它由 z-lab 团队提出，核心创新是用&lt;strong>轻量级块扩散模型&lt;/strong>代替传统推测解码中的自回归草案模型（Draft Model），从而实现更高的推理加速比。&lt;/p></description></item><item><title>PageIndex：无向量数据库的推理型 RAG 基础设施</title><link>https://txtmix.com/posts/tech/pageindex-vectorless-reasoning-rag-guide/</link><pubDate>Fri, 08 May 2026 03:11:04 +0800</pubDate><guid>https://txtmix.com/posts/tech/pageindex-vectorless-reasoning-rag-guide/</guid><description>&lt;h2 id="学习目标">学习目标&lt;/h2>
&lt;p>读完这篇文章后，你应该能够：&lt;/p>
&lt;ol>
&lt;li>解释为什么传统基于向量的 RAG 在复杂推理任务中存在瓶颈，以及 PageIndex 的推理型检索如何绕过这一限制。&lt;/li>
&lt;li>理解 PageIndex 的核心设计：不建向量索引、不做文档分块、直接利用 LLM 推理能力做上下文感知识别。&lt;/li>
&lt;li>掌握 PageIndex 的 MCP 协议集成方式和 API 调用方法，能够在自己的应用中添加 PageIndex 支持。&lt;/li>
&lt;li>判断 PageIndex 适合哪些场景，不适合哪些场景，以及它与普通向量 RAG 的取舍。&lt;/li>
&lt;/ol>
&lt;hr>
&lt;h2 id="一项目概述">一、项目概述&lt;/h2>
&lt;h3 id="11-什么是-pageindex">1.1 什么是 PageIndex&lt;/h3>
&lt;p>&lt;strong>PageIndex&lt;/strong>（&lt;a href="https://github.com/VectifyAI/PageIndex" target="_blank" rel="noopener noreffer ">VectifyAI/PageIndex&lt;/a>，29.4k Stars）是一个基于推理（Reasoning-based）的 RAG 框架。与传统 RAG 将文档切成片段、映射到高维向量空间不同，PageIndex 直接利用 LLM 的推理能力做文档索引和检索，声称可以实现&amp;quot;无向量数据库&amp;quot;（Vectorless）的 RAG 方案。&lt;/p></description></item><item><title>2026年提示词工程进阶策略：Expert Panel、Compression Protocol、ReAct与四层框架</title><link>https://txtmix.com/posts/tech/2026-prompt-engineering-advanced-strategies/</link><pubDate>Wed, 06 May 2026 23:59:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/2026-prompt-engineering-advanced-strategies/</guid><description>2026 年的提示词工程，重点已经从“把一句话写漂亮”转向“定义成功标准、组织上下文、设计工具循环与诊断失效层级”。文章围绕 Expert Panel、Compression Protocol、ReAct 与四层框架，说明它们分别解决什么问题、如何落地，以及何时不该继续加码。</description></item><item><title>free-llm-api-resources：免费LLM API资源汇总清单</title><link>https://txtmix.com/posts/tech/free-llm-api-resources-guide/</link><pubDate>Wed, 06 May 2026 20:05:34 +0800</pubDate><guid>https://txtmix.com/posts/tech/free-llm-api-resources-guide/</guid><description>&lt;p>free-llm-api-resources 是一个由社区维护的&lt;strong>免费 LLM API 资源清单&lt;/strong>，旨在帮助开发者快速找到可以免费使用或试用的大语言模型 API 服务。该项目持续更新，涵盖了从免费层到试用积分等多种形式的资源。&lt;/p></description></item><item><title>HeavySkill 完全指南：测试时 Scaling 的推理增强技术</title><link>https://txtmix.com/posts/tech/heavyskill-heavy-thinking-reasoning-amplification/</link><pubDate>Wed, 06 May 2026 18:19:57 +0800</pubDate><guid>https://txtmix.com/posts/tech/heavyskill-heavy-thinking-reasoning-amplification/</guid><description>&lt;h1 id="heavyskill-完全指南测试时-scaling-的推理增强技术">HeavySkill 完全指南：测试时 Scaling 的推理增强技术&lt;/h1>
&lt;blockquote>
&lt;p>&lt;strong>难度&lt;/strong>：⭐⭐⭐⭐ | &lt;strong>类型&lt;/strong>：专家设计 | &lt;strong>更新日期&lt;/strong>：2026-05-06 | &lt;strong>预计阅读时间&lt;/strong>：25 分钟&lt;/p>
&lt;p>&lt;strong>目标读者&lt;/strong>：AI 研究者、LLM 应用开发者、Agent 系统架构师&lt;/p></description></item><item><title>DeepSeek-TUI：Rust 终端里的 DeepSeek 编程智能体</title><link>https://txtmix.com/posts/tech/deepseek-tui-rust-terminal-coding-agent-guide/</link><pubDate>Tue, 05 May 2026 20:19:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/deepseek-tui-rust-terminal-coding-agent-guide/</guid><description>&lt;h1 id="deepseek-tuirust-终端里的-deepseek-编程智能体">DeepSeek-TUI：Rust 终端里的 DeepSeek 编程智能体&lt;/h1>
&lt;p>&lt;a href="https://github.com/Hmbown/DeepSeek-TUI" target="_blank" rel="noopener noreffer ">DeepSeek-TUI&lt;/a> 是一个 Rust 编写的终端编程智能体，专门对接 DeepSeek 系列模型，提供代码补全、修改、重构和 Git 操作能力。相比 Electron/JavaScript 方案，Rust 的二进制体积小、启动快、内存占用低，适合对性能有要求的开发者。&lt;/p></description></item><item><title>Context Mode：解决 AI 编程 Agent 的另一半上下文问题</title><link>https://txtmix.com/posts/tech/context-mode-mcp-server-llm-context-optimization-guide/</link><pubDate>Tue, 05 May 2026 20:18:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/context-mode-mcp-server-llm-context-optimization-guide/</guid><description>&lt;h1 id="context-mode解决-ai-编程-agent-的另一半上下文问题">Context Mode：解决 AI 编程 Agent 的另一半上下文问题&lt;/h1>
&lt;p>Context Mode 解决的是 AI 编程 Agent 场景里被长期忽视的另一半问题：当你在用 Claude Code、Cursor 或 Gemini CLI 时，每次 MCP 工具调用都在往 context window 里塞原始数据——一个 Playwright 快照 56 KB，20 个 GitHub issues 59 KB，一个 access log 45 KB。30 分钟后，40% 的 context 被这些数据吃掉，而当 agent 压缩对话腾空间时，它忘了正在改哪个文件、有哪些任务在进行、你最后要求了什么。&lt;/p></description></item><item><title>TradingAgents：Multi-Agent LLM 金融交易框架深度解析</title><link>https://txtmix.com/posts/tech/tradingagents-multi-agent-llm-trading-framework/</link><pubDate>Mon, 04 May 2026 11:45:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/tradingagents-multi-agent-llm-trading-framework/</guid><description>&lt;h1 id="tradingagentsmulti-agent-llm-金融交易框架深度解析">TradingAgents：Multi-Agent LLM 金融交易框架深度解析&lt;/h1>
&lt;blockquote>
&lt;p>&lt;strong>目标读者&lt;/strong>：掌握 Python 基础、了解 LLM 基本概念，想了解 AI Agent 在金融领域应用的开发者
&lt;strong>预计阅读时间&lt;/strong>：20 分钟
&lt;strong>前置知识&lt;/strong>：&lt;a href="https://python.langchain.com/docs/concepts/langgraph/" target="_blank" rel="noopener noreffer ">LangGraph 入门&lt;/a> ⭐⭐ | &lt;a href="https://platform.openai.com/docs/api-reference" target="_blank" rel="noopener noreffer ">LLM API 调用基础&lt;/a> ⭐
&lt;strong>GitHub&lt;/strong>：https://github.com/TauricResearch/TradingAgents | &lt;strong>Stars&lt;/strong>：65,532 ⭐&lt;/p></description></item><item><title>TradingAgents 全面指南：多 Agent 大模型金融交易框架从入门到精通</title><link>https://txtmix.com/posts/tech/tradingagents-multi-agent-crypto-trading-framework-guide/</link><pubDate>Sat, 02 May 2026 15:04:08 +0800</pubDate><guid>https://txtmix.com/posts/tech/tradingagents-multi-agent-crypto-trading-framework-guide/</guid><description>&lt;blockquote>
&lt;p>&lt;strong>目标读者&lt;/strong>：想系统掌握 LLM 多 Agent 协作在金融交易场景落地的工程师与研究者
&lt;strong>核心问题&lt;/strong>：TradingAgents 是如何把&amp;quot;分析师团队 + 研究员辩论 + 交易员决策 + 风控审批&amp;quot;这套真实交易逻辑翻译成可运行的多 Agent 工作流的？每个 Agent 的职责边界在哪里？系统如何做到可恢复、可积累的？
&lt;strong>难度&lt;/strong>：⭐⭐⭐⭐（高级工程实践，需要一定 Python 基础与 LLM 使用经验）
&lt;strong>预计阅读时间&lt;/strong>：25 分钟&lt;/p></description></item><item><title>Dify：开源 Agentic Workflow 开发平台从入门到精通指南</title><link>https://txtmix.com/posts/tech/dify-agentic-workflow-development-platform-guide/</link><pubDate>Sat, 02 May 2026 10:12:21 +0800</pubDate><guid>https://txtmix.com/posts/tech/dify-agentic-workflow-development-platform-guide/</guid><description>&lt;h2 id="前言">前言&lt;/h2>
&lt;p>大语言模型（LLM）从概念验证走向生产环境，中间隔着工程化、可靠性、可观测性三道坎。许多团队在 Prompt 调优阶段顺风顺水，却在接入真实业务流程时发现：日志往哪看？多模型怎么切换？RAG 管道怎么管理？生产流量怎么控制？这些问题的答案，往往是一套完善的 Agentic Workflow 平台才能提供的。&lt;/p></description></item><item><title>Open WebUI：开源自托管 AI 界面完全指南——从原理到精通</title><link>https://txtmix.com/posts/tech/open-webui-self-hosted-ai-interface-guide/</link><pubDate>Sat, 02 May 2026 10:11:52 +0800</pubDate><guid>https://txtmix.com/posts/tech/open-webui-self-hosted-ai-interface-guide/</guid><description>&lt;h1 id="open-webui开源自托管-ai-界面完全指南从原理到精通">Open WebUI：开源自托管 AI 界面完全指南——从原理到精通&lt;/h1>
&lt;p>在大模型落地生产的过程中，一个好用的前端界面往往是决定团队协作效率的关键。Open WebUI 就是这样一款工具——它将 Ollama、OpenAI 兼容 API 以及各种本地 / 云端大模型统一封装到一个界面中，让非技术用户也能顺畅地与 AI 交互，同时为企业场景保留了精细的权限管理和插件扩展能力。&lt;/p></description></item><item><title>Agent技术全史：从1960年代逻辑代理到2026年通用数字代理的史诗旅程</title><link>https://txtmix.com/posts/video/agent-technology-history-su-yu/</link><pubDate>Fri, 01 May 2026 13:50:00 +0800</pubDate><guid>https://txtmix.com/posts/video/agent-technology-history-su-yu/</guid><description>&lt;h1 id="agent技术全史从1960年代逻辑代理到2026年通用数字代理的史诗旅程">Agent技术全史：从1960年代逻辑代理到2026年通用数字代理的史诗旅程&lt;/h1>
&lt;blockquote>
&lt;p>&lt;strong>目标读者&lt;/strong>：想系统理解 AI Agent 技术演进史、从学术脉络到产业落地的开发者与研究者
&lt;strong>核心问题&lt;/strong>：Agent 技术经历了怎样的范式迁移？为什么 Language Agent 在过去三年迎来爆发？OpenClaw Moment 意味着什么？
&lt;strong>难度&lt;/strong>：⭐⭐⭐⭐⭐ | &lt;strong>来源&lt;/strong>：微博 @张小珺Benita，2026-05-01 | &lt;strong>嘉宾&lt;/strong>：苏煜（俄亥俄州立大学计算机系教授、NeoCognition 创始人）&lt;/p></description></item><item><title>LangFlow: 可视化 AI 工作流编排平台</title><link>https://txtmix.com/posts/tech/langflow-visual-ai-workflow-builder/</link><pubDate>Thu, 30 Apr 2026 20:00:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/langflow-visual-ai-workflow-builder/</guid><description>&lt;h2 id="项目概览">项目概览&lt;/h2>
&lt;p>&lt;a href="https://langflow.org" target="_blank" rel="noopener noreffer ">LangFlow&lt;/a> 是由 langflow-ai 组织维护的开源项目（GitHub: &lt;a href="https://github.com/langflow-ai/langflow" target="_blank" rel="noopener noreffer ">langflow-ai/langflow&lt;/a>），目前已积累超过 &lt;strong>147,000 颗星&lt;/strong>，是 AI 工作流可视化编排领域中最受欢迎的开源项目之一。&lt;/p></description></item><item><title>Caveman：让 AI 用「山顶洞人语言」说话，砍掉 65% Token 消耗</title><link>https://txtmix.com/posts/tech/caveman-claude-code-token-optimization-guide/</link><pubDate>Thu, 30 Apr 2026 11:30:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/caveman-claude-code-token-optimization-guide/</guid><description>&lt;h2 id="引言一个反直觉的发现">引言：一个反直觉的发现&lt;/h2>
&lt;p>2026 年 4 月，一个名为 &lt;strong>caveman&lt;/strong> 的 Claude Code 插件在 GitHub 迅速走红——上线不到一个月斩获 &lt;strong>50,544 颗星&lt;/strong>，2,680 个 Fork，话题覆盖 Hacker News 头版。这个项目的核心理念看似荒诞：&lt;/p></description></item><item><title>RTX 3090 本地运行 LLM 实战：vLLM 与 llama.cpp 双引擎对比</title><link>https://txtmix.com/posts/tech/club-3090-rtx-3090-llm-local-serving-guide/</link><pubDate>Wed, 29 Apr 2026 20:35:22 +0800</pubDate><guid>https://txtmix.com/posts/tech/club-3090-rtx-3090-llm-local-serving-guide/</guid><description>&lt;h1 id="rtx-3090-本地运行-llm-实战vllm-与-llamacpp-双引擎对比">RTX 3090 本地运行 LLM 实战：vLLM 与 llama.cpp 双引擎对比&lt;/h1>
&lt;h2 id="前言">前言&lt;/h2>
&lt;p>消费级 GPU 跑大语言模型，这事在 2024 年还属于&amp;quot;勉强能跑但体验糟糕&amp;quot;的范畴。到了 2026 年，量化技术、工程优化和推理引擎的共同进步，让这个目标变得真正实用了。&lt;/p></description></item><item><title>OpenKB：开源 LLM 知识库——无向量检索的长文档处理新范式</title><link>https://txtmix.com/posts/tech/openkb-open-llm-knowledge-base-guide/</link><pubDate>Wed, 29 Apr 2026 20:13:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/openkb-open-llm-knowledge-base-guide/</guid><description>&lt;h2 id="项目概览">项目概览&lt;/h2>
&lt;p>OpenKB（Open LLM Knowledge Base）是一个 2026 年 4 月刚刚发布就登上 GitHub Trending 的开源项目，截至 4 月 29 日已收获 &lt;strong>851 Stars&lt;/strong> 和 &lt;strong>81 Forks&lt;/strong>。它将自己定位为&amp;quot;Scale to long documents • Reasoning-based retrieval • Native multi-modality • No Vector DB&amp;quot;的知识库系统——没有向量数据库，是它最显著的区别于传统 RAG（Retrieval-Augmented Generation）方案的特性。&lt;/p></description></item><item><title>DeepSeek-V3 技术解析：671B 参数开源大模型的工程奇迹</title><link>https://txtmix.com/posts/tech/deepseek-v3-technical-analysis/</link><pubDate>Mon, 27 Apr 2026 20:00:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/deepseek-v3-technical-analysis/</guid><description>&lt;h1 id="deepseek-v3-技术解析671b-参数开源大模型的工程奇迹">DeepSeek-V3 技术解析：671B 参数开源大模型的工程奇迹&lt;/h1>
&lt;blockquote>
&lt;p>&lt;strong>目标读者&lt;/strong>：具备一定大语言模型基础认知的开发者与研究者
&lt;strong>核心问题&lt;/strong>：DeepSeek-V3 是如何以极低训练成本实现顶级性能的？其核心架构做了哪些关键设计决策？&lt;/p></description></item><item><title>RTK：Rust 写的高性能 CLI 代理，Claude Code 场景节省 80% Token</title><link>https://txtmix.com/posts/tech/rtk-rust-token-killer/</link><pubDate>Mon, 27 Apr 2026 01:03:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/rtk-rust-token-killer/</guid><description>&lt;h1 id="rtkrust-写的高性能-cli-代理claude-code-场景节省-80-token">RTK：Rust 写的高性能 CLI 代理，Claude Code 场景节省 80% Token&lt;/h1>
&lt;p>一个 Claude Code 会话（30分钟）里，开发者的 shell 命令会消耗约 118,000 tokens。用了 RTK，同样的操作只消耗约 23,900 tokens，节省 &lt;strong>80%&lt;/strong>。&lt;/p></description></item><item><title>TurboQuant+ 深度解读：LLM KV 缓存极限压缩的工程实践</title><link>https://txtmix.com/posts/tech/turboquant-plus-kv-cache-compression-guide/</link><pubDate>Thu, 23 Apr 2026 21:07:12 +0800</pubDate><guid>https://txtmix.com/posts/tech/turboquant-plus-kv-cache-compression-guide/</guid><description>&lt;h2 id="项目概览">项目概览&lt;/h2>
&lt;p>&lt;a href="https://github.com/TheTom/turboquant_plus" target="_blank" rel="noopener noreffer ">TurboQuant+&lt;/a> 是对 Google Research &lt;a href="https://research.google/blog/turboquant-redefining-ai-efficiency-with-extreme-compression/" target="_blank" rel="noopener noreffer ">TurboQuant&lt;/a> 论文（ICLR 2026）的开源实现与扩展工程。截至 2026 年 4 月，该项目已获得 &lt;strong>6,482 Stars&lt;/strong> 和 &lt;strong>872 Forks&lt;/strong>，是近期最具影响力的 LLM 推理优化开源项目之一。&lt;/p></description></item><item><title>Datawhale 大模型基础：从理论到实战的完整 LLM 知识体系</title><link>https://txtmix.com/posts/tech/datawhalechina-so-large-lm-guide/</link><pubDate>Thu, 23 Apr 2026 19:39:08 +0800</pubDate><guid>https://txtmix.com/posts/tech/datawhalechina-so-large-lm-guide/</guid><description>&lt;h1 id="datawhale-大模型基础从理论到实战的完整-llm-知识体系">Datawhale 大模型基础：从理论到实战的完整 LLM 知识体系&lt;/h1>
&lt;h2 id="项目概览">项目概览&lt;/h2>
&lt;p>&lt;a href="https://github.com/datawhalechina" target="_blank" rel="noopener noreffer ">Datawhale&lt;/a> 出品的 &lt;strong>so-large-lm&lt;/strong>（大模型基础）是一个开源、系统、深入的大规模预训练语言模型（LLM）教程项目。截至 2026 年 4 月，该项目已获得 &lt;strong>7,167 Stars&lt;/strong> 和 &lt;strong>593 Forks&lt;/strong>，成为中文社区最具影响力的 LLM 学习资源之一。&lt;/p></description></item><item><title>AutoResearchClaw：全自动23阶段研究论文生成管道，从想法到论文的完整实践</title><link>https://txtmix.com/posts/tech/autoresearchclaw-23-stage-research-pipeline/</link><pubDate>Tue, 21 Apr 2026 07:45:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/autoresearchclaw-23-stage-research-pipeline/</guid><description>&lt;h1 id="autoresearchclaw全自动23阶段研究论文生成管道从想法到论文的完整实践">AutoResearchClaw：全自动23阶段研究论文生成管道，从想法到论文的完整实践&lt;/h1>
&lt;h2 id="-概述">🎯 概述&lt;/h2>
&lt;p>&lt;strong>AutoResearchClaw&lt;/strong> 是一个开源的全自动研究论文生成管道，能够将一个研究想法直接转化为会议级别的学术论文。项目在 GitHub 上获得了 &lt;strong>11,433 Stars&lt;/strong> 和 &lt;strong>1,320 Forks&lt;/strong>，已成为 AI 辅助学术研究领域的标杆项目。&lt;/p></description></item><item><title>DeepGEMM：深势科技6577 Stars的高性能FP8 GEMM内核库——从入门到精通</title><link>https://txtmix.com/posts/tech/deepgemm-high-performance-fp8-gemm-kernels/</link><pubDate>Sun, 19 Apr 2026 21:00:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/deepgemm-high-performance-fp8-gemm-kernels/</guid><description>&lt;h1 id="deepgemm深势科技6577-stars的高性能fp8-gemm内核库从入门到精通">DeepGEMM：深势科技6577 Stars的高性能FP8 GEMM内核库——从入门到精通&lt;/h1>
&lt;blockquote>
&lt;p>&lt;strong>目标读者&lt;/strong>：GPU内核工程师、深度学习框架开发者、高性能计算研究员、LLM推理优化工程师
&lt;strong>预计阅读时间&lt;/strong>：60-80分钟
&lt;strong>前置知识&lt;/strong>：CUDA编程基础、GEMM计算原理、深度学习训练/推理流程
&lt;strong>难度定位&lt;/strong>：⭐⭐⭐⭐ 专家设计&lt;/p></description></item><item><title>CL4R1T4S：把 AI 系统提示词放到台前的开源档案库</title><link>https://txtmix.com/posts/tech/cl4r1t4s-ai-system-prompts-leaked-collection/</link><pubDate>Sun, 19 Apr 2026 20:58:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/cl4r1t4s-ai-system-prompts-leaked-collection/</guid><description>&lt;blockquote>
&lt;p>目标读者：想研究 AI 系统行为、提示词工程、模型安全边界的开发者与研究者&lt;/p>
&lt;p>阅读收益：看懂这个仓库的价值、知道怎么把它用于研究、也知道哪些结论不能轻易下&lt;/p></description></item><item><title>PrfaaS：跨数据中心LLM服务的革命性架构——KVCache新时代</title><link>https://txtmix.com/posts/tech/prfaas-prefill-as-a-service-cross-datacenter-llm/</link><pubDate>Sat, 18 Apr 2026 20:55:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/prfaas-prefill-as-a-service-cross-datacenter-llm/</guid><description>&lt;h1 id="prfaas跨数据中心llm服务的革命性架构kvcache新时代">PrfaaS：跨数据中心LLM服务的革命性架构——KVCache新时代&lt;/h1>
&lt;blockquote>
&lt;p>&lt;strong>目标读者&lt;/strong>：AI Infra工程师、分布式系统研究员、对大模型服务化有兴趣的开发者
&lt;strong>预计阅读时间&lt;/strong>：50-70分钟
&lt;strong>前置知识&lt;/strong>：了解LLM基本原理、熟悉分布式系统概念、对模型服务化有基础认知
&lt;strong>难度定位&lt;/strong>：⭐⭐⭐⭐ 专家设计&lt;/p></description></item><item><title>DFlash：块扩散模型加速LLM推理——让大模型推理速度提升2-3倍</title><link>https://txtmix.com/posts/tech/dflash-block-diffusion-speculative-decoding/</link><pubDate>Fri, 17 Apr 2026 16:35:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/dflash-block-diffusion-speculative-decoding/</guid><description>&lt;h1 id="dflash块扩散模型加速llm推理">DFlash：块扩散模型加速LLM推理&lt;/h1>
&lt;blockquote>
&lt;p>&lt;strong>目标读者&lt;/strong>：LLM推理优化工程师、ML平台架构师、MLOps实践者
&lt;strong>前置知识&lt;/strong>：深度学习基础、LLM原理、对投机解码有基本了解
&lt;strong>技术栈&lt;/strong>：Python / PyTorch / vLLM / SGLang / Transformers / MLX
&lt;strong>难度定位&lt;/strong>：⭐⭐⭐⭐ 专家设计&lt;/p></description></item><item><title>Cognee：16K Stars的AI Agent记忆引擎——让大模型拥有持续学习的知识图谱</title><link>https://txtmix.com/posts/tech/cognee-ai-agent-memory-knowledge-engine/</link><pubDate>Fri, 17 Apr 2026 16:32:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/cognee-ai-agent-memory-knowledge-engine/</guid><description>&lt;h1 id="cognee16k-stars的ai-agent记忆引擎">Cognee：16K Stars的AI Agent记忆引擎&lt;/h1>
&lt;blockquote>
&lt;p>&lt;strong>目标读者&lt;/strong>：LLM应用开发者、RAG系统工程师、AI Agent研究者、企业知识管理
&lt;strong>前置知识&lt;/strong>：Python基础、LLM API使用经验、对RAG有基本了解
&lt;strong>技术栈&lt;/strong>：Python 3.10-3.13 / 向量数据库 / 图数据库 / Pydantic
&lt;strong>难度定位&lt;/strong>：⭐⭐⭐⭐ 专家设计&lt;/p></description></item><item><title>Agentic Video Editor：用多智能体架构重新定义视频剪辑——从创意简报到成品广告的自动化之旅</title><link>https://txtmix.com/posts/tech/agentic-video-editor-ai-multi-agent-video-production/</link><pubDate>Fri, 17 Apr 2026 16:10:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/agentic-video-editor-ai-multi-agent-video-production/</guid><description>&lt;h1 id="agentic-video-editor用多智能体架构重新定义视频剪辑">Agentic Video Editor：用多智能体架构重新定义视频剪辑&lt;/h1>
&lt;blockquote>
&lt;p>&lt;strong>目标读者&lt;/strong>：AI应用开发者、视频内容创作者、对多智能体系统感兴趣的研究者
&lt;strong>前置知识&lt;/strong>：Python基础、对LLM和AI Agent有基本了解
&lt;strong>技术栈&lt;/strong>：Python 3.11+ / Google Gemini ADK / FFmpeg
&lt;strong>难度定位&lt;/strong>：⭐⭐⭐⭐ 专家设计&lt;/p></description></item><item><title>GenericAgent：仅3K行代码的自我进化Agent框架——6倍Token节省、9个原子工具、Skill树自增长</title><link>https://txtmix.com/posts/tech/genericagent-self-evolving-agent-framework/</link><pubDate>Thu, 16 Apr 2026 01:50:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/genericagent-self-evolving-agent-framework/</guid><description>&lt;h1 id="genericagent仅3k行代码的自我进化agent框架6倍token节省9个原子工具skill树自增长">GenericAgent：仅3K行代码的自我进化Agent框架——6倍Token节省、9个原子工具、Skill树自增长&lt;/h1>
&lt;blockquote>
&lt;p>&lt;strong>目标读者&lt;/strong>：AI Agent 研究者、LLM 应用开发者、对 Agent 架构感兴趣的工程师
&lt;strong>预计阅读时间&lt;/strong>：45-60分钟
&lt;strong>前置知识&lt;/strong>：Python 基础、对 LLM 和 Agent 概念有了解
&lt;strong>难度定位&lt;/strong>：⭐⭐⭐⭐ 专家设计&lt;/p></description></item><item><title>《动手学大模型》：上海交通大学31.5K Stars的LLM编程实践教程——微调/提示工程/知识编辑/RLHF全覆盖</title><link>https://txtmix.com/posts/tech/dive-into-llms-sjtu-tutorial/</link><pubDate>Thu, 16 Apr 2026 01:30:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/dive-into-llms-sjtu-tutorial/</guid><description>&lt;h1 id="动手学大模型上海交通大学315k-stars的llm编程实践教程微调提示工程知识编辑rlhf全覆盖">《动手学大模型》：上海交通大学31.5K Stars的LLM编程实践教程——微调/提示工程/知识编辑/RLHF全覆盖&lt;/h1>
&lt;blockquote>
&lt;p>&lt;strong>目标读者&lt;/strong>：大模型研究者、研究生、开发者、对 LLM 感兴趣的任何人
&lt;strong>预计阅读时间&lt;/strong>：50-70分钟
&lt;strong>前置知识&lt;/strong>：Python 基础、了解深度学习基本概念
&lt;strong>难度定位&lt;/strong>：⭐⭐⭐⭐ 专家设计&lt;/p></description></item><item><title>AI 心理学：Anthropic 如何用 171 个情绪向量重新逼近模型内部世界</title><link>https://txtmix.com/posts/tech/ai-psychology-anthropic-emotion-vectors/</link><pubDate>Wed, 15 Apr 2026 18:25:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/ai-psychology-anthropic-emotion-vectors/</guid><description>这不是一篇把模型简单拟人化的文章，而是一篇把 Anthropic 最新研究串成一条逻辑链的技术解读：角色空间、情绪向量、奖励黑客、对齐伪装与 CoT 不忠实，如何共同指向更深的模型内部状态问题。</description></item><item><title>LangGraph：构建有状态智能体的图形框架——29K Stars 的 AI Agent 编排框架从入门到精通</title><link>https://txtmix.com/posts/tech/langgraph-stateful-agents-framework/</link><pubDate>Wed, 15 Apr 2026 00:15:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/langgraph-stateful-agents-framework/</guid><description>&lt;h1 id="langgraph构建有状态智能体的图形框架29k-stars-的-ai-agent-编排框架从入门到精通">LangGraph：构建有状态智能体的图形框架——29K Stars 的 AI Agent 编排框架从入门到精通&lt;/h1>
&lt;blockquote>
&lt;p>&lt;strong>目标读者&lt;/strong>：LLM 应用开发者、AI Agent 研究者、想要构建复杂多步骤 AI 系统的工程师
&lt;strong>预计阅读时间&lt;/strong>：50-70 分钟
&lt;strong>前置知识&lt;/strong>：Python 基础、LLM API 使用经验、对 Agent 概念有了解
&lt;strong>难度定位&lt;/strong>：⭐⭐⭐⭐ 专家设计&lt;/p></description></item><item><title>new-api：26.7K Stars 的 LLM 网关——多模型聚合与支付计费的从入门到精通</title><link>https://txtmix.com/posts/tech/new-api-llm-gateway/</link><pubDate>Tue, 14 Apr 2026 20:30:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/new-api-llm-gateway/</guid><description>&lt;h1 id="new-api267k-stars-的-llm-网关多模型聚合与支付计费的从入门到精通">new-api：26.7K Stars 的 LLM 网关——多模型聚合与支付计费的从入门到精通&lt;/h1>
&lt;blockquote>
&lt;p>&lt;strong>目标读者&lt;/strong>：需要聚合多个 AI API 的开发者、企业技术负责人、Bug Bounty 开发者
&lt;strong>预计阅读时间&lt;/strong>：45-60 分钟
&lt;strong>前置知识&lt;/strong>：Python 基础、API 概念、Docker 基础
&lt;strong>难度定位&lt;/strong>：⭐⭐⭐⭐ 专家设计&lt;/p></description></item><item><title>近年 AI 应用技术学习路线：从 LLM、RAG 到 Agent 工程</title><link>https://txtmix.com/posts/tech/ai-application-technology-learning-path-guide/</link><pubDate>Tue, 14 Apr 2026 10:30:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/ai-application-technology-learning-path-guide/</guid><description>一篇面向工程师的 AI 应用技术路线图：先把 LLM、Prompt、RAG、Function Calling 与 MCP 打稳，再进入 Agent、Workflow、Context、Skill 与评估工程。</description></item><item><title>MiniMind：从零开始用3块钱训练64M参数的大语言模型</title><link>https://txtmix.com/posts/tech/llm/minimind-llm-training-from-scratch/</link><pubDate>Sun, 12 Apr 2026 12:00:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/llm/minimind-llm-training-from-scratch/</guid><description>&lt;h1 id="minimind从零开始用3块钱训练64m参数的大语言模型">MiniMind：从零开始用3块钱训练64M参数的大语言模型&lt;/h1>
&lt;h2 id="一项目概览">一、项目概览&lt;/h2>
&lt;p>&lt;strong>MiniMind&lt;/strong> 是由 jingyaogong 开发的开源大语言模型训练项目，其核心理念是&amp;quot;大道至简&amp;quot;——让每个人都能从零开始，仅用约 3 元钱成本与 2 小时训练时间，即可训练出规模约为 64M 参数的超小型语言模型 MiniMind。&lt;/p></description></item><item><title>Awesome AI Apps：80+LLM应用实战项目合集</title><link>https://txtmix.com/posts/tech/awesome-ai-apps-complete-llm-application-guide/</link><pubDate>Sun, 12 Apr 2026 02:31:39 +0800</pubDate><guid>https://txtmix.com/posts/tech/awesome-ai-apps-complete-llm-application-guide/</guid><description>&lt;h1 id="awesome-ai-apps80llm应用实战项目合集">Awesome AI Apps：80+LLM应用实战项目合集&lt;/h1>
&lt;h2 id="一项目概述">一、项目概述&lt;/h2>
&lt;h3 id="11-awesome-ai-apps-是什么">1.1 Awesome AI Apps 是什么&lt;/h3>
&lt;p>&lt;strong>Awesome AI Apps&lt;/strong> 是一个全面的 &lt;strong>LLM应用实战项目集合&lt;/strong>，收录了 80+ 个实用的 AI 应用示例，涵盖文本 Agent、语音助手、RAG 应用、MCP 工具等。项目按难度分层，从入门级 Starter 到生产级 Advanced，助你从零掌握各种 AI 框架和技术栈。&lt;/p></description></item><item><title>Gemma：Google DeepMind开源LLM库完全指南</title><link>https://txtmix.com/posts/tech/gemma-google-deepmind-llm-library-guide/</link><pubDate>Sun, 12 Apr 2026 02:31:39 +0800</pubDate><guid>https://txtmix.com/posts/tech/gemma-google-deepmind-llm-library-guide/</guid><description>&lt;h1 id="gemmagoogle-deepmind-开源-llm-库完全指南">Gemma：Google DeepMind 开源 LLM 库完全指南&lt;/h1>
&lt;h2 id="一项目概述">一、项目概述&lt;/h2>
&lt;h3 id="11-gemma-是什么">1.1 Gemma 是什么&lt;/h3>
&lt;p>&lt;strong>Gemma&lt;/strong> 是 Google DeepMind 开发的**开源权重大语言模型（LLM）**系列，基于 Gemini 研究和技术。这个仓库提供了 &lt;code>gemma&lt;/code> PyPI 包——一个用于使用和微调 Gemma 模型的 JAX 库。&lt;/p></description></item><item><title>PraisonAI：AutoGen继任者·100+LLM支持·MCP原生</title><link>https://txtmix.com/posts/tech/praisonai-multi-agent-framework-guide/</link><pubDate>Sun, 12 Apr 2026 02:31:39 +0800</pubDate><guid>https://txtmix.com/posts/tech/praisonai-multi-agent-framework-guide/</guid><description>&lt;h1 id="praisonai-autogen-继任者100-llm-支持mcp-原生多智能体框架完全指南">PraisonAI 🦞：AutoGen 继任者·100+ LLM 支持·MCP 原生·多智能体框架完全指南&lt;/h1>
&lt;h2 id="一项目概述">一、项目概述&lt;/h2>
&lt;h3 id="11-praisonai-是什么">1.1 PraisonAI 是什么&lt;/h3>
&lt;p>&lt;strong>PraisonAI&lt;/strong> 🦞 — &lt;strong>Hire a 24/7 AI Workforce.&lt;/strong> 停止编写样板代码，开始构建能够研究、计划、执行任务的自主智能体。从单个 Agent 到整个组织，只需 5 行代码即可部署。&lt;/p></description></item><item><title>SkyPilot：9.8K Stars·任意云LLM服务框架·自动故障转移</title><link>https://txtmix.com/posts/tech/skypilot-any-cloud-llm-serving-guide/</link><pubDate>Sun, 12 Apr 2026 02:31:39 +0800</pubDate><guid>https://txtmix.com/posts/tech/skypilot-any-cloud-llm-serving-guide/</guid><description>&lt;h1 id="skypilot98k-stars任意云llm服务框架自动故障转移spot实例节省701000任务天10m成本节省">SkyPilot：9.8K Stars·任意云LLM服务框架·自动故障转移·Spot实例节省70%·1000+任务/天·$10M+成本节省&lt;/h1>
&lt;h2 id="一项目概述">一，项目概述&lt;/h2>
&lt;h3 id="11-skypilot-是什么">1.1 SkyPilot 是什么&lt;/h3>
&lt;p>&lt;strong>SkyPilot&lt;/strong> 是一个&lt;strong>任意云LLM和AI服务框架&lt;/strong>，可以在任何云（AWS、GCP、Azure、Lambda、Cloudflare等）上运行LLM、AI模型和批处理任务。&lt;/p></description></item><item><title>Repomix：11.4K Stars·代码库压缩成AI友好格式的利器</title><link>https://txtmix.com/posts/tech/repomix-ai-codebase-compression-guide/</link><pubDate>Sun, 12 Apr 2026 01:50:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/repomix-ai-codebase-compression-guide/</guid><description>&lt;h1 id="repomix114k-stars代码库压缩成ai友好格式的利器">Repomix：11.4K Stars·代码库压缩成AI友好格式的利器&lt;/h1>
&lt;h2 id="学习目标">学习目标&lt;/h2>
&lt;ul>
&lt;li>理解 Repomix 的核心概念和使用场景&lt;/li>
&lt;li>掌握 CLI、Web、Web Extension 三种使用方式&lt;/li>
&lt;li>学会配置 repomix.config.json 实现定制化&lt;/li>
&lt;li>了解安全检查和压缩原理&lt;/li>
&lt;li>掌握在 GitHub Actions 中的集成方法&lt;/li>
&lt;li>学会将 Repomix 作为 Library 集成到自己的应用中&lt;/li>
&lt;/ul>
&lt;h2 id="项目概述">项目概述&lt;/h2>
&lt;p>Repomix 是一款强大的代码库压缩工具，能够将整个 Git 仓库打包成对 AI 模型友好的单一文件格式。当需要向 ChatGPT、Claude、DeepSeek、Gemini 等大语言模型提供代码上下文时，Repomix 可以帮助用户快速整理和压缩代码库，避免手动复制粘贴的繁琐。&lt;/p></description></item><item><title>Rowboat完全指南：将工作转为知识图谱的AI同事</title><link>https://txtmix.com/posts/tech/rowboat-ai-knowledge-graph-coworker-guide/</link><pubDate>Sat, 11 Apr 2026 00:00:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/rowboat-ai-knowledge-graph-coworker-guide/</guid><description>&lt;h1 id="rowboat完全指南将工作转为知识图谱的ai同事">Rowboat完全指南：将工作转为知识图谱的AI同事&lt;/h1>
&lt;h2 id="1-学习目标">§1 学习目标&lt;/h2>
&lt;p>通过本文，您将掌握：&lt;/p>
&lt;ol>
&lt;li>&lt;strong>理解Rowboat的核心价值&lt;/strong>：为什么将工作转为知识图谱是AI办公的新范式&lt;/li>
&lt;li>&lt;strong>掌握全部集成能力&lt;/strong>：Gmail、Google Calendar、Fireflies等&lt;/li>
&lt;li>&lt;strong>熟练使用知识图谱&lt;/strong>：Obsidian兼容、本地存储、背链&lt;/li>
&lt;li>&lt;strong>理解架构设计&lt;/strong>：长期记忆、知识关联、本地优先&lt;/li>
&lt;li>&lt;strong>掌握进阶用法&lt;/strong>：私有化部署、自定义LLM、MCP集成&lt;/li>
&lt;/ol>
&lt;hr>
&lt;h2 id="2-项目概述">§2 项目概述&lt;/h2>
&lt;h3 id="21-什么是rowboat">2.1 什么是Rowboat？&lt;/h3>
&lt;p>&lt;strong>Rowboat&lt;/strong>是开源AI同事工具，将您的工作（邮件、会议、决策）转化为&lt;strong>持久的知识图谱&lt;/strong>，然后Agent能够基于这些上下文采取行动。&lt;/p></description></item><item><title>MarkItDown完全指南：微软开源的文档转Markdown神器</title><link>https://txtmix.com/posts/tech/markitdown-microsoft-document-to-markdown-guide/</link><pubDate>Fri, 10 Apr 2026 23:50:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/markitdown-microsoft-document-to-markdown-guide/</guid><description>&lt;h1 id="markitdown完全指南微软开源的文档转markdown神器">MarkItDown完全指南：微软开源的文档转Markdown神器&lt;/h1>
&lt;h2 id="1-学习目标">§1 学习目标&lt;/h2>
&lt;p>通过本文，您将掌握：&lt;/p>
&lt;ol>
&lt;li>&lt;strong>理解MarkItDown的核心价值&lt;/strong>：为什么将文档转换为Markdown是LLM最优方案&lt;/li>
&lt;li>&lt;strong>掌握全部支持格式&lt;/strong>：PDF、Word、Excel、PowerPoint、图片OCR、音频转录等&lt;/li>
&lt;li>&lt;strong>熟练使用CLI和Python API&lt;/strong>：命令行和Python两种使用方式&lt;/li>
&lt;li>&lt;strong>理解插件生态&lt;/strong>：MCP服务器、OCR插件、Azure Document Intelligence&lt;/li>
&lt;li>&lt;strong>掌握进阶用法&lt;/strong>：流式转换、自定义LLM提示词、插件开发&lt;/li>
&lt;/ol>
&lt;hr>
&lt;h2 id="2-项目概述">§2 项目概述&lt;/h2>
&lt;h3 id="21-什么是markitdown">2.1 什么是MarkItDown？&lt;/h3>
&lt;p>&lt;strong>MarkItDown&lt;/strong>是微软AutoGen团队开源的轻量级Python工具，用于将各种格式的文档转换为&lt;strong>Markdown&lt;/strong>，专为LLM及相关文本分析管道设计。&lt;/p></description></item><item><title>TradingAgents：多智能体 LLM 金融交易框架深度解析</title><link>https://txtmix.com/posts/tech/quant/tradingagents-multi-agent-llm-financial-trading/</link><pubDate>Wed, 08 Apr 2026 12:30:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/quant/tradingagents-multi-agent-llm-financial-trading/</guid><description>&lt;p>TradingAgents 最值得看的地方，不是“让一个 LLM 直接给出买卖建议”，而是把投研团队里原本混在一起的四件事拆开了：信息采集、观点对抗、交易决策、组合审批。到 2026 年 5 月公开的 &lt;code>v0.2.5&lt;/code>，这个项目已经不只是论文配套 Demo。它有 CLI、Python 包、多提供商模型、LangGraph checkpoint、跨运行决策日志和 Docker；但它首先仍是研究框架，不是可以直接接券商账户的实盘执行系统。&lt;/p></description></item><item><title>Karpathy LLM Wiki：让AI自动维护你的知识库</title><link>https://txtmix.com/posts/tech/karpathy-llm-wiki-agent-skill-guide/</link><pubDate>Wed, 08 Apr 2026 11:10:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/karpathy-llm-wiki-agent-skill-guide/</guid><description>&lt;h1 id="karpathy-llm-wiki让ai自动维护你的知识库">Karpathy LLM Wiki：让AI自动维护你的知识库&lt;/h1>
&lt;h2 id="1-学习目标">1. 学习目标&lt;/h2>
&lt;p>通过本文你将掌握：&lt;/p>
&lt;ul>
&lt;li>理解 Karpathy LLM Wiki 的核心哲学&lt;/li>
&lt;li>熟练使用 Ingest、Query、Lint 三大操作&lt;/li>
&lt;li>在 Claude Code/Cursor/Codex 中安装和配置本技能&lt;/li>
&lt;li>构建个人知识库并实现自动维护&lt;/li>
&lt;li>解决实际使用中的常见问题&lt;/li>
&lt;/ul>
&lt;h2 id="2-背景与原理">2. 背景与原理&lt;/h2>
&lt;h3 id="21-karpathy-的-llm-wiki-理念">2.1 Karpathy 的 LLM Wiki 理念&lt;/h3>
&lt;p>2026年4月，AI 大神 Andrej Karpathy 提出了一个简洁而强大的概念：&lt;/p></description></item><item><title>Goose 入门指南：超越代码建议的可扩展AI Agent</title><link>https://txtmix.com/posts/tech/goose-aaif-extensible-ai-agent-guide/</link><pubDate>Tue, 07 Apr 2026 11:35:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/goose-aaif-extensible-ai-agent-guide/</guid><description>&lt;h1 id="goose-入门指南超越代码建议的可扩展-ai-agent">Goose 入门指南：超越代码建议的可扩展 AI Agent&lt;/h1>
&lt;h2 id="概述">概述&lt;/h2>
&lt;p>&lt;strong>Goose&lt;/strong>（&lt;a href="https://github.com/aaif-goose/goose" target="_blank" rel="noopener noreffer ">aaif-goose/goose&lt;/a>）是一个开源的、可扩展的 AI Agent，与传统的代码补全工具不同，它能够&lt;strong>安装、执行、编辑和测试任何 LLM&lt;/strong>。这是一个真正的自主代理，能够在你的开发环境中执行复杂任务。&lt;/p></description></item><item><title>Mini-Coding-Agent 源码深度解析：Sebastian Raschka 的代码代理第一性原理</title><link>https://txtmix.com/posts/tech/mini-coding-agent-sebastian-raschka-source-code-guide/</link><pubDate>Tue, 07 Apr 2026 01:05:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/mini-coding-agent-sebastian-raschka-source-code-guide/</guid><description>&lt;h2 id="学习目标">学习目标&lt;/h2>
&lt;p>通过本文，你将深入掌握以下核心能力：&lt;/p>
&lt;ul>
&lt;li>理解代码代理的六大核心组件的第一性原理&lt;/li>
&lt;li>深入理解 WorkspaceContext 如何构建实时仓库上下文&lt;/li>
&lt;li>掌握 Prompt Shape 如何实现缓存复用和计算节省&lt;/li>
&lt;li>理解 Structured Tools 的设计模式和批准机制&lt;/li>
&lt;li>掌握 Context Reduction 的去重和截断策略&lt;/li>
&lt;li>理解 Transcripts 和 Memory 的持久化设计&lt;/li>
&lt;li>掌握 Delegation 子代理的受限作用域机制&lt;/li>
&lt;li>从 ~650 行精简代码中领悟 AI Agent 的本质&lt;/li>
&lt;/ul>
&lt;hr>
&lt;h2 id="1-项目概述与架构总览">1. 项目概述与架构总览&lt;/h2>
&lt;h3 id="11-为什么选择-mini-coding-agent">1.1 为什么选择 Mini-Coding-Agent&lt;/h3>
&lt;p>Sebastian Raschka 明确指出：这是一个&lt;strong>教学示范项目&lt;/strong>，不是生产级代理。它的价值在于：&lt;/p></description></item><item><title>Mini-Coding-Agent：Sebastian Raschka 的极简代码代理框架完全指南</title><link>https://txtmix.com/posts/tech/mini-coding-agent-sebastian-raschka-guide/</link><pubDate>Tue, 07 Apr 2026 00:55:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/mini-coding-agent-sebastian-raschka-guide/</guid><description>&lt;h2 id="学习目标">学习目标&lt;/h2>
&lt;p>通过本文，你将全面掌握以下核心能力：&lt;/p>
&lt;ul>
&lt;li>深入理解 Mini-Coding-Agent 的设计哲学和极简架构&lt;/li>
&lt;li>学会安装配置 Ollama 环境和依赖&lt;/li>
&lt;li>掌握六大核心组件的原理和实现&lt;/li>
&lt;li>学会使用 CLI 工具和交互式命令&lt;/li>
&lt;li>理解会话恢复和内存持久化机制&lt;/li>
&lt;li>掌握批准模式和安全控制&lt;/li>
&lt;li>了解代码代理的实际应用场景&lt;/li>
&lt;/ul>
&lt;hr>
&lt;h2 id="1-项目概述">1. 项目概述&lt;/h2>
&lt;h3 id="11-是什么">1.1 是什么&lt;/h3>
&lt;p>&lt;strong>Mini-Coding-Agent&lt;/strong> 是 Sebastian Raschka（著名机器学习研究者、PyTorch 作者之一）创建的极简代码代理框架。它不是一个生产级 robust 的代理，而是一个&lt;strong>教学示范&lt;/strong>，通过最小可读的代码解释代码代理的核心组件。&lt;/p></description></item><item><title>awesome-llm-apps：105k Stars LLM应用精选合集完全指南</title><link>https://txtmix.com/posts/tech/awesome-llm-apps-curated-llm-application-projects-guide/</link><pubDate>Mon, 06 Apr 2026 22:40:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/awesome-llm-apps-curated-llm-application-projects-guide/</guid><description>&lt;h2 id="学习目标">学习目标&lt;/h2>
&lt;p>通过本文，你将全面掌握以下核心能力：&lt;/p>
&lt;ul>
&lt;li>深入理解 awesome-llm-apps 的项目定位和收录范围&lt;/li>
&lt;li>学会构建各类 AI Agent（starter 级、advanced 级）&lt;/li>
&lt;li>掌握多 Agent 团队协作开发模式&lt;/li>
&lt;li>理解 MCP（Model Context Protocol）的原理和应用&lt;/li>
&lt;li>学会构建 RAG、知识库、向量检索等实际应用&lt;/li>
&lt;li>掌握语音 AI Agent 开发技术&lt;/li>
&lt;li>理解 AI Agent 框架（Google ADK、OpenAI Agents SDK）&lt;/li>
&lt;/ul>
&lt;hr>
&lt;h2 id="1-项目概述">1. 项目概述&lt;/h2>
&lt;h3 id="11-是什么">1.1 是什么&lt;/h3>
&lt;p>&lt;strong>awesome-llm-apps&lt;/strong> 是一个精心策划的 LLM 应用精选合集，收录了大量基于 RAG、AI Agents、Multi-agent Teams、MCP、Voice Agents 等技术构建的 AI 应用。项目作者 Shubhamsaboo 来自 The Unwind AI 团队。&lt;/p></description></item><item><title>microsoft/generative-ai-for-beginners：109k Stars 生成式AI入门完全指南</title><link>https://txtmix.com/posts/tech/microsoft-generative-ai-for-beginners-course-guide/</link><pubDate>Mon, 06 Apr 2026 22:35:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/microsoft-generative-ai-for-beginners-course-guide/</guid><description>&lt;h2 id="学习目标">学习目标&lt;/h2>
&lt;p>通过本文，你将全面掌握以下核心能力：&lt;/p>
&lt;ul>
&lt;li>深入理解生成式 AI 和大语言模型（LLM）的工作原理&lt;/li>
&lt;li>学会在不同平台上运行 AI 应用（Azure OpenAI、GitHub Models、OpenAI API）&lt;/li>
&lt;li>掌握提示工程的核心技巧和进阶方法&lt;/li>
&lt;li>能够构建文本生成、聊天、搜索、图片生成等实际应用&lt;/li>
&lt;li>理解 RAG、Agent、微调等高级主题&lt;/li>
&lt;li>学会保护 AI 应用安全&lt;/li>
&lt;/ul>
&lt;hr>
&lt;h2 id="1-项目概述">1. 项目概述&lt;/h2>
&lt;h3 id="11-是什么">1.1 是什么&lt;/h3>
&lt;p>&lt;strong>microsoft/generative-ai-for-beginners&lt;/strong> 是微软官方推出的生成式 AI 入门课程，通过 &lt;strong>21 节精心设计的课程&lt;/strong>，帮助零基础学习者掌握生成式 AI 应用开发。&lt;/p></description></item><item><title>Ollama：本地大模型运行完全指南</title><link>https://txtmix.com/posts/tech/ollama-local-llm-guide/</link><pubDate>Mon, 06 Apr 2026 22:18:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/ollama-local-llm-guide/</guid><description>&lt;h2 id="学习目标">学习目标&lt;/h2>
&lt;p>通过本文，你将全面掌握以下核心能力：&lt;/p>
&lt;ul>
&lt;li>深入理解 Ollama 的项目定位、核心概念和设计理念&lt;/li>
&lt;li>掌握 Ollama 的安装、配置和基本使用方法&lt;/li>
&lt;li>学会运行和管理各种大模型（Llama、Gemma、Mistral 等）&lt;/li>
&lt;li>理解 Modelfile 自定义模型配置&lt;/li>
&lt;li>掌握 OpenAI 兼容 API 服务搭建&lt;/li>
&lt;li>理解 Agent 和 ReAct 模式&lt;/li>
&lt;li>学会 GPU 加速配置和多模态模型使用&lt;/li>
&lt;li>掌握 Ollama 与 LangChain 的集成方法&lt;/li>
&lt;/ul>
&lt;hr>
&lt;h2 id="1-项目概述">1. 项目概述&lt;/h2>
&lt;h3 id="11-是什么">1.1 是什么&lt;/h3>
&lt;p>&lt;strong>Ollama&lt;/strong> 是一个让你在&lt;strong>本地机器上运行开源大模型&lt;/strong>的平台。它提供了简单的命令来下载、运行和管理 AI 模型，无需云服务，完全离线可用。&lt;/p></description></item><item><title>Pi Mono：统一LLM API的AI Agent全栈工具箱</title><link>https://txtmix.com/posts/tech/pi-mono-ai-agent-toolkit/</link><pubDate>Mon, 06 Apr 2026 11:30:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/pi-mono-ai-agent-toolkit/</guid><description>&lt;h1 id="pi-mono统一llm-api的ai-agent全栈工具箱">Pi Mono：统一LLM API的AI Agent全栈工具箱&lt;/h1>
&lt;h2 id="1-学习目标">§1 学习目标&lt;/h2>
&lt;p>通过本文，您将掌握：&lt;/p>
&lt;ul>
&lt;li>Pi Mono的核心功能与架构设计&lt;/li>
&lt;li>如何使用Pi Mono的编码Agent CLI&lt;/li>
&lt;li>统一LLM API的配置与使用&lt;/li>
&lt;li>TUI与Web UI的部署方法&lt;/li>
&lt;li>Slack机器人与vLLM Pod的集成&lt;/li>
&lt;li>最佳实践与开发扩展指南&lt;/li>
&lt;/ul>
&lt;hr>
&lt;h2 id="2-原理分析">§2 原理分析&lt;/h2>
&lt;h3 id="21-什么是pi-mono">2.1 什么是Pi Mono？&lt;/h3>
&lt;p>&lt;strong>Pi Mono&lt;/strong>（GitHub: &lt;a href="https://github.com/badlogic/pi-mono" target="_blank" rel="noopener noreffer ">badlogic/pi-mono&lt;/a>）是一款开源AI Agent工具箱，由知名开发者badlogic创建。该工具箱将多个AI开发组件整合到一个统一的框架中：&lt;/p></description></item><item><title>Nanobot：超轻量级个人 AI 助手专家级技术文档</title><link>https://txtmix.com/posts/tech/nanobot-ultra-lightweight-ai-assistant/</link><pubDate>Mon, 30 Mar 2026 14:26:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/nanobot-ultra-lightweight-ai-assistant/</guid><description>&lt;h1 id="nanobot超轻量级个人-ai-助手专家级技术文档">Nanobot：超轻量级个人 AI 助手专家级技术文档&lt;/h1>
&lt;blockquote>
&lt;p>&lt;strong>目标读者&lt;/strong>：想要掌握 Nanobot 的开发者、AI 爱好者和技术决策者
&lt;strong>核心问题&lt;/strong>：Nanobot 是什么？如何设计架构？如何定制和扩展？&lt;/p>&lt;/blockquote>
&lt;hr>
&lt;h2 id="1-学习目标">1. 学习目标&lt;/h2>
&lt;p>完成本文档后，你将掌握：&lt;/p></description></item><item><title>Pi Monorepo：开源 AI Agent 工具包专家级技术文档</title><link>https://txtmix.com/posts/tech/ai-agent/pi-mono-ai-agent-toolkit/</link><pubDate>Mon, 30 Mar 2026 13:03:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/ai-agent/pi-mono-ai-agent-toolkit/</guid><description>&lt;h1 id="pi-monorepo开源-ai-agent-工具包专家级技术文档">Pi Monorepo：开源 AI Agent 工具包专家级技术文档&lt;/h1>
&lt;blockquote>
&lt;p>预计阅读时间：35分钟 | 难度：⭐⭐⭐⭐&lt;/p>&lt;/blockquote>
&lt;hr>
&lt;blockquote>
&lt;p>&lt;strong>目标读者&lt;/strong>：想要掌握 Pi Monorepo 的开发者、AI 应用工程师和技术决策者&lt;/p></description></item><item><title>Quantization 量化技术完全指南：从原理到 LLM 实战</title><link>https://txtmix.com/posts/tech/llm/quantization-llm-model-compression-guide/</link><pubDate>Sun, 29 Mar 2026 23:28:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/llm/quantization-llm-model-compression-guide/</guid><description>&lt;hr>
&lt;h2 id="一先看一个惊人的事实">一、先看一个惊人的事实&lt;/h2>
&lt;p>&lt;strong>Qwen-3-Coder-Next&lt;/strong> 是一个 800 亿参数的模型：&lt;/p>
&lt;ul>
&lt;li>&lt;strong>体积：159.4GB&lt;/strong>&lt;/li>
&lt;li>需要至少 159GB 内存才能运行&lt;/li>
&lt;li>这还不算「大型」模型——据说前沿模型超过 &lt;strong>1 万亿&lt;/strong>参数，需要 &lt;strong>2TB+&lt;/strong> 内存&lt;/li>
&lt;/ul>
&lt;p>&lt;strong>但如果我告诉你：&lt;/strong>&lt;/p></description></item><item><title>AI 编程 Agent 的 Harness 设计：如何让大模型更稳定地产出高质量代码</title><link>https://txtmix.com/posts/tech/ai-agent/ai-agent-harness-design-long-running-applications/</link><pubDate>Sun, 29 Mar 2026 23:07:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/ai-agent/ai-agent-harness-design-long-running-applications/</guid><description>&lt;h1 id="ai-编程-agent-的-harness-设计如何让大模型更稳定地产出高质量代码">AI 编程 Agent 的 Harness 设计：如何让大模型更稳定地产出高质量代码&lt;/h1>
&lt;blockquote>
&lt;p>预计阅读时间：40分钟 | 难度：⭐⭐⭐⭐&lt;/p>&lt;/blockquote>
&lt;p>单靠把模型放进一个循环里，并不能稳定产出高质量应用。真正决定上限的，往往不是模型会不会写代码，而是系统能不能持续完成三件事：把任务拆对、把进度交清、把结果验真。&lt;/p></description></item><item><title>AI Scientist-v2：智能体树搜索驱动的自动化科研论文生成</title><link>https://txtmix.com/posts/tech/ai-agent/ai-scientist-v2-agentic-tree-search/</link><pubDate>Sun, 29 Mar 2026 15:47:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/ai-agent/ai-scientist-v2-agentic-tree-search/</guid><description>&lt;h1 id="ai-scientist-v2智能体树搜索驱动的自动化科研论文生成">AI Scientist-v2：智能体树搜索驱动的自动化科研论文生成&lt;/h1>
&lt;blockquote>
&lt;p>预计阅读时间：30分钟 | 难度：⭐⭐⭐&lt;/p>&lt;/blockquote>
&lt;hr>
&lt;h2 id="一项目概览">一、项目概览&lt;/h2>
&lt;p>&lt;strong>AI Scientist-v2&lt;/strong> 是由 SakanaAI 开发的一个通用端到端智能体系统，能够自主完成科学研究流程：提出假设、设计实验、运行实验、分析数据，并撰写科学论文。该项目在 GitHub 上获得了 &lt;strong>3.6k Stars&lt;/strong> 和 &lt;strong>545 Forks&lt;/strong>，成为 AI 自动化科研领域的标杆项目。&lt;/p></description></item></channel></rss>