<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>大模型训练 on Text Matrix</title><link>https://txtmix.com/tags/%E5%A4%A7%E6%A8%A1%E5%9E%8B%E8%AE%AD%E7%BB%83/</link><description>Recent content in 大模型训练 on Text Matrix</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Sat, 23 May 2026 08:55:34 +0800</lastBuildDate><atom:link href="https://txtmix.com/tags/%E5%A4%A7%E6%A8%A1%E5%9E%8B%E8%AE%AD%E7%BB%83/index.xml" rel="self" type="application/rss+xml"/><item><title>姚顺宇 4 小时访谈精读：AI 为什么从天才竞赛变成系统工程竞赛</title><link>https://txtmix.com/posts/video/yao-shunyu-4-hour-interview-anthropic-gemini/</link><pubDate>Mon, 11 May 2026 23:50:00 +0800</pubDate><guid>https://txtmix.com/posts/video/yao-shunyu-4-hour-interview-anthropic-gemini/</guid><description>这篇文章围绕姚顺宇在访谈里反复强调的几件事展开：AI 为什么越来越像系统工程，研究里怎样区分 bug、错误假设和被做漂亮的指标，个人英雄主义为何在模型训练里退潮，聊天机器人为什么未必是终局，以及 Anthropic 与 Google DeepMind 的组织差异怎样传导到模型训练。</description></item><item><title>MiniMind：从零开始用3块钱训练64M参数的大语言模型</title><link>https://txtmix.com/posts/tech/llm/minimind-llm-training-from-scratch/</link><pubDate>Sun, 12 Apr 2026 12:00:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/llm/minimind-llm-training-from-scratch/</guid><description>&lt;h1 id="minimind从零开始用3块钱训练64m参数的大语言模型">MiniMind：从零开始用3块钱训练64M参数的大语言模型&lt;/h1>
&lt;h2 id="一项目概览">一、项目概览&lt;/h2>
&lt;p>&lt;strong>MiniMind&lt;/strong> 是由 jingyaogong 开发的开源大语言模型训练项目，其核心理念是&amp;quot;大道至简&amp;quot;——让每个人都能从零开始，仅用约 3 元钱成本与 2 小时训练时间，即可训练出规模约为 64M 参数的超小型语言模型 MiniMind。&lt;/p></description></item></channel></rss>