<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>机器学习 on Text Matrix</title><link>https://txtmix.com/tags/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/</link><description>Recent content in 机器学习 on Text Matrix</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Sat, 23 May 2026 08:55:34 +0800</lastBuildDate><atom:link href="https://txtmix.com/tags/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/index.xml" rel="self" type="application/rss+xml"/><item><title>paper2code：用AI把arxiv论文变成可验证的代码实现，1.2k星的开源技能</title><link>https://txtmix.com/posts/tech/paper2code-ai-arxiv-paper-implementation/</link><pubDate>Mon, 11 May 2026 17:50:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/paper2code-ai-arxiv-paper-implementation/</guid><description>&lt;blockquote>
&lt;p>&amp;ldquo;LLM 生成的代码运行正常但不匹配论文。更糟的是，你分不清哪些来自论文，哪些是模型自己编造的。&amp;quot;——paper2code 的 README 开篇就点破了当前 AI 代码生成的致命问题。&lt;/p></description></item><item><title>TabPFN：表格数据的 GPT 时刻，革命性 AutoML 基础模型</title><link>https://txtmix.com/posts/tech/tabpfn-foundation-model-tabular-data-guide/</link><pubDate>Fri, 08 May 2026 03:11:04 +0800</pubDate><guid>https://txtmix.com/posts/tech/tabpfn-foundation-model-tabular-data-guide/</guid><description>&lt;h2 id="学习目标">学习目标&lt;/h2>
&lt;p>读完这篇文章后，你应该能够：&lt;/p>
&lt;ol>
&lt;li>理解 TabPFN 作为&amp;quot;表格数据基础模型&amp;quot;的设计理念，以及它与传统 AutoML 管道的本质区别。&lt;/li>
&lt;li>解释 TabPFN 如何通过 In-Context Learning 在不更新参数的情况下完成新任务。&lt;/li>
&lt;li>掌握 TabPFN 的 Python API 使用方法，能够在真实数据集上快速完成分类/回归任务。&lt;/li>
&lt;li>判断 TabPFN 与传统 AutoML（如 AutoGluon、FLAML）以及深度学习表格模型（如 FT-Transformer）的各自适用场景。&lt;/li>
&lt;li>了解 TabPFN 的当前限制和团队的未来路线图。&lt;/li>
&lt;/ol>
&lt;hr>
&lt;h2 id="一项目概述">一、项目概述&lt;/h2>
&lt;h3 id="11-什么是-tabpfn">1.1 什么是 TabPFN&lt;/h3>
&lt;p>&lt;strong>TabPFN&lt;/strong>（&lt;a href="https://github.com/PriorLabs/TabPFN" target="_blank" rel="noopener noreffer ">PriorLabs/TabPFN&lt;/a>，6.7k Stars）全称是 &amp;ldquo;Tabular Prior-Data Fitted Network&amp;rdquo;，是一个专为表格数据（Tabular Data）设计的预训练 Transformer 模型。&lt;/p></description></item><item><title>TabPFN: 表格数据的 Foundation Model 完整指南</title><link>https://txtmix.com/posts/tech/tabpfn-tabular-foundation-model-guide/</link><pubDate>Wed, 06 May 2026 10:07:31 +0800</pubDate><guid>https://txtmix.com/posts/tech/tabpfn-tabular-foundation-model-guide/</guid><description>&lt;h1 id="tabpfn-表格数据的-foundation-model-完整指南">TabPFN: 表格数据的 Foundation Model 完整指南&lt;/h1>
&lt;p>机器学习实践中，表格数据是最常见也最顽固的领域之一。长期以来，处理表格数据的标准流程是：选模型、调超参、反复训练——这一套下来，少则几十分钟，多则几天。面对一个陌生数据集，光是跑通一个 Baseline，就可能耗掉工程师大半天时间。&lt;/p></description></item><item><title>HuggingFace ml-intern：开源AI工程师，从读论文到训练模型一手包办</title><link>https://txtmix.com/posts/tech/ml-intern-huggingface-autonomous-ml-agent/</link><pubDate>Sat, 25 Apr 2026 11:35:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/ml-intern-huggingface-autonomous-ml-agent/</guid><description>&lt;h1 id="huggingface-ml-intern开源ai工程师从读论文到训练模型一手包办">HuggingFace ml-intern：开源AI工程师，从读论文到训练模型一手包办&lt;/h1>
&lt;blockquote>
&lt;p>&lt;strong>项目地址&lt;/strong>：&lt;a href="https://github.com/huggingface/ml-intern" target="_blank" rel="noopener noreffer ">huggingface/ml-intern&lt;/a>&lt;/p>&lt;/blockquote>
&lt;h2 id="什么是-ml-intern">什么是 ml-intern？&lt;/h2>
&lt;p>ml-intern 是 HuggingFace 开源的一个&lt;strong>自主AI工程师&lt;/strong>，能够自主研究论文、编写代码、训练模型，并将ML项目完整交付。它利用HuggingFace生态系统，具备深度访问文档、论文、数据集和云计算资源的能力。&lt;/p></description></item><item><title>ONNX Runtime：微软开源的跨平台机器学习推理加速器</title><link>https://txtmix.com/posts/tech/microsoft-onnx-runtime-guide/</link><pubDate>Fri, 24 Apr 2026 12:00:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/microsoft-onnx-runtime-guide/</guid><description>&lt;h1 id="onnx-runtime微软开源的跨平台机器学习推理加速器">ONNX Runtime：微软开源的跨平台机器学习推理加速器&lt;/h1>
&lt;blockquote>
&lt;p>&lt;strong>项目地址&lt;/strong>：&lt;a href="https://github.com/microsoft/onnxruntime" target="_blank" rel="noopener noreffer ">github.com/microsoft/onnxruntime&lt;/a>&lt;/p>
&lt;p>&lt;strong>核心理念&lt;/strong>：让 ML 模型在任何平台上都能获得最佳的推理性能。&lt;/p>&lt;/blockquote>
&lt;h2 id="项目概览">项目概览&lt;/h2>
&lt;p>ONNX Runtime 是微软开源的跨平台机器学习推理和训练加速器。它可以将 ONNX（Open Neural Network Exchange）格式的模型部署到各种平台和设备上，通过硬件加速器和图优化提供最佳性能。&lt;/p></description></item><item><title>Claude-Mem：60K Stars·AI记忆系统·让Claude跨越会话持续学习</title><link>https://txtmix.com/posts/tech/claude-mem-persistent-memory-system-guide/</link><pubDate>Sun, 12 Apr 2026 02:31:39 +0800</pubDate><guid>https://txtmix.com/posts/tech/claude-mem-persistent-memory-system-guide/</guid><description>&lt;h1 id="claude-mem48k-starsai记忆系统让claude跨越会话持续学习">Claude-Mem：48K Stars·AI记忆系统·让Claude跨越会话持续学习&lt;/h1>
&lt;h2 id="一项目概述">一、项目概述&lt;/h2>
&lt;h3 id="11-claude-mem-是什么">1.1 Claude-Mem 是什么&lt;/h3>
&lt;p>&lt;strong>Claude-Mem&lt;/strong> 是专为 Claude Code 打造的&lt;strong>持久化记忆压缩系统&lt;/strong>，让 AI 在多次会话之间保持上下文连续性。&lt;/p></description></item><item><title>Hindsight：Agent记忆系统·最准确的记忆系统·SOTA性能</title><link>https://txtmix.com/posts/tech/hindsight-agent-memory-system-guide/</link><pubDate>Sun, 12 Apr 2026 02:31:39 +0800</pubDate><guid>https://txtmix.com/posts/tech/hindsight-agent-memory-system-guide/</guid><description>&lt;h1 id="hindsightagent记忆系统最准确的记忆系统sota性能89k-stars">Hindsight：Agent记忆系统·最准确的记忆系统·SOTA性能·8.9K Stars&lt;/h1>
&lt;h2 id="一项目概述">一、项目概述&lt;/h2>
&lt;h3 id="11-hindsight-是什么">1.1 Hindsight 是什么&lt;/h3>
&lt;p>&lt;strong>Hindsight™&lt;/strong> 是专为 AI Agent 设计的&lt;strong>记忆系统&lt;/strong>，让 Agent 不仅能记住对话历史，更能从经验中学习。&lt;/p>
&lt;blockquote>
&lt;p>&amp;ldquo;Hindsight™ is an agent memory system built to create smarter agents that learn over time. Most agent memory systems focus on recalling conversation history. Hindsight is focused on making agents that learn, not just remember.&amp;rdquo;&lt;/p></description></item><item><title>Rockyzsu/stock：7.5K Stars·Python量化交易系统</title><link>https://txtmix.com/posts/tech/rockyzsu-stock-quant-trading-system-guide/</link><pubDate>Sun, 12 Apr 2026 02:31:39 +0800</pubDate><guid>https://txtmix.com/posts/tech/rockyzsu-stock-quant-trading-system-guide/</guid><description>&lt;h1 id="rockyzsustock75k-starspython量化交易系统a股港股基金转债全覆盖机器学习技术分析">Rockyzsu/stock：7.5K Stars·Python量化交易系统·A股/港股/基金/转债全覆盖·机器学习+技术分析&lt;/h1>
&lt;h2 id="一项目概述">一，项目概述&lt;/h2>
&lt;h3 id="11-项目定位">1.1 项目定位&lt;/h3>
&lt;p>&lt;strong>Rockyzsu/stock&lt;/strong> 是一个&lt;strong>面向中文市场的Python量化交易系统&lt;/strong>，作者署名Rocky Chen，slogan是&amp;quot;更好的帮助自己炒股(亏钱-。-)&amp;quot;。&lt;/p></description></item><item><title>Scientific Agent Skills：AI科学家必备的134个科研技能库</title><link>https://txtmix.com/posts/tech/scientific-agent-skills-ai-scientist-complete-guide/</link><pubDate>Sun, 12 Apr 2026 02:31:39 +0800</pubDate><guid>https://txtmix.com/posts/tech/scientific-agent-skills-ai-scientist-complete-guide/</guid><description>&lt;h1 id="scientific-agent-skillsai科学家必备的134个科研技能库">Scientific Agent Skills：AI科学家必备的134个科研技能库&lt;/h1>
&lt;h2 id="一项目概述">一、项目概述&lt;/h2>
&lt;h3 id="11-scientific-agent-skills-是什么">1.1 Scientific Agent Skills 是什么&lt;/h3>
&lt;p>&lt;strong>Scientific Agent Skills&lt;/strong> 是 K-Dense 公司开发的&lt;strong>AI科学家技能库&lt;/strong>，包含 134 个精心策划的科研技能，覆盖生物信息学、药物研发、临床研究、机器学习等 17 个科学领域。&lt;/p></description></item><item><title>Qlib：微软亚洲研究院 AI 量化投资平台从入门到精通</title><link>https://txtmix.com/posts/tech/quant/qlib-ai-quantitative-investment-platform-guide/</link><pubDate>Wed, 08 Apr 2026 15:00:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/quant/qlib-ai-quantitative-investment-platform-guide/</guid><description>&lt;blockquote>
&lt;p>&lt;strong>目标读者&lt;/strong>：想要系统掌握 Qlib 架构与应用的量化开发者、AI 研究者
&lt;strong>核心问题&lt;/strong>：Qlib 是什么？它的数据层、模型层、策略层如何协同？华炎低代码模块如何使用？
&lt;strong>难度&lt;/strong>：⭐⭐⭐⭐（专家设计）
&lt;strong>预计阅读时间&lt;/strong>：50 分钟&lt;/p></description></item><item><title>GEPA：基于反射式文本进化的 AI 系统优化框架完全指南</title><link>https://txtmix.com/posts/tech/gepa-genetic-pareto-optimization-guide/</link><pubDate>Wed, 01 Apr 2026 01:04:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/gepa-genetic-pareto-optimization-guide/</guid><description>&lt;h1 id="gepa基于反射式文本进化的-ai-系统优化框架完全指南">GEPA：基于反射式文本进化的 AI 系统优化框架完全指南&lt;/h1>
&lt;h2 id="1-学习目标">§1 学习目标&lt;/h2>
&lt;p>完成本文档后，你将能够：&lt;/p>
&lt;ul>
&lt;li>✅ 理解 GEPA 的核心定位与设计理念&lt;/li>
&lt;li>✅ 掌握 GEPA 的安装与基本使用方法&lt;/li>
&lt;li>✅ 理解 GEPA 的反射式进化算法工作原理&lt;/li>
&lt;li>✅ 使用 GEPA 优化提示词、系统配置和智能体架构&lt;/li>
&lt;li>✅ 掌握 GEPA 与 DSPy、MLflow 等主流框架的集成方法&lt;/li>
&lt;li>✅ 理解 Pareto 前沿与 Actionable Side Information 概念&lt;/li>
&lt;li>✅ 使用 GEPA 适配器构建自定义优化系统&lt;/li>
&lt;/ul>
&lt;hr>
&lt;h2 id="2-项目概述">§2 项目概述&lt;/h2>
&lt;h3 id="21-什么是-gepa">2.1 什么是 GEPA？&lt;/h3>
&lt;p>&lt;strong>GEPA&lt;/strong>（Genetic-Pareto，&lt;a href="https://github.com/gepa-ai/gepa" target="_blank" rel="noopener noreffer ">GitHub 仓库&lt;/a>）是一个用于优化任何文本参数系统的框架，支持提示词、代码、智能体架构、配置等任何文本内容的优化。&lt;/p></description></item><item><title>Simple ML Code：机器学习从入门到实践的保姆级教程</title><link>https://txtmix.com/posts/tech/simple-ml-code-machine-learning-tutorial/</link><pubDate>Sun, 29 Mar 2026 21:30:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/simple-ml-code-machine-learning-tutorial/</guid><description>&lt;h1 id="simple-ml-code机器学习从入门到实践的保姆级教程">Simple ML Code：机器学习从入门到实践的保姆级教程&lt;/h1>
&lt;blockquote>
&lt;p>一文读懂 Datawhale 出品的机器学习实战教程，从理论到代码，从算法到调参全覆盖&lt;/p>&lt;/blockquote>
&lt;p>&lt;strong>学习目标&lt;/strong>&lt;/p>
&lt;p>学完本文后，你将掌握：&lt;/p></description></item></channel></rss>