LLM on Text Matrix

AI Engineering From Scratch：一份从"会调用API"到"能独立构建AI系统"的完整路线图

Wed, 20 May 2026 20:25:00 +0800

这份教程真正在解决什么问题

AI学习材料的最大问题不是太少，而是太碎片。一篇论文解读、一个微调教程、一个Agent demo，各自独立，没有一条线把它们串起来。你学完可能能调用API，但说不清楚Attention在模型内部做了什么；能跑通一个RAG流程，但不知道tokenizer的BPE分词是怎么训练的。

AI Engineering From Scratch：从零构建AI工程能力

Wed, 20 May 2026 20:00:00 +0800

项目概览

AI Engineering From Scratch是一个从零开始学习AI工程的免费教程，由Rohit Gupta创建并维护。与其他教程不同，它不是简单罗列概念，而是真正带着你动手构建：从LLM基础到RAG实现，从提示工程到Agent开发，从模型微调到生产部署。

12-Factor Agents：构建可投产 AI 应用的全方位工程原则

Mon, 18 May 2026 21:10:00 +0800

用 LLM 做产品，很多人容易掉进两个坑：要么迷信「给个 prompt、加一堆工具、循环到目标达成」的万能 Agent 范式；要么把 LLM 当成增强搜索，塞进一堆 if-else 里。

Dex（humanlayer/12-factor-agents 作者）的观察是：真正能交付给生产用户的 LLM 软件，大多数不是纯 Agent，而是软件 + LLM 步骤的混合体——好的 AI 产品，本质是软件，只是恰好在某些关键节点引入了 LLM。

Claude Code 在大型代码库中的工作原理：最佳实践与入门指南

Sat, 16 May 2026 11:55:00 +0800

在数百万行代码的单体仓库、数十年历史的遗留系统、跨数十个代码库的分布式架构中，Claude Code 如何找到正确的上下文并完成工作？Anthropic 通过大量生产环境观察，总结出三大核心配置模式：让代码库可被导航、随模型进化维护 CLAUDE.md、以及为 Claude Code 管理分配明确的 Owner。

NVIDIA AI Blueprint：视频搜索与摘要系统实战

Fri, 15 May 2026 10:25:00 +0800

NVIDIA AI Blueprint：视频搜索与摘要系统实战

如果你曾经需要在一万小时的视频里找一个"穿红色衣服的人第三秒做了什么"，而你只有抓狂和快进两种选择——NVIDIA 的视频搜索和摘要（VSS）蓝图，就是为你准备的。

LLMs-from-Scratch：从零构建 GPT -like LLM 的权威指南

Thu, 14 May 2026 12:46:00 +0800

项目概览

LLMs-from-scratch 是知名 AI 研究者和教育者 Sebastian Raschka 的新作《Build a Large Language Model (From Scratch)》的官方配套代码仓库。与市面上大多数 LLM 科普或 API 使用教程不同，这本书（及其配套代码）的核心目标是从零开始手写一个 GPT-like 大语言模型，让读者真正理解 LLM 内部每一层的工作原理，而非仅仅是调用别人的 API。

LLMs-from-Scratch：用 PyTorch 从零实现 ChatGPT 级大模型

Wed, 13 May 2026 20:15:00 +0800

LLMs-from-Scratch：用 PyTorch 从零实现 ChatGPT 级大模型

很多人学习大语言模型（Large Language Model，LLM）时，会直接调用 transformers、Hugging Face 等现成库快速出结果。这种方式效率很高，但容易陷入"知其然不知其所以然"的困境——模型的内部机制、权重从何而来、注意力如何计算，很多人不甚了解。

oMLX：macOS菜单栏管理13k星的LLM推理服务器，连续批处理+SSD缓存

Mon, 11 May 2026 13:10:00 +0800

“我试过的每个 LLM 服务器都要我在便利性和控制性之间二选一。我想把常用模型常驻内存，把重的模型自动 swap 到 SSD，还能设置上下文限制——全部从菜单栏管理。这就是我造 oMLX 的原因。”

DFlash：块扩散加速的 LLM 推测解码技术

Fri, 08 May 2026 03:11:04 +0800

学习目标

读完这篇文章后，你应该能够：

理解传统推测解码（Speculative Decoding）的基本原理及其自回归草案模型的局限性。
解释 DFlash 的块扩散（Block Diffusion）草案模型是如何工作的，以及为什么块级别的扩散比逐 Token 自回归更快。
查看官方支持模型列表，找到对应 Hugging Face 上的 DFlash 适配模型。
在本地环境配置 DFlash 并测试其加速效果。
判断 DFlash 适合哪些硬件配置和使用场景。

一、项目概述

1.1 什么是 DFlash

DFlash（z-lab/dflash，3.4k Stars）全称是 “Block Diffusion for Flash Speculative Decoding”——一种基于块扩散的 Flash 推测解码框架。它由 z-lab 团队提出，核心创新是用轻量级块扩散模型代替传统推测解码中的自回归草案模型（Draft Model），从而实现更高的推理加速比。

PageIndex：无向量数据库的推理型 RAG 基础设施

Fri, 08 May 2026 03:11:04 +0800

学习目标

读完这篇文章后，你应该能够：

解释为什么传统基于向量的 RAG 在复杂推理任务中存在瓶颈，以及 PageIndex 的推理型检索如何绕过这一限制。
理解 PageIndex 的核心设计：不建向量索引、不做文档分块、直接利用 LLM 推理能力做上下文感知识别。
掌握 PageIndex 的 MCP 协议集成方式和 API 调用方法，能够在自己的应用中添加 PageIndex 支持。
判断 PageIndex 适合哪些场景，不适合哪些场景，以及它与普通向量 RAG 的取舍。

一、项目概述

1.1 什么是 PageIndex

PageIndex（VectifyAI/PageIndex，29.4k Stars）是一个基于推理（Reasoning-based）的 RAG 框架。与传统 RAG 将文档切成片段、映射到高维向量空间不同，PageIndex 直接利用 LLM 的推理能力做文档索引和检索，声称可以实现"无向量数据库"（Vectorless）的 RAG 方案。

2026年提示词工程进阶策略：Expert Panel、Compression Protocol、ReAct与四层框架

Wed, 06 May 2026 23:59:00 +0800

2026 年的提示词工程，重点已经从“把一句话写漂亮”转向“定义成功标准、组织上下文、设计工具循环与诊断失效层级”。文章围绕 Expert Panel、Compression Protocol、ReAct 与四层框架，说明它们分别解决什么问题、如何落地，以及何时不该继续加码。

free-llm-api-resources：免费LLM API资源汇总清单

Wed, 06 May 2026 20:05:34 +0800

free-llm-api-resources 是一个由社区维护的免费 LLM API 资源清单，旨在帮助开发者快速找到可以免费使用或试用的大语言模型 API 服务。该项目持续更新，涵盖了从免费层到试用积分等多种形式的资源。

HeavySkill 完全指南：测试时 Scaling 的推理增强技术

Wed, 06 May 2026 18:19:57 +0800

HeavySkill 完全指南：测试时 Scaling 的推理增强技术

难度：⭐⭐⭐⭐ | 类型：专家设计 | 更新日期：2026-05-06 | 预计阅读时间：25 分钟

目标读者：AI 研究者、LLM 应用开发者、Agent 系统架构师

DeepSeek-TUI：Rust 终端里的 DeepSeek 编程智能体

Tue, 05 May 2026 20:19:00 +0800

DeepSeek-TUI：Rust 终端里的 DeepSeek 编程智能体

DeepSeek-TUI 是一个 Rust 编写的终端编程智能体，专门对接 DeepSeek 系列模型，提供代码补全、修改、重构和 Git 操作能力。相比 Electron/JavaScript 方案，Rust 的二进制体积小、启动快、内存占用低，适合对性能有要求的开发者。

Context Mode：解决 AI 编程 Agent 的另一半上下文问题

Tue, 05 May 2026 20:18:00 +0800

Context Mode：解决 AI 编程 Agent 的另一半上下文问题

Context Mode 解决的是 AI 编程 Agent 场景里被长期忽视的另一半问题：当你在用 Claude Code、Cursor 或 Gemini CLI 时，每次 MCP 工具调用都在往 context window 里塞原始数据——一个 Playwright 快照 56 KB，20 个 GitHub issues 59 KB，一个 access log 45 KB。30 分钟后，40% 的 context 被这些数据吃掉，而当 agent 压缩对话腾空间时，它忘了正在改哪个文件、有哪些任务在进行、你最后要求了什么。

TradingAgents：Multi-Agent LLM 金融交易框架深度解析

Mon, 04 May 2026 11:45:00 +0800

TradingAgents：Multi-Agent LLM 金融交易框架深度解析

目标读者：掌握 Python 基础、了解 LLM 基本概念，想了解 AI Agent 在金融领域应用的开发者 预计阅读时间：20 分钟 前置知识：LangGraph 入门 ⭐⭐ | LLM API 调用基础 ⭐ GitHub：https://github.com/TauricResearch/TradingAgents | Stars：65,532 ⭐

TradingAgents 全面指南：多 Agent 大模型金融交易框架从入门到精通

Sat, 02 May 2026 15:04:08 +0800

目标读者：想系统掌握 LLM 多 Agent 协作在金融交易场景落地的工程师与研究者 核心问题：TradingAgents 是如何把"分析师团队 + 研究员辩论 + 交易员决策 + 风控审批"这套真实交易逻辑翻译成可运行的多 Agent 工作流的？每个 Agent 的职责边界在哪里？系统如何做到可恢复、可积累的？难度：⭐⭐⭐⭐（高级工程实践，需要一定 Python 基础与 LLM 使用经验） 预计阅读时间：25 分钟

Dify：开源 Agentic Workflow 开发平台从入门到精通指南

Sat, 02 May 2026 10:12:21 +0800

前言

大语言模型（LLM）从概念验证走向生产环境，中间隔着工程化、可靠性、可观测性三道坎。许多团队在 Prompt 调优阶段顺风顺水，却在接入真实业务流程时发现：日志往哪看？多模型怎么切换？RAG 管道怎么管理？生产流量怎么控制？这些问题的答案，往往是一套完善的 Agentic Workflow 平台才能提供的。

Open WebUI：开源自托管 AI 界面完全指南——从原理到精通

Sat, 02 May 2026 10:11:52 +0800

Open WebUI：开源自托管 AI 界面完全指南——从原理到精通

在大模型落地生产的过程中，一个好用的前端界面往往是决定团队协作效率的关键。Open WebUI 就是这样一款工具——它将 Ollama、OpenAI 兼容 API 以及各种本地 / 云端大模型统一封装到一个界面中，让非技术用户也能顺畅地与 AI 交互，同时为企业场景保留了精细的权限管理和插件扩展能力。

Agent技术全史：从1960年代逻辑代理到2026年通用数字代理的史诗旅程

Fri, 01 May 2026 13:50:00 +0800

Agent技术全史：从1960年代逻辑代理到2026年通用数字代理的史诗旅程

目标读者：想系统理解 AI Agent 技术演进史、从学术脉络到产业落地的开发者与研究者 核心问题：Agent 技术经历了怎样的范式迁移？为什么 Language Agent 在过去三年迎来爆发？OpenClaw Moment 意味着什么？难度：⭐⭐⭐⭐⭐ | 来源：微博 @张小珺Benita，2026-05-01 | 嘉宾：苏煜（俄亥俄州立大学计算机系教授、NeoCognition 创始人）

LangFlow: 可视化 AI 工作流编排平台

Thu, 30 Apr 2026 20:00:00 +0800

项目概览

LangFlow 是由 langflow-ai 组织维护的开源项目（GitHub: langflow-ai/langflow），目前已积累超过 147,000 颗星，是 AI 工作流可视化编排领域中最受欢迎的开源项目之一。

Caveman：让 AI 用「山顶洞人语言」说话，砍掉 65% Token 消耗

Thu, 30 Apr 2026 11:30:00 +0800

引言：一个反直觉的发现

2026 年 4 月，一个名为 caveman 的 Claude Code 插件在 GitHub 迅速走红——上线不到一个月斩获 50,544 颗星，2,680 个 Fork，话题覆盖 Hacker News 头版。这个项目的核心理念看似荒诞：

RTX 3090 本地运行 LLM 实战：vLLM 与 llama.cpp 双引擎对比

Wed, 29 Apr 2026 20:35:22 +0800

RTX 3090 本地运行 LLM 实战：vLLM 与 llama.cpp 双引擎对比

前言

消费级 GPU 跑大语言模型，这事在 2024 年还属于"勉强能跑但体验糟糕"的范畴。到了 2026 年，量化技术、工程优化和推理引擎的共同进步，让这个目标变得真正实用了。

OpenKB：开源 LLM 知识库——无向量检索的长文档处理新范式

Wed, 29 Apr 2026 20:13:00 +0800

项目概览

OpenKB（Open LLM Knowledge Base）是一个 2026 年 4 月刚刚发布就登上 GitHub Trending 的开源项目，截至 4 月 29 日已收获 851 Stars 和 81 Forks。它将自己定位为"Scale to long documents • Reasoning-based retrieval • Native multi-modality • No Vector DB"的知识库系统——没有向量数据库，是它最显著的区别于传统 RAG（Retrieval-Augmented Generation）方案的特性。

DeepSeek-V3 技术解析：671B 参数开源大模型的工程奇迹

Mon, 27 Apr 2026 20:00:00 +0800

DeepSeek-V3 技术解析：671B 参数开源大模型的工程奇迹

目标读者：具备一定大语言模型基础认知的开发者与研究者 核心问题：DeepSeek-V3 是如何以极低训练成本实现顶级性能的？其核心架构做了哪些关键设计决策？

RTK：Rust 写的高性能 CLI 代理，Claude Code 场景节省 80% Token

Mon, 27 Apr 2026 01:03:00 +0800

RTK：Rust 写的高性能 CLI 代理，Claude Code 场景节省 80% Token

一个 Claude Code 会话（30分钟）里，开发者的 shell 命令会消耗约 118,000 tokens。用了 RTK，同样的操作只消耗约 23,900 tokens，节省 80%。

TurboQuant+ 深度解读：LLM KV 缓存极限压缩的工程实践

Thu, 23 Apr 2026 21:07:12 +0800

项目概览

TurboQuant+ 是对 Google Research TurboQuant 论文（ICLR 2026）的开源实现与扩展工程。截至 2026 年 4 月，该项目已获得 6,482 Stars 和 872 Forks，是近期最具影响力的 LLM 推理优化开源项目之一。

Datawhale 大模型基础：从理论到实战的完整 LLM 知识体系

Thu, 23 Apr 2026 19:39:08 +0800

Datawhale 大模型基础：从理论到实战的完整 LLM 知识体系

项目概览

Datawhale 出品的 so-large-lm（大模型基础）是一个开源、系统、深入的大规模预训练语言模型（LLM）教程项目。截至 2026 年 4 月，该项目已获得 7,167 Stars 和 593 Forks，成为中文社区最具影响力的 LLM 学习资源之一。

AutoResearchClaw：全自动23阶段研究论文生成管道，从想法到论文的完整实践

Tue, 21 Apr 2026 07:45:00 +0800

AutoResearchClaw：全自动23阶段研究论文生成管道，从想法到论文的完整实践

🎯 概述

AutoResearchClaw 是一个开源的全自动研究论文生成管道，能够将一个研究想法直接转化为会议级别的学术论文。项目在 GitHub 上获得了 11,433 Stars 和 1,320 Forks，已成为 AI 辅助学术研究领域的标杆项目。

DeepGEMM：深势科技6577 Stars的高性能FP8 GEMM内核库——从入门到精通

Sun, 19 Apr 2026 21:00:00 +0800

DeepGEMM：深势科技6577 Stars的高性能FP8 GEMM内核库——从入门到精通

目标读者：GPU内核工程师、深度学习框架开发者、高性能计算研究员、LLM推理优化工程师 预计阅读时间：60-80分钟 前置知识：CUDA编程基础、GEMM计算原理、深度学习训练/推理流程 难度定位：⭐⭐⭐⭐ 专家设计

CL4R1T4S：把 AI 系统提示词放到台前的开源档案库

Sun, 19 Apr 2026 20:58:00 +0800

目标读者：想研究 AI 系统行为、提示词工程、模型安全边界的开发者与研究者

阅读收益：看懂这个仓库的价值、知道怎么把它用于研究、也知道哪些结论不能轻易下

PrfaaS：跨数据中心LLM服务的革命性架构——KVCache新时代

Sat, 18 Apr 2026 20:55:00 +0800

PrfaaS：跨数据中心LLM服务的革命性架构——KVCache新时代

目标读者：AI Infra工程师、分布式系统研究员、对大模型服务化有兴趣的开发者 预计阅读时间：50-70分钟 前置知识：了解LLM基本原理、熟悉分布式系统概念、对模型服务化有基础认知 难度定位：⭐⭐⭐⭐ 专家设计

DFlash：块扩散模型加速LLM推理——让大模型推理速度提升2-3倍

Fri, 17 Apr 2026 16:35:00 +0800

DFlash：块扩散模型加速LLM推理

目标读者：LLM推理优化工程师、ML平台架构师、MLOps实践者 前置知识：深度学习基础、LLM原理、对投机解码有基本了解 技术栈：Python / PyTorch / vLLM / SGLang / Transformers / MLX 难度定位：⭐⭐⭐⭐ 专家设计

Cognee：16K Stars的AI Agent记忆引擎——让大模型拥有持续学习的知识图谱

Fri, 17 Apr 2026 16:32:00 +0800

Cognee：16K Stars的AI Agent记忆引擎

目标读者：LLM应用开发者、RAG系统工程师、AI Agent研究者、企业知识管理 前置知识：Python基础、LLM API使用经验、对RAG有基本了解 技术栈：Python 3.10-3.13 / 向量数据库 / 图数据库 / Pydantic 难度定位：⭐⭐⭐⭐ 专家设计

Agentic Video Editor：用多智能体架构重新定义视频剪辑——从创意简报到成品广告的自动化之旅

Fri, 17 Apr 2026 16:10:00 +0800

Agentic Video Editor：用多智能体架构重新定义视频剪辑

目标读者：AI应用开发者、视频内容创作者、对多智能体系统感兴趣的研究者 前置知识：Python基础、对LLM和AI Agent有基本了解 技术栈：Python 3.11+ / Google Gemini ADK / FFmpeg 难度定位：⭐⭐⭐⭐ 专家设计

GenericAgent：仅3K行代码的自我进化Agent框架——6倍Token节省、9个原子工具、Skill树自增长

Thu, 16 Apr 2026 01:50:00 +0800

GenericAgent：仅3K行代码的自我进化Agent框架——6倍Token节省、9个原子工具、Skill树自增长

目标读者：AI Agent 研究者、LLM 应用开发者、对 Agent 架构感兴趣的工程师 预计阅读时间：45-60分钟 前置知识：Python 基础、对 LLM 和 Agent 概念有了解 难度定位：⭐⭐⭐⭐ 专家设计

《动手学大模型》：上海交通大学31.5K Stars的LLM编程实践教程——微调/提示工程/知识编辑/RLHF全覆盖

Thu, 16 Apr 2026 01:30:00 +0800

《动手学大模型》：上海交通大学31.5K Stars的LLM编程实践教程——微调/提示工程/知识编辑/RLHF全覆盖

目标读者：大模型研究者、研究生、开发者、对 LLM 感兴趣的任何人 预计阅读时间：50-70分钟 前置知识：Python 基础、了解深度学习基本概念 难度定位：⭐⭐⭐⭐ 专家设计

AI 心理学：Anthropic 如何用 171 个情绪向量重新逼近模型内部世界

Wed, 15 Apr 2026 18:25:00 +0800

这不是一篇把模型简单拟人化的文章，而是一篇把 Anthropic 最新研究串成一条逻辑链的技术解读：角色空间、情绪向量、奖励黑客、对齐伪装与 CoT 不忠实，如何共同指向更深的模型内部状态问题。

LangGraph：构建有状态智能体的图形框架——29K Stars 的 AI Agent 编排框架从入门到精通

Wed, 15 Apr 2026 00:15:00 +0800

LangGraph：构建有状态智能体的图形框架——29K Stars 的 AI Agent 编排框架从入门到精通

目标读者：LLM 应用开发者、AI Agent 研究者、想要构建复杂多步骤 AI 系统的工程师 预计阅读时间：50-70 分钟 前置知识：Python 基础、LLM API 使用经验、对 Agent 概念有了解 难度定位：⭐⭐⭐⭐ 专家设计

new-api：26.7K Stars 的 LLM 网关——多模型聚合与支付计费的从入门到精通

Tue, 14 Apr 2026 20:30:00 +0800

new-api：26.7K Stars 的 LLM 网关——多模型聚合与支付计费的从入门到精通

目标读者：需要聚合多个 AI API 的开发者、企业技术负责人、Bug Bounty 开发者 预计阅读时间：45-60 分钟 前置知识：Python 基础、API 概念、Docker 基础 难度定位：⭐⭐⭐⭐ 专家设计

近年 AI 应用技术学习路线：从 LLM、RAG 到 Agent 工程

Tue, 14 Apr 2026 10:30:00 +0800

一篇面向工程师的 AI 应用技术路线图：先把 LLM、Prompt、RAG、Function Calling 与 MCP 打稳，再进入 Agent、Workflow、Context、Skill 与评估工程。

MiniMind：从零开始用3块钱训练64M参数的大语言模型

Sun, 12 Apr 2026 12:00:00 +0800

MiniMind：从零开始用3块钱训练64M参数的大语言模型

一、项目概览

MiniMind 是由 jingyaogong 开发的开源大语言模型训练项目，其核心理念是"大道至简"——让每个人都能从零开始，仅用约 3 元钱成本与 2 小时训练时间，即可训练出规模约为 64M 参数的超小型语言模型 MiniMind。

Awesome AI Apps：80+LLM应用实战项目合集

Sun, 12 Apr 2026 02:31:39 +0800

Awesome AI Apps：80+LLM应用实战项目合集

一、项目概述

1.1 Awesome AI Apps 是什么

Awesome AI Apps 是一个全面的 LLM应用实战项目集合，收录了 80+ 个实用的 AI 应用示例，涵盖文本 Agent、语音助手、RAG 应用、MCP 工具等。项目按难度分层，从入门级 Starter 到生产级 Advanced，助你从零掌握各种 AI 框架和技术栈。

Gemma：Google DeepMind开源LLM库完全指南

Sun, 12 Apr 2026 02:31:39 +0800

Gemma：Google DeepMind 开源 LLM 库完全指南

一、项目概述

1.1 Gemma 是什么

Gemma 是 Google DeepMind 开发的**开源权重大语言模型（LLM）**系列，基于 Gemini 研究和技术。这个仓库提供了 gemma PyPI 包——一个用于使用和微调 Gemma 模型的 JAX 库。

PraisonAI：AutoGen继任者·100+LLM支持·MCP原生

Sun, 12 Apr 2026 02:31:39 +0800

PraisonAI 🦞：AutoGen 继任者·100+ LLM 支持·MCP 原生·多智能体框架完全指南

一、项目概述

1.1 PraisonAI 是什么

PraisonAI 🦞 — Hire a 24/7 AI Workforce. 停止编写样板代码，开始构建能够研究、计划、执行任务的自主智能体。从单个 Agent 到整个组织，只需 5 行代码即可部署。

SkyPilot：9.8K Stars·任意云LLM服务框架·自动故障转移

Sun, 12 Apr 2026 02:31:39 +0800

SkyPilot：9.8K Stars·任意云LLM服务框架·自动故障转移·Spot实例节省70%·1000+任务/天·$10M+成本节省

一，项目概述

1.1 SkyPilot 是什么

SkyPilot 是一个任意云LLM和AI服务框架，可以在任何云（AWS、GCP、Azure、Lambda、Cloudflare等）上运行LLM、AI模型和批处理任务。

Repomix：11.4K Stars·代码库压缩成AI友好格式的利器

Sun, 12 Apr 2026 01:50:00 +0800

Repomix：11.4K Stars·代码库压缩成AI友好格式的利器

学习目标

理解 Repomix 的核心概念和使用场景
掌握 CLI、Web、Web Extension 三种使用方式
学会配置 repomix.config.json 实现定制化
了解安全检查和压缩原理
掌握在 GitHub Actions 中的集成方法
学会将 Repomix 作为 Library 集成到自己的应用中

项目概述

Repomix 是一款强大的代码库压缩工具，能够将整个 Git 仓库打包成对 AI 模型友好的单一文件格式。当需要向 ChatGPT、Claude、DeepSeek、Gemini 等大语言模型提供代码上下文时，Repomix 可以帮助用户快速整理和压缩代码库，避免手动复制粘贴的繁琐。

Rowboat完全指南：将工作转为知识图谱的AI同事

Sat, 11 Apr 2026 00:00:00 +0800

Rowboat完全指南：将工作转为知识图谱的AI同事

§1 学习目标

通过本文，您将掌握：

理解Rowboat的核心价值：为什么将工作转为知识图谱是AI办公的新范式
掌握全部集成能力：Gmail、Google Calendar、Fireflies等
熟练使用知识图谱：Obsidian兼容、本地存储、背链
理解架构设计：长期记忆、知识关联、本地优先
掌握进阶用法：私有化部署、自定义LLM、MCP集成

§2 项目概述

2.1 什么是Rowboat？

Rowboat是开源AI同事工具，将您的工作（邮件、会议、决策）转化为持久的知识图谱，然后Agent能够基于这些上下文采取行动。

MarkItDown完全指南：微软开源的文档转Markdown神器

Fri, 10 Apr 2026 23:50:00 +0800

MarkItDown完全指南：微软开源的文档转Markdown神器

§1 学习目标

通过本文，您将掌握：

理解MarkItDown的核心价值：为什么将文档转换为Markdown是LLM最优方案
掌握全部支持格式：PDF、Word、Excel、PowerPoint、图片OCR、音频转录等
熟练使用CLI和Python API：命令行和Python两种使用方式
理解插件生态：MCP服务器、OCR插件、Azure Document Intelligence
掌握进阶用法：流式转换、自定义LLM提示词、插件开发

§2 项目概述

2.1 什么是MarkItDown？

MarkItDown是微软AutoGen团队开源的轻量级Python工具，用于将各种格式的文档转换为Markdown，专为LLM及相关文本分析管道设计。

TradingAgents：多智能体 LLM 金融交易框架深度解析

Wed, 08 Apr 2026 12:30:00 +0800

TradingAgents 最值得看的地方，不是“让一个 LLM 直接给出买卖建议”，而是把投研团队里原本混在一起的四件事拆开了：信息采集、观点对抗、交易决策、组合审批。到 2026 年 5 月公开的 v0.2.5，这个项目已经不只是论文配套 Demo。它有 CLI、Python 包、多提供商模型、LangGraph checkpoint、跨运行决策日志和 Docker；但它首先仍是研究框架，不是可以直接接券商账户的实盘执行系统。

Karpathy LLM Wiki：让AI自动维护你的知识库

Wed, 08 Apr 2026 11:10:00 +0800

Karpathy LLM Wiki：让AI自动维护你的知识库

1. 学习目标

通过本文你将掌握：

理解 Karpathy LLM Wiki 的核心哲学
熟练使用 Ingest、Query、Lint 三大操作
在 Claude Code/Cursor/Codex 中安装和配置本技能
构建个人知识库并实现自动维护
解决实际使用中的常见问题

2. 背景与原理

2.1 Karpathy 的 LLM Wiki 理念

2026年4月，AI 大神 Andrej Karpathy 提出了一个简洁而强大的概念：

Goose 入门指南：超越代码建议的可扩展AI Agent

深入理解 Ollama 的项目定位、核心概念和设计理念
掌握 Ollama 的安装、配置和基本使用方法
学会运行和管理各种大模型（Llama、Gemma、Mistral 等）
理解 Modelfile 自定义模型配置
掌握 OpenAI 兼容 API 服务搭建
理解 Agent 和 ReAct 模式
学会 GPU 加速配置和多模态模型使用
掌握 Ollama 与 LangChain 的集成方法

1. 项目概述

1.1 是什么

Ollama 是一个让你在本地机器上运行开源大模型的平台。它提供了简单的命令来下载、运行和管理 AI 模型，无需云服务，完全离线可用。

Pi Mono：统一LLM API的AI Agent全栈工具箱

Mon, 06 Apr 2026 11:30:00 +0800

Pi Mono：统一LLM API的AI Agent全栈工具箱

§1 学习目标

通过本文，您将掌握：

Pi Mono的核心功能与架构设计
如何使用Pi Mono的编码Agent CLI
统一LLM API的配置与使用
TUI与Web UI的部署方法
Slack机器人与vLLM Pod的集成
最佳实践与开发扩展指南

§2 原理分析

2.1 什么是Pi Mono？

Pi Mono（GitHub: badlogic/pi-mono）是一款开源AI Agent工具箱，由知名开发者badlogic创建。该工具箱将多个AI开发组件整合到一个统一的框架中：

Nanobot：超轻量级个人 AI 助手专家级技术文档

Mon, 30 Mar 2026 14:26:00 +0800

Nanobot：超轻量级个人 AI 助手专家级技术文档

目标读者：想要掌握 Nanobot 的开发者、AI 爱好者和技术决策者 核心问题：Nanobot 是什么？如何设计架构？如何定制和扩展？

1. 学习目标

完成本文档后，你将掌握：

Pi Monorepo：开源 AI Agent 工具包专家级技术文档

Mon, 30 Mar 2026 13:03:00 +0800

Pi Monorepo：开源 AI Agent 工具包专家级技术文档

预计阅读时间：35分钟 | 难度：⭐⭐⭐⭐

目标读者：想要掌握 Pi Monorepo 的开发者、AI 应用工程师和技术决策者

Quantization 量化技术完全指南：从原理到 LLM 实战

Sun, 29 Mar 2026 23:28:00 +0800

一、先看一个惊人的事实

Qwen-3-Coder-Next 是一个 800 亿参数的模型：

体积：159.4GB
需要至少 159GB 内存才能运行
这还不算「大型」模型——据说前沿模型超过 1 万亿参数，需要 2TB+ 内存

但如果我告诉你：

AI 编程 Agent 的 Harness 设计：如何让大模型更稳定地产出高质量代码

Sun, 29 Mar 2026 23:07:00 +0800

AI 编程 Agent 的 Harness 设计：如何让大模型更稳定地产出高质量代码

预计阅读时间：40分钟 | 难度：⭐⭐⭐⭐

单靠把模型放进一个循环里，并不能稳定产出高质量应用。真正决定上限的，往往不是模型会不会写代码，而是系统能不能持续完成三件事：把任务拆对、把进度交清、把结果验真。

AI Scientist-v2：智能体树搜索驱动的自动化科研论文生成

Sun, 29 Mar 2026 15:47:00 +0800

AI Scientist-v2：智能体树搜索驱动的自动化科研论文生成

预计阅读时间：30分钟 | 难度：⭐⭐⭐

一、项目概览

AI Scientist-v2 是由 SakanaAI 开发的一个通用端到端智能体系统，能够自主完成科学研究流程：提出假设、设计实验、运行实验、分析数据，并撰写科学论文。该项目在 GitHub 上获得了 3.6k Stars 和 545 Forks，成为 AI 自动化科研领域的标杆项目。