<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>浏览器自动化 on Text Matrix</title><link>https://txtmix.com/tags/%E6%B5%8F%E8%A7%88%E5%99%A8%E8%87%AA%E5%8A%A8%E5%8C%96/</link><description>Recent content in 浏览器自动化 on Text Matrix</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Sat, 23 May 2026 00:15:12 +0800</lastBuildDate><atom:link href="https://txtmix.com/tags/%E6%B5%8F%E8%A7%88%E5%99%A8%E8%87%AA%E5%8A%A8%E5%8C%96/index.xml" rel="self" type="application/rss+xml"/><item><title>Chrome DevTools MCP：让 AI 编程代理操控 Chrome 的官方方案</title><link>https://txtmix.com/posts/tech/chrome-devtools-mcp-ai-coding-agent-chrome/</link><pubDate>Thu, 21 May 2026 20:16:13 +0800</pubDate><guid>https://txtmix.com/posts/tech/chrome-devtools-mcp-ai-coding-agent-chrome/</guid><description>&lt;h1 id="chrome-devtools-mcp让-ai-编程代理操控-chrome-的官方方案">Chrome DevTools MCP：让 AI 编程代理操控 Chrome 的官方方案&lt;/h1>
&lt;!-- raw HTML omitted -->
&lt;p>&lt;a href="https://github.com/ChromeDevTools/chrome-devtools-mcp/stargazers" target="_blank" rel="noopener noreffer ">&lt;img
 class="lazyload"
 src="https://txtmix.com/svg/loading.min.svg"
 data-src="https://img.shields.io/github/stars/ChromeDevTools/chrome-devtools-mcp?style=flat"
 data-srcset="https://img.shields.io/github/stars/ChromeDevTools/chrome-devtools-mcp?style=flat, https://img.shields.io/github/stars/ChromeDevTools/chrome-devtools-mcp?style=flat 1.5x, https://img.shields.io/github/stars/ChromeDevTools/chrome-devtools-mcp?style=flat 2x"
 data-sizes="auto"
 alt="https://img.shields.io/github/stars/ChromeDevTools/chrome-devtools-mcp?style=flat"
 title="GitHub stars" />&lt;/a>
&lt;a href="https://opensource.org/licenses/Apache-2.0" target="_blank" rel="noopener noreffer ">&lt;img
 class="lazyload"
 src="https://txtmix.com/svg/loading.min.svg"
 data-src="https://img.shields.io/badge/License-Apache%202.0-blue.svg"
 data-srcset="https://img.shields.io/badge/License-Apache%202.0-blue.svg, https://img.shields.io/badge/License-Apache%202.0-blue.svg 1.5x, https://img.shields.io/badge/License-Apache%202.0-blue.svg 2x"
 data-sizes="auto"
 alt="https://img.shields.io/badge/License-Apache%202.0-blue.svg"
 title="License: Apache 2.0" />&lt;/a>
&lt;a href="https://www.typescriptlang.org/" target="_blank" rel="noopener noreffer ">&lt;img
 class="lazyload"
 src="https://txtmix.com/svg/loading.min.svg"
 data-src="https://img.shields.io/badge/TypeScript-007ACC?logo=typescript&amp;amp;logoColor=white"
 data-srcset="https://img.shields.io/badge/TypeScript-007ACC?logo=typescript&amp;amp;logoColor=white, https://img.shields.io/badge/TypeScript-007ACC?logo=typescript&amp;amp;logoColor=white 1.5x, https://img.shields.io/badge/TypeScript-007ACC?logo=typescript&amp;amp;logoColor=white 2x"
 data-sizes="auto"
 alt="https://img.shields.io/badge/TypeScript-007ACC?logo=typescript&amp;amp;logoColor=white"
 title="TypeScript" />&lt;/a>&lt;/p>
&lt;p>&lt;strong>让 AI 编程代理（Claude Code、Codex 等）通过 Chrome DevTools 协议直接操控 Chrome 浏览器。&lt;/strong>&lt;/p></description></item><item><title>OpenCLI：把 Agent 的工具入口收成一棵命令树</title><link>https://txtmix.com/posts/tech/opencli-ai-agent-browser-cli-framework/</link><pubDate>Sun, 17 May 2026 09:10:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/opencli-ai-agent-browser-cli-framework/</guid><description>OpenCLI 不只是 browser 子命令。更顺的用法是先查适配器命令，缺口再退到 browser 原语；用 profile、browser session、siteSession 分别处理身份、流程和站点页生命周期；重复出现的流程，再沉淀成 adapter、plugin 或 external CLI。</description></item><item><title>字节跳动UI-TARS：32k星的多模态AI Agent全栈，支持MCP和浏览器自动化</title><link>https://txtmix.com/posts/tech/bytedance-ui-tars-desktop-multimodal-agent/</link><pubDate>Mon, 11 May 2026 13:05:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/bytedance-ui-tars-desktop-multimodal-agent/</guid><description>&lt;blockquote>
&lt;p>如果你在找一个能在真实浏览器和桌面上执行任务的 AI Agent 框架，字节跳动的 UI-TARS 值得关注。&lt;/p>&lt;/blockquote>
&lt;hr>
&lt;h2 id="一句话定位">一句话定位&lt;/h2>
&lt;p>&lt;a href="https://github.com/bytedance/UI-TARS-desktop" target="_blank" rel="noopener noreffer ">UI-TARS-desktop&lt;/a>（简称 TARS）是字节跳动开源的多模态 AI Agent 技术栈，包含两个核心产品：&lt;/p></description></item><item><title>Browserbase Skills：让 Claude Code 拥有浏览器自动化能力</title><link>https://txtmix.com/posts/tech/browserbase-skills-claude-code-browser-automation-guide/</link><pubDate>Tue, 05 May 2026 10:03:56 +0800</pubDate><guid>https://txtmix.com/posts/tech/browserbase-skills-claude-code-browser-automation-guide/</guid><description>&lt;h1 id="browserbase-skills让-claude-code-拥有浏览器自动化能力">Browserbase Skills：让 Claude Code 拥有浏览器自动化能力&lt;/h1>
&lt;h2 id="-学习目标">📋 学习目标&lt;/h2>
&lt;ul>
&lt;li>理解 Browserbase Skills 的核心定位——将浏览器自动化能力注入 Claude Code&lt;/li>
&lt;li>掌握 10 个核心技能的用途与协作关系&lt;/li>
&lt;li>学会在 Claude Code 中安装和配置 Browserbase Skills&lt;/li>
&lt;li>理解本地模式与远程 Browserbase 云端模式的切换方式&lt;/li>
&lt;li>掌握 site-debugger 和 browser-trace 的调试工作流&lt;/li>
&lt;li>理解 cookie-sync 和 ui-test 在实际场景中的应用&lt;/li>
&lt;/ul>
&lt;hr>
&lt;h2 id="-项目概述">📖 项目概述&lt;/h2>
&lt;h3 id="什么是-browserbase-skills">什么是 Browserbase Skills&lt;/h3>
&lt;p>&lt;strong>Browserbase Skills&lt;/strong> 是一个开源的 &lt;strong>Claude Agent SDK&lt;/strong>，通过官方 &lt;code>bb&lt;/code> CLI 和一组结构化技能，让 Claude Code 能够与浏览器进行深度交互。与传统的无头浏览器方案不同，Browserbase Skills 构建在 Browserbase 云服务之上，提供了反爬虫规避、CAPTCHA 自动解决、住宅代理轮换等开箱即用的能力。&lt;/p></description></item><item><title>AutoCLI Skill：让AI Agent掌控55+平台的终极浏览器自动化利器</title><link>https://txtmix.com/posts/tech/autocli-skill-55-platforms-cli/</link><pubDate>Wed, 22 Apr 2026 00:50:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/autocli-skill-55-platforms-cli/</guid><description>&lt;h1 id="autocli-skill让ai-agent掌控55平台的终极浏览器自动化利器">AutoCLI Skill：让AI Agent掌控55+平台的终极浏览器自动化利器&lt;/h1>
&lt;h2 id="-概述">🎯 概述&lt;/h2>
&lt;p>&lt;strong>AutoCLI Skill&lt;/strong> 是一个为 Claude Code/OpenClaw/AI Agent 打造的终极平台集成工具，让 AI 能够像人一样操控 55+ 个主流平台——无需 API Key、无需复杂配置、直接复用你 Chrome 浏览器里已有的登录态。&lt;/p></description></item><item><title>Chrome DevTools MCP：让AI编程助手操控Chrome浏览器的官方利器——35K Stars从入门到精通</title><link>https://txtmix.com/posts/tech/chrome-devtools-mcp/</link><pubDate>Sat, 18 Apr 2026 15:20:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/chrome-devtools-mcp/</guid><description>&lt;h1 id="chrome-devtools-mcp让ai编程助手操控chrome浏览器的官方利器35k-stars从入门到精通">Chrome DevTools MCP：让AI编程助手操控Chrome浏览器的官方利器——35K Stars从入门到精通&lt;/h1>
&lt;blockquote>
&lt;p>&lt;strong>目标读者&lt;/strong>：AI编程助手用户、想要让AI控制浏览器的开发者、Cursor/Copilot/Claude Code使用者
&lt;strong>预计阅读时间&lt;/strong>：40-50分钟
&lt;strong>前置知识&lt;/strong>：了解MCP（Model Context Protocol）基本概念，有浏览器自动化基础更佳
&lt;strong>难度定位&lt;/strong>：⭐⭐⭐⭐ 专家设计&lt;/p></description></item><item><title>chrome-devtools-mcp 完全指南：让 AI 编程助手掌控 Chrome DevTools</title><link>https://txtmix.com/posts/tech/chrome-devtools-mcp-ai-coding-agents-guide/</link><pubDate>Sat, 18 Apr 2026 11:35:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/chrome-devtools-mcp-ai-coding-agents-guide/</guid><description>&lt;blockquote>
&lt;p>&lt;strong>目标读者&lt;/strong>：希望将 AI 编码助手（Claude、Cursor、Copilot、Copilot）深度接入浏览器能力的前端工程师、全栈工程师与 AI Agent 开发者。
&lt;strong>核心问题&lt;/strong>：&lt;code>chrome-devtools-mcp&lt;/code> 通过 MCP 协议赋予 AI Agent 操作 Chrome DevTools 的能力——具体是怎么做到的？底层依赖是什么？有哪些能力边界？又该如何扩展？
&lt;strong>事实边界&lt;/strong>：本文基于 &lt;code>ChromeDevTools/chrome-devtools-mcp&lt;/code> 公开仓库信息整理，涵盖 README 功能列表、工具函数签名及 npm 包元数据。&lt;/p></description></item><item><title>Playwright CLI：Microsoft出品的Token高效浏览器自动化利器——8.3K Stars的AI Coding Agent首选</title><link>https://txtmix.com/posts/tech/playwright-cli-token-efficient-browser-automation/</link><pubDate>Wed, 15 Apr 2026 19:00:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/playwright-cli-token-efficient-browser-automation/</guid><description>&lt;h1 id="playwright-climicrosoft出品的token高效浏览器自动化利器83k-stars的ai-coding-agent首选">Playwright CLI：Microsoft出品的Token高效浏览器自动化利器——8.3K Stars的AI Coding Agent首选&lt;/h1>
&lt;blockquote>
&lt;p>&lt;strong>目标读者&lt;/strong>：AI Coding Agent 开发者、浏览器自动化工程师、需要在 AI 助手中集成浏览器操作的开发者
&lt;strong>预计阅读时间&lt;/strong>：45-60分钟
&lt;strong>前置知识&lt;/strong>：Node.js 基础、命令行工具使用经验、对 AI Agent 有基本了解
&lt;strong>难度定位&lt;/strong>：⭐⭐⭐⭐ 专家设计&lt;/p></description></item><item><title>Agent Browser：面向 AI Agent 的原生浏览器自动化 CLI 指南</title><link>https://txtmix.com/posts/tech/agent-browser-vercel-ai-browser-automation-guide/</link><pubDate>Sun, 12 Apr 2026 11:40:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/agent-browser-vercel-ai-browser-automation-guide/</guid><description>本文基于官方 README 与 CLI 帮助信息，系统讲清 Agent Browser 的安装方法、snapshot + ref 工作流、会话与认证管理、安全控制、调试观测与 Agent 集成边界。</description></item><item><title>xiaohongshu-skills：958 Stars的浏览器自动化方案，用真实账号做小红书运营</title><link>https://txtmix.com/posts/tech/xiaohongshu-skills-browser-automation-guide/</link><pubDate>Tue, 07 Apr 2026 18:10:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/xiaohongshu-skills-browser-automation-guide/</guid><description>&lt;h1 id="xiaohongshu-skills958-stars的浏览器自动化方案">xiaohongshu-skills：958 Stars的浏览器自动化方案&lt;/h1>
&lt;h2 id="项目概述">项目概述&lt;/h2>
&lt;p>&lt;strong>xiaohongshu-skills&lt;/strong>是由autoclaw-cc团队开发的开源项目，核心特点是「直接使用你已登录的浏览器和真实账号，以普通用户的方式操作小红书」。与xiaohongshu-mcp-skills不同，本项目采用&lt;strong>Chrome扩展+浏览器自动化&lt;/strong>的技术路线，而非MCP服务接口。&lt;/p></description></item><item><title>Page Agent：阿里巴巴开源的网页内置 GUI Agent</title><link>https://txtmix.com/posts/tech/page-agent-alibaba-gui-agent-guide/</link><pubDate>Mon, 06 Apr 2026 21:20:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/page-agent-alibaba-gui-agent-guide/</guid><description>&lt;h2 id="学习目标">学习目标&lt;/h2>
&lt;p>通过本文，你将全面掌握以下核心能力：&lt;/p>
&lt;ul>
&lt;li>深入理解 Page Agent 的项目定位、技术架构和设计理念&lt;/li>
&lt;li>掌握在网页中集成 Page Agent 的两种方式（CDN 一行代码 + NPM）&lt;/li>
&lt;li>学会使用文本化 DOM 操作进行自然语言浏览器控制&lt;/li>
&lt;li>理解 MCP Server 的架构和外部控制能力&lt;/li>
&lt;li>掌握 Chrome 扩展实现多页面 Agent 的方法&lt;/li>
&lt;li>理解与 browser-use 的差异化定位&lt;/li>
&lt;/ul>
&lt;hr>
&lt;h2 id="1-项目概述">1. 项目概述&lt;/h2>
&lt;h3 id="11-是什么">1.1 是什么&lt;/h3>
&lt;p>Page Agent 是阿里巴巴开源的&lt;strong>网页内置 GUI Agent&lt;/strong>，核心理念是：&lt;strong>The GUI Agent Living in Your Webpage&lt;/strong>——让网页拥有自己的 AI Agent，通过自然语言控制网页界面。&lt;/p></description></item><item><title>Browser-Use：让 AI Agent 控制浏览器完成任何任务</title><link>https://txtmix.com/posts/tech/browser-use-ai-browser-automation-guide/</link><pubDate>Mon, 06 Apr 2026 20:12:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/browser-use-ai-browser-automation-guide/</guid><description>&lt;h2 id="学习目标">学习目标&lt;/h2>
&lt;p>通过本文，你将全面掌握以下核心能力：&lt;/p>
&lt;ul>
&lt;li>深入理解 Browser-Use 的项目定位、技术架构和工作原理&lt;/li>
&lt;li>掌握在 Python 项目中安装、配置和使用 Browser-Use&lt;/li>
&lt;li>学会使用 CLI 工具进行快速浏览器自动化&lt;/li>
&lt;li>掌握为 Claude Code 安装 Browser-Use Skill 的方法&lt;/li>
&lt;li>理解自定义工具（Tools）的扩展方法&lt;/li>
&lt;li>学会处理认证、CAPTCHA 和生产环境部署&lt;/li>
&lt;li>理解 Open Source 与 Cloud 的权衡选择&lt;/li>
&lt;/ul>
&lt;hr>
&lt;h2 id="1-项目概述">1. 项目概述&lt;/h2>
&lt;h3 id="11-是什么">1.1 是什么&lt;/h3>
&lt;p>Browser-Use 是一个&lt;strong>开源的 AI 浏览器自动化库&lt;/strong>，它的核心理念是：&lt;strong>Tell your computer what to do, and it gets it done&lt;/strong>——告诉计算机要做什么，它就能完成。&lt;/p></description></item></channel></rss>