Browserbase Skills：让 Claude Code 拥有浏览器自动化能力

2026-05-05 约 7059 字预计阅读 18 分钟

Browserbase Skills：让 Claude Code 拥有浏览器自动化能力

📋 学习目标

理解 Browserbase Skills 的核心定位——将浏览器自动化能力注入 Claude Code
掌握 10 个核心技能的用途与协作关系
学会在 Claude Code 中安装和配置 Browserbase Skills
理解本地模式与远程 Browserbase 云端模式的切换方式
掌握 site-debugger 和 browser-trace 的调试工作流
理解 cookie-sync 和 ui-test 在实际场景中的应用

📖 项目概述

什么是 Browserbase Skills

Browserbase Skills 是一个开源的 Claude Agent SDK，通过官方 bb CLI 和一组结构化技能，让 Claude Code 能够与浏览器进行深度交互。与传统的无头浏览器方案不同，Browserbase Skills 构建在 Browserbase 云服务之上，提供了反爬虫规避、CAPTCHA 自动解决、住宅代理轮换等开箱即用的能力。

官方描述：

“A set of skills for enabling Claude Code to work with Browserbase through browser automation and the official bb CLI.”

核心数据

指标	数值
GitHub Stars	2,131
Forks	134
主要语言	JavaScript
创建时间	2025-10-12
最新更新	2026-04-30
许可证	尚未声明（私有仓库 fork 来的公开项目）

解决的问题

大多数 AI Agent 在处理网页操作时只能完成简单的页面读取，无法应对：

反爬虫机制：Cloudflare、Distil Networks 等平台的 Bot 检测
需要登录态的操作：Cookie、Session 维护
复杂交互：CAPTCHA、多步表单、无头浏览器无法渲染的内容
性能与资源：本地浏览器占用大量内存，远程云端浏览器按需调用

Browserbase Skills 通过 Browserbase 云端浏览器基础设施解决了以上问题，同时保留了本地开发的便捷性。

🏗️ 技术架构

整体架构

Browserbase Skills 架构图

┌─────────────────────────────────────────────────────────┐
│                    Claude Code                          │
│              (通过自然语言操控浏览器)                     │
└─────────────────────┬───────────────────────────────────┘
                      │ Skill 调用
┌─────────────────────▼───────────────────────────────────┐
│              Browserbase Skills                          │
│  ┌─────────────────────────────────────────────────┐    │
│  │  skills/                                          │    │
│  │  ├── browser        核心浏览器自动化                │    │
│  │  ├── browserbase-cli  bb CLI 工具                │    │
│  │  ├── functions     云端无服务器自动化              │    │
│  │  ├── site-debugger 站点调试与 Bot 检测诊断        │    │
│  │  ├── browser-trace  CDP 协议全量追踪              │    │
│  │  ├── bb-usage      用量统计与成本预测             │    │
│  │  ├── cookie-sync   Cookie 同步                    │    │
│  │  ├── fetch         无浏览器静态抓取                │    │
│  │  ├── search        网页搜索                       │    │
│  │  └── ui-test       AI 对抗式 UI 测试             │    │
│  └─────────────────────────────────────────────────┘    │
└─────────────────────┬───────────────────────────────────┘
                      │ bb CLI / API
        ┌─────────────┴─────────────┐
        ▼                           ▼
┌───────────────┐         ┌──────────────────────┐
│  本地浏览器    │         │  Browserbase 云端     │
│  (Chrome)     │         │  (远程浏览器实例)       │
└───────────────┘         │  - Stealth 模式       │
                          │  - 住宅代理            │
                          │  - CAPTCHA 解决       │
                          │  - 无头/有头          │
                          └──────────────────────┘

两种运行环境

Browserbase Skills 支持两种运行模式，Claude 会根据指令自动选择：

模式	触发方式	适用场景
本地模式	`browse env local`	开发调试、轻量任务、已有 Chrome 环境
云端模式	默认/远程	反爬虫网站、需要代理、需要 Stealth 能力

本地模式现在默认启动干净的隔离浏览器，不会复用已有的 Chrome 状态。如果需要复用本地登录态，使用 browse env local --auto-connect。

🔧 安装与配置

前置条件

Node.js 18+
Chrome 浏览器（本地模式必需）
Browserbase 账户（云端模式必需，免费额度有限）

安装 Skills

通过 npm 安装到主流 Coding Agent：

npx skills add browserbase/skills

Claude Code 专用安装

# 添加 marketplace 源
/plugin marketplace add browserbase/skills

# 安装 browse 插件
/plugin install browse@browserbase

# 重启 Claude Code 使配置生效

手动安装

如果偏好手动配置：

在 Claude Code 中输入 /plugin
选择选项 3. Add marketplace
输入 marketplace source：browserbase/skills
选择 browse 插件，回车安装
重启 Claude Code

验证安装

安装完成后，Claude Code 会自动识别 browse 相关指令。可以直接用自然语言测试：

"Go to Hacker News, get the top post comments, and summarize them"
"QA test http://localhost:3000 and fix any bugs you encounter"
"Use bb to list my Browserbase projects"

📦 10 个核心技能详解

1. browser —— 核心浏览器自动化

这是最核心的技能，封装了与浏览器交互的主要能力。

能力清单：

远程 Browserbase 会话，支持反 Bot 检测
Stealth 模式：隐藏自动化特征，模拟真实用户
CAPTCHA 自动解决（Browserbase 内置）
住宅代理轮换（Residential Proxies）
完整 CDP（Chrome DevTools Protocol）访问

常用命令：

# 启动本地浏览器
browse env local

# 启动云端远程浏览器
browse env remote

# 打开指定 URL
browse goto https://example.com

# 截图
browse screenshot

# 点击元素
browse click "#submit-button"

# 填写表单
browse fill "#username" "myuser"
browse fill "#password" "mypass"

# 提取页面内容
browse extract "article h1"

Stealth 配置示例：

Browserbase 云端浏览器默认启用 Stealth，用户也可以在 Browserbase 平台配置具体参数（代理类型、地理位置、浏览器指纹等）。

2. browserbase-cli —— 官方 bb CLI

调用 Browserbase 平台的完整 CLI 工具，覆盖以下功能：

Sessions：管理浏览器会话（创建、销毁、状态查询）
Projects：项目 CRUD 操作
Contexts：持久化上下文管理
Extensions：浏览器扩展管理
Fetch：无浏览器模式的 HTTP 请求（支持调试）
Dashboard：直接打开 Browserbase 管理面板

常用命令：

# 查看当前使用情况
bb usage

# 列出项目
bb projects list

# 创建新会话
bb sessions create

# 查看会话详情
bb sessions list --project-id <id>

# 初始化 Browserbase Function
bb functions init

3. functions —— 无服务器浏览器自动化

将浏览器自动化函数部署到 Browserbase 云端，以无服务器方式运行。不需要维护长期运行的浏览器实例。

工作流程：

# 初始化一个新 Function
bb functions init

# 部署 Function
bb functions deploy

# 调用 Function
bb functions invoke <function-name>

适合将重复性的浏览器任务（如每日数据抓取、自动化测试）封装为 API 调用。

4. site-debugger —— Bot 检测诊断

这是 Browserbase Skills 中最有特色的技能之一。给定一个 URL，site-debugger 会自动：

访问目标站点，分析 Bot 检测机制
检查 selectors（选择器）稳定性
分析时序问题（页面渲染时机）
检查认证和 Session 状态
检测 CAPTCHA 触发条件
生成针对性的 Site Playbook

输出示例：

site-debugger 会生成一个经过测试的配置文件，记录该站点的最佳自动化策略。之后 Claude 可以根据这个 Playbook 稳定地操作目标站点。

5. browser-trace —— CDP 全量追踪

捕获完整的 Chrome DevTools Protocol 追踪数据：

CDP firehose（全量事件流）
每个页面的截图
DOM dump
将追踪数据分桶存储，支持事后分析

使用场景：

调试复杂的前端交互问题
分析网站的网络请求行为
排查浏览器自动化失败原因

# 启动追踪
browse trace start

# 执行操作
browse click ".load-more"
browse scroll

# 停止追踪并分析
browse trace stop

6. bb-usage —— 用量与成本统计

在终端中展示 Browserbase 使用情况：

当前项目的会话数
已用额度 vs. 套餐限制
成本预测（根据历史用量估算月度账单）

bb usage

适合在运行大量自动化任务前评估成本，避免意外超额度。

将本地 Chrome 的登录 Cookie 同步到 Browserbase 远程浏览器：

导出本地 Chrome 的 Cookie
注入到 Browserbase 持久化上下文
远程浏览器复用本地登录态

典型用途：

登录态复用：本地 Chrome 已经登录了某个网站，想在远程浏览器中复用
跨设备同步：不同 Browserbase 实例之间的 Session 共享

# 从本地 Chrome 导出 Cookie
browse cookie-export

# 同步到远程会话
browse cookie-sync --session-id <id>

8. fetch —— 无浏览器 HTTP 抓取

不需要启动浏览器，直接发送 HTTP 请求获取静态页面内容：

支持 HTML 和 JSON 响应
自动处理重定向
可查看状态码和响应头
适合快速检查页面可用性，不占用浏览器会话配额

# 抓取 HTML
browse fetch https://example.com

# 以 JSON 格式返回
browse fetch https://api.example.com/data --json

9. search —— 结构化网页搜索

无需启动浏览器，直接进行网络搜索并返回结构化结果：

返回标题、URL、元数据
不产生浏览器会话费用
适合信息搜集类任务

# 搜索关键词
browse search "Claude Code browser automation"

# 带结果数量限制
browse search "site:github.com browser automation" --limit 10

10. ui-test —— AI 对抗式 UI 测试

分析 Git diff 或探索性测试整个应用，发现 UI 变更引入的 Bug：

Diff 驱动：接收 Git diff，输入变更分析可能导致的问题
全站探索：AI 自主探索应用所有可交互元素，寻找异常

特点：

对抗式（Adversarial）：专门针对开发者可能忽略的边界情况
自动生成测试报告
可以与 CI/CD 集成

💡 实战示例

示例 1：抓取需要登录的页面

# 1. 先在本地 Chrome 登录目标网站
# 2. 同步 Cookie 到 Browserbase
browse cookie-sync --session-id <remote-session-id>

# 3. 在远程浏览器中访问已登录的页面
browse goto https://example.com/user/dashboard

# 4. 提取数据
browse extract ".dashboard-stat"

示例 2：调试被拦截的自动化脚本

# 使用 site-debugger 诊断目标站点
browse site-debugger https://example.com

# 查看诊断结果和建议
# 根据 site-debugger 生成的 Playbook 调整自动化策略

# 使用生成的配置重新访问
browse goto https://example.com --stealth --proxy residential

示例 3：创建无服务器自动化任务

# 初始化 Function
bb functions init

# 编写自动化逻辑（保存为 function.js）
# ...

# 部署到 Browserbase 云端
bb functions deploy

# 定时触发（通过 Cron 或外部 API）
bb functions invoke my-scheduled-task

🔍 适用场景与边界

适合的场景

数据采集：需要从电商、社交媒体抓取数据，且目标站点有反爬虫机制
自动化测试：端到端 UI 测试，特别是跨浏览器/跨环境的一致性测试
内容监控：定期检查某网页内容变化并触发通知
Agent 增强：为 AI Agent 添加真实的浏览器操作能力，突破纯 API 调用的限制
登录态管理：跨会话复用复杂的多因素认证后状态

不适合的场景

纯 API 即可完成的数据获取（用 fetch 技能更省成本）
需要极致抓取速度的实时流处理（云端浏览器的网络延迟是瓶颈）
无需浏览器渲染的静态页面（直接 HTTP 请求更高效）
高度定制化的指纹需求（需要 Browserbase Enterprise 套餐）

⚙️ 环境变量与高级配置

Browserbase CLI 支持通过环境变量配置默认行为：

# 设置默认项目
export BROWSERBASE_PROJECT_ID=<project-id>

# 设置 API Key
export BROWSERBASE_API_KEY=<api-key>

# 配置代理
export BROWSERBASE_PROXY=<proxy-url>

在 Claude Code 中，这些环境变量可以通过 .env 文件或 Claude Code 的环境配置注入。

❓ 常见问题

Q: 提示 “Chrome not found”

本地模式需要安装 Chrome：

macOS / Windows：https://www.google.com/chrome/
Linux：sudo apt install google-chrome-stable

Q: 远程浏览器会话费用如何计算？

Browserbase 按会话时长和浏览器类型计费。具体价格见 Browserbase 官网定价页。bb-usage 技能可以实时查看当前用量和成本预测。

rm -rf .chrome-profile
# 重新在本地 Chrome 登录目标网站
browse cookie-sync --session-id <id>

Q: site-debugger 生成的 Playbook 可以自定义吗？

可以。Playbook 本质上是 JSON/YAML 格式的配置文件，site-debugger 给出建议后，用户可以手动调整其中的参数（如 selectors、stealth 级别、代理设置）。

Q: ui-test 和普通单元测试的区别是什么？

ui-test 是对抗式的、AI 驱动的端到端测试，不需要预先编写测试用例。普通单元测试需要开发者定义断言，ui-test 则由 AI 自主发现潜在问题，更适合探索性测试阶段。

📚 总结与延伸阅读

Browserbase Skills 为 Claude Code 提供了一套完整的浏览器自动化工具链，从基础的页面交互到高级的反爬虫对抗、云端无服务器函数部署，形成了完整的开发生态。其模块化设计使得各个技能可以独立使用，也可以组合成复杂的工作流。

核心优势：

将 Browserbase 云端的基础设施能力无缝注入 Claude Code
10 个技能覆盖了从简单抓取到复杂调试的完整场景
site-debugger 和 ui-test 体现了 AI 原生调试的思路
本地/云端模式自由切换，兼顾开发效率和生产稳定性

延伸阅读：

更新于 2026-05-23

AI Agent, Claude Code, 浏览器自动化, Browserbase, 开源

返回 | 主页

下一步

如果这篇内容对你有帮助，继续往更完整的路径里走。

你可以从专题页继续系统阅读，也可以通过联系页反馈想跟进的主题、工具和合作方向。

AI Agent 专题 Coding Agent 专题开源 AI 工具联系

目录

Browserbase Skills：让 Claude Code 拥有浏览器自动化能力

Browserbase Skills：让 Claude Code 拥有浏览器自动化能力

📋 学习目标

📖 项目概述

什么是 Browserbase Skills

核心数据

解决的问题

🏗️ 技术架构

整体架构

两种运行环境

🔧 安装与配置

前置条件

安装 Skills

Claude Code 专用安装

手动安装

验证安装

📦 10 个核心技能详解

1. browser —— 核心浏览器自动化

2. browserbase-cli —— 官方 bb CLI

3. functions —— 无服务器浏览器自动化

4. site-debugger —— Bot 检测诊断

5. browser-trace —— CDP 全量追踪

6. bb-usage —— 用量与成本统计

7. cookie-sync —— Cookie 同步

8. fetch —— 无浏览器 HTTP 抓取

9. search —— 结构化网页搜索

10. ui-test —— AI 对抗式 UI 测试

💡 实战示例

示例 1：抓取需要登录的页面

示例 2：调试被拦截的自动化脚本

示例 3：创建无服务器自动化任务

🔍 适用场景与边界

适合的场景

不适合的场景

⚙️ 环境变量与高级配置

❓ 常见问题

Q: 提示 “Chrome not found”

Q: 远程浏览器会话费用如何计算？

Q: 如何刷新已过期的 Cookie？

Q: site-debugger 生成的 Playbook 可以自定义吗？

Q: ui-test 和普通单元测试的区别是什么？

📚 总结与延伸阅读

如果这篇内容对你有帮助，继续往更完整的路径里走。

与这篇内容相关的文章

Multica：用「时间共享」把 AI coding agent 从工具变成队友

Chrome DevTools MCP：让 AI 编程代理操控 Chrome 的官方方案

Multica：把 AI 代码代理变成真正的队友

S-UI：SagerNet/Sing-Box 多协议 Web 管理面板快速上手