Skip to content

浏览器自动化

🌐 什么是浏览器自动化?

让 AI 控制浏览器,就像有一个隐形助手在帮你操作网页:

  • 打开网页
  • 点击按钮
  • 填写表单
  • 截图保存
  • 提取数据

🚀 基本操作

打开网页

你: 打开 https://github.com

OpenClaw: [启动浏览器]
已打开 GitHub 首页,页面标题是 "GitHub: Let's build from here"

截图

你: 截个图看看

OpenClaw: [截图]
已截图并保存到 workspace/screenshots/github.png

点击元素

你: 点击右上角的 "Sign in" 按钮

OpenClaw: [点击操作]
已点击,现在显示登录页面。

填写表单

你: 在用户名输入框填入 "myusername"

OpenClaw: [填写输入框]
已填写用户名。需要我也填写密码吗?

🔍 查找元素

OpenClaw 会智能识别页面元素:

你: 这个页面有哪些可以点击的按钮?

OpenClaw: [分析页面]
找到以下可点击元素:
1. "Sign up" 按钮(右上角)
2. "Start a free trial" 按钮(中间)
3. "Subscribe" 链接(底部)
...

📸 页面快照

获取页面的结构化视图:

你: 给我看一下当前页面的结构

OpenClaw: [生成快照]
页面结构:
- 导航栏
  - Logo
  - Products ▼
  - Solutions ▼
  - Resources ▼
  - Pricing
- 主内容
  - Hero 区域(大标题 + CTA)
  - 特性介绍
  - 客户案例
- 页脚
  - 链接列表
  - 社交媒体图标

🎯 实际应用场景

1. 自动登录

你: 帮我登录到某个网站,用户名是 xxx,密码在 .secrets 里

OpenClaw: [读取密码,打开网站,填写表单,点击登录]
登录成功!已进入仪表盘页面。

2. 表单填写

你: 帮我填写这个注册表单,信息在 profile.json 里

OpenClaw: [读取信息,逐一填写]
已完成注册表单填写:
- 姓名:已填
- 邮箱:已填
- 电话:已填
需要我点击提交吗?

3. 页面监控

你: 每 10 分钟检查一下这个页面,价格变化了告诉我

OpenClaw: [设置监控任务]
已开始监控。当前价格是 $99,有变化会通知你。

⚙️ 配置选项

选择浏览器

你: 用 Chrome 打开这个页面

OpenClaw: [使用 Chrome]
已用 Chrome 打开页面。

无头模式

你: 无头模式运行,不需要显示窗口

OpenClaw: [无头模式]
已在后台运行,截图保存到 screenshots/

🛡️ 注意事项

  1. 网站限制:某些网站禁止自动化访问
  2. 验证码:遇到验证码需要人工介入
  3. 登录状态:可能需要手动处理某些登录流程
  4. 速率限制:不要请求太快,避免被封 IP

📝 小练习

动手试试

  1. 让 OpenClaw 打开一个新闻网站
  2. 截图保存首页
  3. 找到并点击某篇新闻
  4. 提取新闻标题和内容

➡️ 下一步

学会了浏览器操作,接下来 实战:网页数据抓取

基于 MIT 许可发布