浏览器自动化
🌐 什么是浏览器自动化?
让 AI 控制浏览器,就像有一个隐形助手在帮你操作网页:
- 打开网页
- 点击按钮
- 填写表单
- 截图保存
- 提取数据
🚀 基本操作
打开网页
你: 打开 https://github.com
OpenClaw: [启动浏览器]
已打开 GitHub 首页,页面标题是 "GitHub: Let's build from here"截图
你: 截个图看看
OpenClaw: [截图]
已截图并保存到 workspace/screenshots/github.png点击元素
你: 点击右上角的 "Sign in" 按钮
OpenClaw: [点击操作]
已点击,现在显示登录页面。填写表单
你: 在用户名输入框填入 "myusername"
OpenClaw: [填写输入框]
已填写用户名。需要我也填写密码吗?🔍 查找元素
OpenClaw 会智能识别页面元素:
你: 这个页面有哪些可以点击的按钮?
OpenClaw: [分析页面]
找到以下可点击元素:
1. "Sign up" 按钮(右上角)
2. "Start a free trial" 按钮(中间)
3. "Subscribe" 链接(底部)
...📸 页面快照
获取页面的结构化视图:
你: 给我看一下当前页面的结构
OpenClaw: [生成快照]
页面结构:
- 导航栏
- Logo
- Products ▼
- Solutions ▼
- Resources ▼
- Pricing
- 主内容
- Hero 区域(大标题 + CTA)
- 特性介绍
- 客户案例
- 页脚
- 链接列表
- 社交媒体图标🎯 实际应用场景
1. 自动登录
你: 帮我登录到某个网站,用户名是 xxx,密码在 .secrets 里
OpenClaw: [读取密码,打开网站,填写表单,点击登录]
登录成功!已进入仪表盘页面。2. 表单填写
你: 帮我填写这个注册表单,信息在 profile.json 里
OpenClaw: [读取信息,逐一填写]
已完成注册表单填写:
- 姓名:已填
- 邮箱:已填
- 电话:已填
需要我点击提交吗?3. 页面监控
你: 每 10 分钟检查一下这个页面,价格变化了告诉我
OpenClaw: [设置监控任务]
已开始监控。当前价格是 $99,有变化会通知你。⚙️ 配置选项
选择浏览器
你: 用 Chrome 打开这个页面
OpenClaw: [使用 Chrome]
已用 Chrome 打开页面。无头模式
你: 无头模式运行,不需要显示窗口
OpenClaw: [无头模式]
已在后台运行,截图保存到 screenshots/🛡️ 注意事项
- 网站限制:某些网站禁止自动化访问
- 验证码:遇到验证码需要人工介入
- 登录状态:可能需要手动处理某些登录流程
- 速率限制:不要请求太快,避免被封 IP
📝 小练习
动手试试
- 让 OpenClaw 打开一个新闻网站
- 截图保存首页
- 找到并点击某篇新闻
- 提取新闻标题和内容
➡️ 下一步
学会了浏览器操作,接下来 实战:网页数据抓取!