自从 Claude 在去年提出 Computer use 这个产品后,自动操作电脑,操作浏览器的各种项目和玩法冒出来很多
毕竟 AI 只能思考和分析,不能采集数据。最早的是采用 RPA,后来出了 playwright, 再后来又有了基于 playwright 的 MCP
但 playwright 的缺点也很多,安装不方便,而且需重新登录。对于很多需要登录才能采集的平台来说,playwright 都需要重新登录一次,然后输入用户名密码。
现在,有人不但做了个 Chrome 自动化 MCP,而且这个 MCP 是用插件的方式运行在 Chrome 中,这样完全不需要安装 playwright
结合 AI 平台,Claude,Cursor 等可以实现复杂的浏览器自动化、内容分析和语义搜索
01.超全的网页操作工具
网页自动化操作中,涉及到各种操作,登录,获取,截图等等。 Chrome MCP 基本上把这些操作方法都给提供到了
浏览器管理:6 个工具
截图和视觉:
网络监控:
内容分析:
交互操作:
数据管理:
总共 21 个工具,从网页数据获取,点击到网页的管理全包含了。现在无需设计 RPA,只需要在 Chrome 浏览器中配置好并运行。就可以在大模型中输入需求,调用 MCP 来控制浏览器。
02.安装方法
第一步:
安装 nodejs :https://nodejs.org/en
第二步:下载最新的 Chrome 扩展
https://github.com/hangwin/mcp-chrome/releases
第三步:安装 mcp-chrome-bridge
npm install -g mcp-chrome-bridge
第四步:加载 Chrome 扩展
打开 Chrome 并访问 chrome://extensions/,打开开发者模式。
在第二步下载的 Chrome 扩展中,将 chrome-mcp-server-lastest.zip 解压到本地
在扩展程序中点击加载未打包的扩展程序,将解压后的文件导入进来,就可以看到添加的扩展程序
点击插件,需要开启 MCP server
Server 用的 HTTP 的方式,端口默认采用 12306
复制上图的配置,在 Cursor 或者 Cherry studio 中添加 MCP 的配置,就可以愉快的使用了。
最后,这是 github 的地址: