网络爬虫的终结:面向智能体的 WebMCP 与 Chrome 开发者工具

发布日期:2026-05-25 10:01:00   浏览量 :0
发布日期:2026-05-25 10:01:00  
0

2026西湖龙井茶官网DTC发售:茶农直供,政府溯源防伪到农户家 

对谷歌提出的 WebMCP 开放标准及面向智能体的 Chrome 开发者工具进行原始、以开发者为先的审视——涵盖真实世界的失败场景、一个仅需十行的浏览器控制台填充脚本,以及被谷歌掩盖的安全噩梦。

主题演讲的炒作与开发者的现实

每个人在听完 2026 年谷歌 I/O 大会的主题演讲后,谈论的都是同样的内容。Gemini 3.5 Flash 的基准测试成绩。Gemini Omni 实时处理多模态物理信息。Docs Live 将语音口述转化为格式化的模板。这些都是主题演讲中常见的令人兴奋的内容。固然不错,但也在意料之中。

但是,如果你想理解为什么这次 I/O 大会真正改变了我们构建软件的方式——不是在五年后,而是就在本周——你需要关注在开发者主题演讲中可能只用了四句话提及的内容:

一项名为 WebMCP(面向网络的模型上下文协议) 的拟议开放网络标准,及其姊妹产品 面向智能体的 Chrome 开发者工具

我并非通过综述文章了解到这一点。我在现有的 React/Next.js 结账流程上运行了一个模拟的 WebMCP 设置,以观察当浏览器智能体访问它时究竟会发生什么。

以下是实际发生的情况、为何 WebMCP 代表了脆弱的文档对象模型(DOM)抓取时代的终结、如何在今日的控制台中对其进行测试,以及谷歌在舞台上忽视的巨大安全噩梦。

CSS 选择器的噩梦(或为何视觉智能体陷入停滞)

如果你曾尝试构建或运行浏览器智能体,你就会知道其中的挫败感。你提示它购买火车票或更新客户记录,然后坐在那里看着它艰难挣扎。在底层,多模态视觉智能体会经历一个极其缓慢、昂贵且脆弱的循环:

[智能体截图] → [处理 5MB 图像] → [解析 12,000 行 DOM] → [猜测 CSS 选择器] → [点击坐标] → [用户界面动态状态更新] → [Tailwind 类哈希值变更] → [智能体点击空白区域] → [无限重试循环] → [失控的 API 账单]

DOM 抓取始终是一种临时性的黑客手段。它速度慢、成本高,并且在现代单页应用(SPA)中至少有 30% 的时间会失败。网络是为人类眼球和点击坐标而建的,而非为大语言模型(LLM)的上下文窗口而建。

WebMCP 彻底改变了这种关系。

智能体不再需要猜测 button_btn__XyZ12 这样的 CSS 类的作用,你的网络应用程序会直接在全局浏览器范围内注册一份结构化工具清单。智能体查询该清单,使用干净的 JSON 负载调用工具,然后你的网站执行其原生 JavaScript。完成。

暴露网络:WebMCP 实战

根据拟议的 WebMCP 标准,基于浏览器的

免责声明:本文内容来自互联网,该文观点不代表本站观点。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请到页面底部单击反馈,一经查实,本站将立刻删除。

关于我们
热门推荐
合作伙伴
免责声明:本站部分资讯来源于网络,如有侵权请及时联系客服,我们将尽快处理
支持 反馈 订阅 数据
回到顶部