互联网机器人流量57.5%首次超越人类封面
5

6 月

互联网 57.5% 的流量已经是机器人——我们正在见证「人类互联网」的终结

6 月 4 日,科技博主 @xiaohu 在 X 上贴出了一张 Cloudflare Radar 的实时截图。这张图迅速引发了全球热议。关键数字:机器人流量占比 57.5%,人类流量仅 42.5%。

Cloudflare 是全球最大的 CDN 服务商之一,服务约 20% 的互联网流量。这份数据虽然不是完整样本,但具有极强的代表性。换句话说:你访问的这个网页,大概率有超过一半的「访客」不是人。

在所有 HTTP 返回内容中,JSON(API 通信)占 33.1% 居首,HTML 仅占 12%。互联网已经从「给人看的网」变成「机器对机器的通信管道」。

机器人流量超越人类流量数据可视化

三重结构性转变正在发生什么?

1. 流量主体的倒置

这不是渐变,是突变。五年内,互联网从「人类生产内容给人类看」变成了「人类生产内容给机器抓、机器生产内容给人看、机器生产内容给机器用」的三层结构。HTML 网页已经退居二线,JSON API 成了最重要的内容格式。

2. AI 训练数据的「合法盗采」危机

机器人流量中 AI 爬虫占了多少?Cloudflare 没有细分。但考虑到 OpenAI、Google、Anthropic 数以万计的爬虫每天抓取全网内容,这不是小数字。关键矛盾:网站花带宽服务机器人,AI 公司用这些数据训练出的模型可能反过来替代网站的内容价值。

3. 互联网基础设施的「隐性补贴」

中小网站所有者可能没意识到——他们在为 AI 公司的数据采集买单。每 1 GB 被 AI 爬虫抓取的内容,都是服务器付出的带宽费用。而 AI 公司通过 robots.txt 绕过限制、更换 User-Agent、甚至无视爬虫协议。

57.5% 的机器人流量对内容创作者意味着什么?

  • 对内容创作者/媒体:你的文章在被 AI 抓取后,可能出现在 ChatGPT、Google AI Overview 的答案中——而用户不再点击你的网站。内容在被动消费,但没有获得流量
  • 对 SEO 从业者:传统 SEO 的「写好内容让人搜索并点击」正在瓦解。GEO(生成引擎优化)不再是选项,而是逃生出口
  • 对开发者/网站主:你的带宽账单中可能有一半是为了服务机器人。考虑 CDN 的 Bot Management 功能来控制成本
  • 对普通用户:AI 直接给你答案时,这些答案从哪里来?如果源网站因流量流失而倒闭,下一代 AI 用什么训练?

智盒判断:互联网的「去人类化」还能逆转吗?

短期:Cloudflare 数据会引发连锁反应——更多媒体和内容网站可能「拔网线」(更严格的 robots.txt、付费墙),加剧「开放互联网」和「AI 封闭生态」的冲突。

中期:57.5% 可能还会上升。随着 Agent 普及——Claude Code 浏览网页、ChatGPT 联网搜索、Gemini 页面浏览——机器流量只增不减。

长期:这是「人类互联网」终结的开始。未来互联网可能是三层结构:底层机器通信基础设施,中层 AI 生成的内容池,顶层人类创作者的高价值付费内容。开放 Web 的黄金时代正在落幕。

FAQ

57.5% 包括搜索引擎爬虫吗?

是的,包括 Googlebot 等合法搜索引擎爬虫。但也包括 AI 训练数据爬虫、监控机器人、恶意爬虫等。Cloudflare 没有提供细分数据。

对 SEO 有什么影响?

如果 AI 直接抓取你的内容并在对话中给出答案,而用户不再点击链接,那么「排名第一」的意义会大大缩水。开始关注 GEO 和结构化数据,让内容更容易被 AI 正确引用。

应该对抗还是拥抱 AI 爬虫?

没有标准答案。封堵保护带宽但也让你的内容在 AI 搜索结果中「不存在」。折中方案:允许主流爬虫,封堵未知来源。

参考来源:Cloudflare Radar, X @xiaohu, IT 之家

RELATED

Posts