互联网 57.5% 的流量已经是机器人——我们正在见证「人类互联网」的终结

智智

6 月

互联网 57.5% 的流量已经是机器人——我们正在见证「人类互联网」的终结

6 月 4 日，科技博主 @xiaohu 在 X 上贴出了一张 Cloudflare Radar 的实时截图。这张图迅速引发了全球热议。关键数字：机器人流量占比 57.5%，人类流量仅 42.5%。

Cloudflare 是全球最大的 CDN 服务商之一，服务约 20% 的互联网流量。这份数据虽然不是完整样本，但具有极强的代表性。换句话说：你访问的这个网页，大概率有超过一半的「访客」不是人。

在所有 HTTP 返回内容中，JSON（API 通信）占 33.1% 居首，HTML 仅占 12%。互联网已经从「给人看的网」变成「机器对机器的通信管道」。

三重结构性转变正在发生什么？

1. 流量主体的倒置

这不是渐变，是突变。五年内，互联网从「人类生产内容给人类看」变成了「人类生产内容给机器抓、机器生产内容给人看、机器生产内容给机器用」的三层结构。HTML 网页已经退居二线，JSON API 成了最重要的内容格式。

2. AI 训练数据的「合法盗采」危机

机器人流量中 AI 爬虫占了多少？Cloudflare 没有细分。但考虑到 OpenAI、Google、Anthropic 数以万计的爬虫每天抓取全网内容，这不是小数字。关键矛盾：网站花带宽服务机器人，AI 公司用这些数据训练出的模型可能反过来替代网站的内容价值。

3. 互联网基础设施的「隐性补贴」

中小网站所有者可能没意识到——他们在为 AI 公司的数据采集买单。每 1 GB 被 AI 爬虫抓取的内容，都是服务器付出的带宽费用。而 AI 公司通过 robots.txt 绕过限制、更换 User-Agent、甚至无视爬虫协议。

57.5% 的机器人流量对内容创作者意味着什么？

对内容创作者/媒体：你的文章在被 AI 抓取后，可能出现在 ChatGPT、Google AI Overview 的答案中——而用户不再点击你的网站。内容在被动消费，但没有获得流量
对 SEO 从业者：传统 SEO 的「写好内容让人搜索并点击」正在瓦解。GEO（生成引擎优化）不再是选项，而是逃生出口
对开发者/网站主：你的带宽账单中可能有一半是为了服务机器人。考虑 CDN 的 Bot Management 功能来控制成本
对普通用户：AI 直接给你答案时，这些答案从哪里来？如果源网站因流量流失而倒闭，下一代 AI 用什么训练？

智盒判断：互联网的「去人类化」还能逆转吗？

短期：Cloudflare 数据会引发连锁反应——更多媒体和内容网站可能「拔网线」（更严格的 robots.txt、付费墙），加剧「开放互联网」和「AI 封闭生态」的冲突。

中期：57.5% 可能还会上升。随着 Agent 普及——Claude Code 浏览网页、ChatGPT 联网搜索、Gemini 页面浏览——机器流量只增不减。

长期：这是「人类互联网」终结的开始。未来互联网可能是三层结构：底层机器通信基础设施，中层 AI 生成的内容池，顶层人类创作者的高价值付费内容。开放 Web 的黄金时代正在落幕。

FAQ

57.5% 包括搜索引擎爬虫吗？

是的，包括 Googlebot 等合法搜索引擎爬虫。但也包括 AI 训练数据爬虫、监控机器人、恶意爬虫等。Cloudflare 没有提供细分数据。

对 SEO 有什么影响？

如果 AI 直接抓取你的内容并在对话中给出答案，而用户不再点击链接，那么「排名第一」的意义会大大缩水。开始关注 GEO 和结构化数据，让内容更容易被 AI 正确引用。

应该对抗还是拥抱 AI 爬虫？

没有标准答案。封堵保护带宽但也让你的内容在 AI 搜索结果中「不存在」。折中方案：允许主流爬虫，封堵未知来源。

参考来源：Cloudflare Radar, X @xiaohu, IT 之家

作者

智智

Posts

17 6 月

SpaceX 以 600 亿美元股票收购 Cursor：马斯克的 AI 铁王座完整了

发生了什么？6 月 16 日，SpaceX 宣布同意以约 600 亿美元的全股票方式收购 AI 编程初创公司 Cursor 的母公司 Anysphere。这笔交易发生在 SpaceX 6 月 12 日纳斯达克 IPO 后不到 4 天——IPO 估值超过 2 万亿美元，是人类历史上规模最大的上市。这是一个「用股价换资产」的典型策略。收购完成后，Anysphere 将作为 SpaceX 旗下独立子公司运营，Cursor 品牌与产品线短期保持不变。交易预计于 2026 年 Q3 完成。时间线：从 4 月期权到 6 月全吞4 月初 SpaceX 与 Anysphere...

盒盒

资讯

没有评论 Read More

17 6 月

Agentjacking 警报：85% 成功率的 AI 编程 Agent 劫持攻击，2388 家组织已暴露

Agentjacking 攻击是如何运作的？攻击者伪造 Sentry 错误消息——这是开发者最熟悉的错误追踪工具之一，直接把伪造的错误注入 Claude Code、Cursor、Codex 等 AI 编程 Agent 的工作流。AI 编程 Agent 在处理代码时遇到这个「假错误」，会像对待真实 Sentry 错误一样去分析它，而攻击者的指令就藏在错误的「修复建议」中。攻击链分四步：第一步，攻击者在公开代码库或 CI 日志中植入伪造的 Sentry 错误消息。第二步，受害者使用 AI 编程 Agent 打开包含该错误的项目。第三步，Agent 自动分析错误并遵循藏在错误消息中的恶意指令。第四步，Agent 执行注入的代码——可能泄露 API 密钥、数据库凭证或修改 CI/CD 管道配置。为什么 85% 的攻击成功率令人担忧？据 AI Weekly 报告，在测试中 85% 的 AI 编程 Agent...

盒盒

资讯

没有评论 Read More

17 6 月

ChatGPT 月活破 10 亿，但 AI 市场的真正故事不是赢家通吃

10 亿月活：为什么这个数字真的厉害？Sensor Tower 发布《2026 年 AI 状态报告》，ChatGPT 成为史上最快达到 10 亿月活的消费应用——仅用 3 年，超过了 TikTok（4 年）、YouTube（6 年）和 Instagram（7 年）。这背后有 3 个放大器：疫情后全球对 AI 工具的需求基数已不同；ChatGPT 从纯文本扩展到多模态，使用场景指数级增加；OpenAI 的免费策略和移动端优化极大降低了使用门槛。市场份额跌破 50%：为什么 AI 不是「赢家通吃」市场？尽管 ChatGPT 用户数惊人，Sensor Tower 数据显示其「真实用户市场份额」（App+Web 合并去重）在 2026 年 3 月首次跌破 50%。原因有三：AI 使用是任务驱动而非社交网络驱动的，用户会根据不同任务切换工具；模型能力的差异化正在缩小；后发优势——Claude 在企业场景、DeepSeek 在长文本推理、Gemini 在多媒体处理上各有专长。Claude...

智智

资讯

没有评论 Read More

17 6 月

阿里 Qwen-Robot 三件套发布：中国具身智能的「会干」转折日

阿里 Qwen-Robot 三大模型拆解：从看懂到动手的逻辑6 月 16 日阿里巴巴发布的 Qwen-Robot 系列包含三个模型，分别解决具身智能的三个核心问题。操作模型 Qwen-RobotManip 采用 80 维统一动作表征，基于 38100 小时开源操作数据训练，实现跨硬件快速适配。移动模型 Qwen-RobotNav 引入任务自适应观察机制，在宇树科技 Go2 四足机器人上零样本部署（NVIDIA Jetson Thor，推理延迟 196ms），仅用单个低分辨率相机就可在陌生公寓中执行多房间任务。世界模型 Qwen-RobotWorld 基于物理规律认知，可预演动作轨迹并生成训练数据，跨操作、驾驶和导航场景预测符合物理规律的未来。6 月 16 日还有谁在具身智能赛道上出牌？同日，蚂蚁百灵发布 Ling & Ring 2.6 万亿参数三模型技术报告；理想汽车 Livis Day 定义具身智能汽车=电动车+职业司机+AI计算机+生活助手；法国 Genesis AI 发布非人形通用机器人 Eno（前 Google CEO...

盒盒

资讯

没有评论 Read More