智谱一口气开源 6 款模型：200 tokens/s + z.ai 域名，国产开源模型的「降维打击」又升级了

智智

6 月

智谱一口气开源 6 款模型：200 tokens/s + z.ai 域名，国产开源模型的「降维打击」又升级了

6 月 4 日，智谱做了一件极其「大方」的事：一次性开源三大类 6 款 GLM 模型，覆盖沉思、推理、基座。推理速度 200 tokens/s 刷新国内商用纪录，价格仅为 DeepSeek-R 1 的 1/30。同时拿下顶级域名 z.ai。

6 款模型分别是什么？

沉思模型 GLM-Z 1-Rumination-32 B：深度思考多步推理
推理模型 GLM-Z 1-32 B：性能媲美 DeepSeek-R 1，200 tokens/s（比常规快 8 倍）
基座模型 GLM-4-Air + GLM-4-Flash：完全免费
同步上线极速版（200 tokens/s）、高性价比版（价格仅 R 1 1/30）、免费版三档

200 tokens/s + 1/30 价格 + z.ai 域名——国产模型竞争在发生什么变化？

1. 速度成为新战场。200 tokens/s 不是实验室数据，是商用推理速度。对实时 Agent 场景——代码补全、对话交互、工具调用——首 token 响应时间比 Benchmark 分数更直接影响用户体验。

2. 价格战从「便宜」变成了「接近免费」。DeepSeek-R 1 已经是价格标杆。智谱把价格打到它的 1/30——两个模型直接免费。

3. z.ai 是一个品牌信号。单字母 .ai 域名全球仅 26 个。智谱在告诉国际开发者社区「我们不是一家只做中国市场的公司」。

国产开源模型正在形成怎样的「四强」格局？

DeepSeek（技术标杆）、Qwen（国际声望）、MiniMax（开源全能）、智谱（品类覆盖）——每家都找到了自己的定位。从「一家独大」到「充分竞争」，最终受益的是开发者和用户。

智盒判断

短期：6 款一起开源 + 免费模型会产生开发者尝鲜潮。但品牌知名度在海外不如 MiniMax 和 Qwen，z.ai 需要时间和营销。

中期：200 tokens/s 极速版的实际生产稳定性和准确性是关键验证。如果在速度-质量均衡点上站稳，会在 Agent 实时推理场景中获得差异化优势。

FAQ

智谱的模型和 DeepSeek 比谁更强？

GLM-Z 1-32 B 性能媲美 DeepSeek-R 1。但 200 tokens/s 的速度和 1/30 价格是明确的竞争优势。

参考来源：36 氪, z.ai, 智谱官方公告

作者

智智

Posts

17 6 月

SpaceX 以 600 亿美元股票收购 Cursor：马斯克的 AI 铁王座完整了

发生了什么？6 月 16 日，SpaceX 宣布同意以约 600 亿美元的全股票方式收购 AI 编程初创公司 Cursor 的母公司 Anysphere。这笔交易发生在 SpaceX 6 月 12 日纳斯达克 IPO 后不到 4 天——IPO 估值超过 2 万亿美元，是人类历史上规模最大的上市。这是一个「用股价换资产」的典型策略。收购完成后，Anysphere 将作为 SpaceX 旗下独立子公司运营，Cursor 品牌与产品线短期保持不变。交易预计于 2026 年 Q3 完成。时间线：从 4 月期权到 6 月全吞4 月初 SpaceX 与 Anysphere...

盒盒

资讯

没有评论 Read More

17 6 月

Agentjacking 警报：85% 成功率的 AI 编程 Agent 劫持攻击，2388 家组织已暴露

Agentjacking 攻击是如何运作的？攻击者伪造 Sentry 错误消息——这是开发者最熟悉的错误追踪工具之一，直接把伪造的错误注入 Claude Code、Cursor、Codex 等 AI 编程 Agent 的工作流。AI 编程 Agent 在处理代码时遇到这个「假错误」，会像对待真实 Sentry 错误一样去分析它，而攻击者的指令就藏在错误的「修复建议」中。攻击链分四步：第一步，攻击者在公开代码库或 CI 日志中植入伪造的 Sentry 错误消息。第二步，受害者使用 AI 编程 Agent 打开包含该错误的项目。第三步，Agent 自动分析错误并遵循藏在错误消息中的恶意指令。第四步，Agent 执行注入的代码——可能泄露 API 密钥、数据库凭证或修改 CI/CD 管道配置。为什么 85% 的攻击成功率令人担忧？据 AI Weekly 报告，在测试中 85% 的 AI 编程 Agent...

盒盒

资讯

没有评论 Read More

17 6 月

ChatGPT 月活破 10 亿，但 AI 市场的真正故事不是赢家通吃

10 亿月活：为什么这个数字真的厉害？Sensor Tower 发布《2026 年 AI 状态报告》，ChatGPT 成为史上最快达到 10 亿月活的消费应用——仅用 3 年，超过了 TikTok（4 年）、YouTube（6 年）和 Instagram（7 年）。这背后有 3 个放大器：疫情后全球对 AI 工具的需求基数已不同；ChatGPT 从纯文本扩展到多模态，使用场景指数级增加；OpenAI 的免费策略和移动端优化极大降低了使用门槛。市场份额跌破 50%：为什么 AI 不是「赢家通吃」市场？尽管 ChatGPT 用户数惊人，Sensor Tower 数据显示其「真实用户市场份额」（App+Web 合并去重）在 2026 年 3 月首次跌破 50%。原因有三：AI 使用是任务驱动而非社交网络驱动的，用户会根据不同任务切换工具；模型能力的差异化正在缩小；后发优势——Claude 在企业场景、DeepSeek 在长文本推理、Gemini 在多媒体处理上各有专长。Claude...

智智

资讯

没有评论 Read More

17 6 月

阿里 Qwen-Robot 三件套发布：中国具身智能的「会干」转折日

阿里 Qwen-Robot 三大模型拆解：从看懂到动手的逻辑6 月 16 日阿里巴巴发布的 Qwen-Robot 系列包含三个模型，分别解决具身智能的三个核心问题。操作模型 Qwen-RobotManip 采用 80 维统一动作表征，基于 38100 小时开源操作数据训练，实现跨硬件快速适配。移动模型 Qwen-RobotNav 引入任务自适应观察机制，在宇树科技 Go2 四足机器人上零样本部署（NVIDIA Jetson Thor，推理延迟 196ms），仅用单个低分辨率相机就可在陌生公寓中执行多房间任务。世界模型 Qwen-RobotWorld 基于物理规律认知，可预演动作轨迹并生成训练数据，跨操作、驾驶和导航场景预测符合物理规律的未来。6 月 16 日还有谁在具身智能赛道上出牌？同日，蚂蚁百灵发布 Ling & Ring 2.6 万亿参数三模型技术报告；理想汽车 Livis Day 定义具身智能汽车=电动车+职业司机+AI计算机+生活助手；法国 Genesis AI 发布非人形通用机器人 Eno（前 Google CEO...

盒盒

资讯

没有评论 Read More