智谱6款模型开源z.ai域名封面
7

6 月

智谱一口气开源 6 款模型:200 tokens/s + z.ai 域名,国产开源模型的「降维打击」又升级了

6 月 4 日,智谱做了一件极其「大方」的事:一次性开源三大类 6 款 GLM 模型,覆盖沉思、推理、基座。推理速度 200 tokens/s 刷新国内商用纪录,价格仅为 DeepSeek-R 1 的 1/30。同时拿下顶级域名 z.ai。

6 款模型分别是什么?

  • 沉思模型 GLM-Z 1-Rumination-32 B:深度思考多步推理
  • 推理模型 GLM-Z 1-32 B:性能媲美 DeepSeek-R 1,200 tokens/s(比常规快 8 倍)
  • 基座模型 GLM-4-Air + GLM-4-Flash:完全免费
  • 同步上线极速版(200 tokens/s)、高性价比版(价格仅 R 1 1/30)、免费版三档
智谱6款GLM模型开源z.ai域名示意

200 tokens/s + 1/30 价格 + z.ai 域名——国产模型竞争在发生什么变化?

1. 速度成为新战场。200 tokens/s 不是实验室数据,是商用推理速度。对实时 Agent 场景——代码补全、对话交互、工具调用——首 token 响应时间比 Benchmark 分数更直接影响用户体验。

2. 价格战从「便宜」变成了「接近免费」。DeepSeek-R 1 已经是价格标杆。智谱把价格打到它的 1/30——两个模型直接免费。

3. z.ai 是一个品牌信号。单字母 .ai 域名全球仅 26 个。智谱在告诉国际开发者社区「我们不是一家只做中国市场的公司」。

国产开源模型正在形成怎样的「四强」格局?

DeepSeek(技术标杆)、Qwen(国际声望)、MiniMax(开源全能)、智谱(品类覆盖)——每家都找到了自己的定位。从「一家独大」到「充分竞争」,最终受益的是开发者和用户。

智盒判断

短期:6 款一起开源 + 免费模型会产生开发者尝鲜潮。但品牌知名度在海外不如 MiniMax 和 Qwen,z.ai 需要时间和营销。

中期:200 tokens/s 极速版的实际生产稳定性和准确性是关键验证。如果在速度-质量均衡点上站稳,会在 Agent 实时推理场景中获得差异化优势。

FAQ

智谱的模型和 DeepSeek 比谁更强?

GLM-Z 1-32 B 性能媲美 DeepSeek-R 1。但 200 tokens/s 的速度和 1/30 价格是明确的竞争优势。

参考来源36 氪, z.ai, 智谱官方公告

RELATED

Posts