资讯
22 天 10+ 款前沿发布:2026 年 5 月 AI 模型马拉松全景解读
2026 年 5 月是 AI 史上最密集发布月:GPT-5.5 Instant、Gemini 3.5 Flash、Claude Opus 4.8 等 10+款前沿发布全景解读。从参数竞赛到 Agent 化范式转变。
工具
Kimi 的野心不止于模型:K 2.7 Code 开源 + 300 子 Agent 桌面应用,月之暗面的「双轨战略」
月之暗面双发:Kimi K 2.7 Code 开源提升 21.8% + 300 子 Agent 桌面应用。开源模型免费圈开发者,Agent 集群锁定重度用户。
工具
闲鱼副业红利还在吗?我拆解了 3 个开源自动化工具,结论有点意外
闲鱼副业红利还在吗?我拆解了 3 个开源自动化工具,结论有点意外 最近刷到一个有意思的帖子。一个人说自己同时运营 5 个闲鱼账号,每天要处理上百条咨询、上十次议价、上十次发货确认。手工操作,忙到凌晨两点。然后他放出了自己搭的自动化工作流。……
工具
Databricks 开源 Omnigent:跨 Claude Code、Codex、Pi 的 Agent 编排层,会是「Android 时刻」吗?
Databricks + Neon 联合开源 Omnigent——首个跨 Claude Code、Codex、Pi 的 Agent meta-harness。Apache 2.0 许可证。
热门
阿里 Qwen-Robot 三件套发布:中国具身智能的「会干」转折日
2026-06-17闲鱼副业红利还在吗?我拆解了 3 个开源自动化工具,结论有点意外
2026-05-01最新
SpaceX 以 600 亿美元股票收购 Cursor:马斯克的 AI 铁王座完整了
2026-06-17ChatGPT 月活破 10 亿,但 AI 市场的真正故事不是赢家通吃
2026-06-17微软 Copilot Cowork 全球 GA:企业 Agent 元年的真正开篇
2026-06-17阿里 Qwen-Robot 三件套发布:中国具身智能的「会干」转折日
2026-06-17 28 5 月
FastVideo Dreamverse 开源:一张 B 200,7 秒生成 30 秒高清视频
实时视频生成又多了一个开源选项。Sky Computing Lab 在 5 月 27 日开源了 FastVideo Dreamverse——基于单张 NVIDIA B 200 GPU 和 LTX-2 模型,实现实时视频生成的氛围引导工具。核心数字:7 秒生成 30 秒 1080 p 视频。 来源:X: @haoailab / GitHub / Blog 为什么重要 实时视频生成有三个关键门槛:速度(不能等几分钟)、质量(1080 p 是底线)、硬件成本(能不能跑在单卡上)。FastVideo Dreamverse 三个都过了。 对比一下同一天 Runway 发布的 MCP 服务器——Runway 走的是云端 API 路线,FastVideo 走的是本地开源路线。前者方便但花钱,后者需要硬件但免费。 技术栈 GPU:NVIDIA...
28 5 月
中国 AI 的一攻一守:Qwen 3.5 跑出 580 tps,Cognition 估值 260 亿美元
5 月 27 日,两个数字——一个关于速度,一个关于金钱——同时刷新了中国 AI 的天花板。 Qwen 3.5 跑出 580 tokens per second。在 TokenSpeed 推理引擎上,针对 Agent 工作负载。这个速度由通义千问推理团队、Lightseek Foundation 的 TokenSpeed 团队、NVIDIA 和 Mooncake 联合实现,并采用了 FlashAttention-4(FA 4)优化。 Cognition 估值 260 亿美元。Devin 的母公司完成超 10 亿美元融资,Lux Capital 和 General Catalyst 领投。年化收入 4.92 亿,企业用量年初至今增长超 10 倍。 来源:X: Alibaba_Qwen /...
28 5 月
Google I/O 2026 复盘:Gemini 月活 9 亿、全栈 Agent 化、世界模型,Google 用「生态反击」回应了所有人
如果你这周只看了一场发布会,你可能会以为 Anthropic 和 OpenAI 是这个行业唯一的两个玩家。 5 月 20 日 Google I/O 把这种印象彻底打碎了。Pichai 开场用了不到 20 分钟甩出一组数字:Gemini 月活 9 亿(一年前是 4 亿),覆盖 230 个国家 70 种语言,Google Search 的 AI Mode 查询量每季度翻倍。然后才是产品:Gemini 3.5 Flash、Omni 世界模型、Spark 跨应用 Agent、Agent Payments Protocol。 但 Google I/O 2026 真正值得关注的东西不是单一产品,而是一个模式:Google 在用生态宽度打。
28 5 月
Claude Code 生态大爆发:从 v 2.1.152 更新到 GitHub 全栈工具链,开发者正在给 AI 疯狂装「外挂」
如果你今天打开 GitHub Trending,会看到一副罕见的景象:前 10 名中至少有 4 个项目直接与 Claude Code 相关——ECC(19.4 万星)、claude-mem(7.8 万星)、taste-skill(2.1 万星)、Anthropic 官方的 knowledge-work-plugins(1.6 万星)。同一天,Claude Code v 2.1.152 发布了。 这不是巧合。Claude Code 正在从一个「AI 编程工具」变成一个「AI 编程平台」,而开发者社区的狂热反应是最诚实的信号灯。 v 2.1.152:三个看似小、实则深远的改动 先看官方更新。v 2.1.152 的 changelog 不算长,但有三项改动直接指向了 Claude Code 的产品方向: /code-review --fix 落地。之前 code review 只出报告,看完了你得自己改。现在 --fix 标志会把审查建议直接应用到工作目录。这意味着 code review 从「顾问」变成了「执行者」。 Skill 的。
28 5 月
Claude Code 自动模式搞砸了你的项目?Boris 教你 5 个步骤让它真正干活
Claude Code 创作者 Boris Cherny 分享自动模式多任务并行技巧。5 步实操指南:任务拆分→验证标准→优先级编排→并行执行→结果汇总。附 CLAUDE.md 配置模板。
27 5 月
别再为这些工具付费了,这 30 个开源替代品让你的月账单直接砍半
上个月我认真拉了一遍 SaaS 账单,吓了一跳。本文从 100 个开源 GitHub 仓库中精选 30 个最实用的替代品——n 8 n 替代 Zapier、Penpot 替代 Figma、Ollama 替代 ChatGPT 订阅——按六大类逐一拆解,每项标注许可证和坑点。
27 5 月
AI 视频生产三连击:Runway Luxo + Gemini Omni + Kling 同时跨过「能用」门槛
如果你对 AI 视频的印象还停留在「那些有点诡异的六指人类和违反物理定律的物体运动」,今天有三个独立信号在告诉你:可以更新认知了。 Runway Luxo:跨越恐怖谷 Runway 今天发布了 Project Luxo 的研究结果,核心结论只有一句话:AI 生成视频已经跨过了恐怖谷。 他们做了什么?向创意行业的从业者展示了包括 AI 短片《The Rogue》和广告样片在内的作品,然后评估观众的反应。结果是:观众开始关注故事本身,而不是技术瑕疵。 更有意思的是生产效率数据:所有作品都由单人团队制作,耗时从 3 周到 4 小时不等。用 Runway 的话说:「当技术足够好以至于『隐形』,观众沉浸于故事而非技术时,就意味着跨越。」 这个判断标准其实很聪明——它不是用 PSNR 或 FVD 这些技术指标来证明 AI 视频「变好了」,而是用观众的行为数据。当观众不再在弹幕里刷「AI 生成的吧」,AI 视频就真的成熟了。 Gemini Omni:不只是生成,而是「拍摄」 同一天,Google 官方发布了 Gemini Omni 的视频提示词指南。五条技巧,每一条都值得细读: 利用模型已有的现实世界知识。Gemini Omni 的训练数据包含了大量现实世界的视觉信息,你不需要描述「一辆红色的汽车长什么样」,直接说「一辆红色特斯拉 Model 3 在太平洋海岸公路上行驶」就行。 精确控制文本渲染。视频中的文字排版一直是 AI 视频的弱项,Gemini Omni 在这方面做了针对性优化,支持指定字体、位置和动效。 使用专业镜头指令。推拉摇移、景深、构图——用电影摄影师的术语来写提示词,而不是「拍得好看一点」。 迭代编辑而非重拍。不需要因为一个细节不满意就重新生成整个视频。可以像改代码一样在上一版基础上修改。 直接调整角色的动作节奏或情绪。对于叙事类内容,这个能力意味着你不需要重新设计角色动画,只需要告诉模型「让她走得更快一点」或「表情更紧张」。 这些技巧看起来简单,但背后反映的是。























