Qwen3.6-Plus 爆火这一周，开发者先吵的不是它强不强

Fri, 10 Apr 2026 12:15:00 +0800

大家都在问：Qwen3.6-Plus 到底有没有超过 Claude？

说实话，这不是这次发布里最值得看的问题。真正该盯住的是另一件事：阿里这次发的，已经不只是一个“更强一点的 Qwen”，而是在把自己往 hosted agent model 的位置上推。1M context、agentic coding、多模态、preserve_thinking，这套词不是在卖聊天模型，是在抢开发者工作流。

Qwen3.6-Plus 这次最值得看的，不是谁赢了谁，而是阿里开始认真抢 hosted agent 这张桌子上的位置。

官方信息里，能确认的部分并不含糊。Qwen3.6-Plus 在 4 月 2 日正式发布，走的是托管 API 路线，不是开放权重模型；默认给到 1M context，主打 agentic coding 和多模态推理，还专门加了一个 preserve_thinking，明确就是冲着多步 agent 任务去的。单看这组信号，方向已经很清楚了：它想证明自己不是“Qwen 家族里又一个新型号”，而是一个更接近真实工程任务的工作模型。

问题在于，宣传口径和开发者真正关心的东西，从来不是一回事。

这次声量为什么大，我觉得有三个原因。第一，1M context 这种数字天生适合传播，哪怕很多人短期根本用不到。第二，agent coding 这几个字现在太敏感了，只要谁敢往这个方向喊，开发者都会看两眼。第三，也是最现实的一点：只要市场相信它有机会用更低成本去碰一线模型的活，哪怕还没坐实，试用流量就会先冲上来。

所以它爆火，不光是因为能力，也因为想象空间够大。

但第一波开发者反馈，很快就把想象空间拉回了地面。

最典型的争议，不是“它写代码到底比谁强 3 分还是 5 分”，而是 benchmark 口径。官方公开表格里，Qwen3.6-Plus 在 Terminal-Bench 2.0 上给出的分数是 61.6，高于表中 Claude Opus 4.5 的 59.3；在 SWE-bench Verified 上是 78.8，低于表中 Claude Opus 4.5 的 80.9。这个信息本身可以转述，但社区真正盯着看的不是数字漂亮不漂亮，而是：为什么拿 4.5 对比，不是更新的 4.6？

国内 AI 出图，不是只有即梦和文心一格：8 类玩家、3 个坑、一个选型框架

Thu, 09 Apr 2026 12:51:51 +0800

很多人一提国内文生图，脑子里只有两个名字：即梦、文心一格。

这就像聊新能源汽车时，只知道特斯拉和比亚迪。

够用来聊天，不够用来做决策。

如果你只是自己玩玩，知道哪个产品顺手就行。但只要你要接 API、做产品、跑批量生成、算预算、考虑审核和商用，问题马上变了。

你真正要问的不是“谁最强”，而是：

这家卖的到底是模型、平台，还是一个看起来像工具的流量入口？

国内文生图现在最容易让人误判的地方，不是效果，而是维度。有的平台在卖模型能力，有的平台在卖云平台接入，有的平台更像创作产品入口，还有的平台其实主战场是视频，只是顺手也做了图像。

这篇文章不做“谁吊打谁”的排行榜。

我只做一件事：把国内主流玩家的类型、价格口径、接入成熟度和常见坑，先帮你捋顺。

看完你至少能回答三个问题：

如果你是开发者，先看哪几家最省时间
如果你是企业决策者，哪几家最容易算成本
如果你是内容团队，哪些名字适合拿来生产，哪些名字适合拿来传播

先纠正一个认知：国内文生图不是两家，是至少 4 类玩家

这轮调研里，主流玩家大致能分成 4 类。

第一类，自研大模型 + 云平台型。代表是阿里云通义万相、腾讯混元、百度千帆、商汤日日新、智谱 BigModel、火山引擎方舟。

这类平台的共同点，是你能看到比较完整的 API、控制台、文档、计费体系。它们不是单纯给你一个“点一下就出图”的网页产品，而是想让你把图像能力接进业务里。

第二类，聚合 MaaS 平台型。这次最典型的是硅基流动。

它的价值不在于“自家文生图最强”，而在于你可以用一个平台接多个模型。对想快速试模型、又不想一开始就被单一厂商绑定的团队，这类平台很实用。

第三类，偏内容创作产品，同时带平台能力。最有代表性的就是即梦这类名字。

它的传播力往往比技术平台更强。很多普通用户知道即梦，却未必知道背后还有火山方舟、Seedream、豆包生态这些更偏开发接入的层。

第四类，相邻玩家。比如 Vidu。

它更偏视频生成，只是也有 image generating、reference-to-image 这类能力。你可以把它放进生态图里，但别把它和纯文生图平台硬摆在一条起跑线上。

很多选型文章一上来就横向 PK，问题是它们比的根本不是一类东西。

如果你真要选，先看这三个维度

我更建议你用下面这套框架，不要先被品牌热度带着跑。

1）你要的是“创作工具”，还是“可接入平台”

如果你只是做海报、封面、社媒配图，产品入口和模板丰富度很重要。

如果你要接到 App、工作流、营销系统或者企业内容生产里，文档、鉴权、并发、返回结果、计费规则，才是大头。

很多人会混淆这两种需求。

前者会觉得“好用最重要”，后者会发现“能不能稳定上线”比单次出图好不好看更关键。

2）你比的不是“单价”，而是“计费口径”

这是国内平台最容易把人带沟里的地方。

有的平台按张计费。有的平台页面上能看到的是模型价格，但真正落地时还会叠加部署、缓存、批处理之类的成本。有的平台单张不贵，但默认并发很低，真上生产得额外加钱。

同样写着便宜，便宜的可能根本不是同一件事。

3）你要的是“出图能力”，还是“一整条内容工作流”

阿里、百度、腾讯、火山这类平台，本质上都不只是给你一张图。

它们想卖的是更完整的能力栈：图像、文本、视频、Agent、控制台、企业接入、云生态。

如果你只从“这张图看起来像不像 Midjourney”去比，很多真正影响落地成本的东西会被你忽略掉。

一张表，先把主流玩家扫一遍

下面这张表，不是效果排行榜，而是“决策入口表”。

平台	这次最值得关注的点	价格透明度	接入成熟度	更适合谁
阿里云通义万相 / 百炼	模型价格和免费额度相对清楚，OpenAI 兼容接口明确	高	高	开发者、企业应用团队
火山引擎方舟 / 即梦生态	热度高，图像和视频工作流更强，传播性最好写	中	高	内容团队、想做图视频联动的团队
腾讯混元	中文内容场景、企业接入和 API 体系比较完整	中	高	腾讯云生态用户、企业团队
百度千帆	图像生成价格页最完整，按张计费最好算预算	高	高	要做预算评估的团队
智谱 BigModel / CogView	平台化思路强，适合统一接入多模态能力	中偏低	高	已在智谱体系开发的团队
商汤日日新	价格低，但并发和 QPS 口径要一起看	中	中高	有企业并发需求的团队
硅基流动	聚合平台，不是单一模型厂商	取决于具体模型	高	想快速试多个模型的开发者
Vidu	更偏视频，不建议当纯文生图主角写	低	中高	视频生成团队

如果只挑 4 家最适合放正文重点讲，我会选：阿里、火山、百度、腾讯。

模型选型 on Zampo Blog