<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>模型选型 on Zampo Blog</title><link>https://blog.cpdd.fyi/tags/%E6%A8%A1%E5%9E%8B%E9%80%89%E5%9E%8B/</link><description>Recent content in 模型选型 on Zampo Blog</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Fri, 10 Apr 2026 12:15:00 +0800</lastBuildDate><atom:link href="https://blog.cpdd.fyi/tags/%E6%A8%A1%E5%9E%8B%E9%80%89%E5%9E%8B/index.xml" rel="self" type="application/rss+xml"/><item><title>Qwen3.6-Plus 爆火这一周，开发者先吵的不是它强不强</title><link>https://blog.cpdd.fyi/posts/qwen36-plus-user-feedback/</link><pubDate>Fri, 10 Apr 2026 12:15:00 +0800</pubDate><guid>https://blog.cpdd.fyi/posts/qwen36-plus-user-feedback/</guid><description>&lt;p&gt;大家都在问：Qwen3.6-Plus 到底有没有超过 Claude？&lt;/p&gt;
&lt;p&gt;说实话，这不是这次发布里最值得看的问题。真正该盯住的是另一件事：阿里这次发的，已经不只是一个“更强一点的 Qwen”，而是在把自己往 hosted agent model 的位置上推。1M context、agentic coding、多模态、&lt;code&gt;preserve_thinking&lt;/code&gt;，这套词不是在卖聊天模型，是在抢开发者工作流。&lt;/p&gt;
&lt;p&gt;&lt;img src="https://blog.cpdd.fyi/images/qwen36-plus-user-feedback/cover.jpg" alt="Qwen3.6-Plus 头图：从开源模型品牌转向 hosted agent 竞争"&gt;&lt;/p&gt;
&lt;p&gt;&lt;em&gt;Qwen3.6-Plus 这次最值得看的，不是谁赢了谁，而是阿里开始认真抢 hosted agent 这张桌子上的位置。&lt;/em&gt;&lt;/p&gt;
&lt;p&gt;官方信息里，能确认的部分并不含糊。Qwen3.6-Plus 在 4 月 2 日正式发布，走的是托管 API 路线，不是开放权重模型；默认给到 1M context，主打 agentic coding 和多模态推理，还专门加了一个 &lt;code&gt;preserve_thinking&lt;/code&gt;，明确就是冲着多步 agent 任务去的。单看这组信号，方向已经很清楚了：它想证明自己不是“Qwen 家族里又一个新型号”，而是一个更接近真实工程任务的工作模型。&lt;/p&gt;
&lt;p&gt;问题在于，宣传口径和开发者真正关心的东西，从来不是一回事。&lt;/p&gt;
&lt;p&gt;这次声量为什么大，我觉得有三个原因。第一，1M context 这种数字天生适合传播，哪怕很多人短期根本用不到。第二，agent coding 这几个字现在太敏感了，只要谁敢往这个方向喊，开发者都会看两眼。第三，也是最现实的一点：只要市场相信它有机会用更低成本去碰一线模型的活，哪怕还没坐实，试用流量就会先冲上来。&lt;/p&gt;
&lt;p&gt;所以它爆火，不光是因为能力，也因为想象空间够大。&lt;/p&gt;
&lt;p&gt;但第一波开发者反馈，很快就把想象空间拉回了地面。&lt;/p&gt;
&lt;p&gt;最典型的争议，不是“它写代码到底比谁强 3 分还是 5 分”，而是 benchmark 口径。官方公开表格里，Qwen3.6-Plus 在 Terminal-Bench 2.0 上给出的分数是 61.6，高于表中 Claude Opus 4.5 的 59.3；在 SWE-bench Verified 上是 78.8，低于表中 Claude Opus 4.5 的 80.9。这个信息本身可以转述，但社区真正盯着看的不是数字漂亮不漂亮，而是：为什么拿 4.5 对比，不是更新的 4.6？&lt;/p&gt;</description></item><item><title>国内 AI 出图，不是只有即梦和文心一格：8 类玩家、3 个坑、一个选型框架</title><link>https://blog.cpdd.fyi/posts/china-ai-image-platform-comparison/</link><pubDate>Thu, 09 Apr 2026 12:51:51 +0800</pubDate><guid>https://blog.cpdd.fyi/posts/china-ai-image-platform-comparison/</guid><description>&lt;p&gt;很多人一提国内文生图，脑子里只有两个名字：即梦、文心一格。&lt;/p&gt;
&lt;p&gt;这就像聊新能源汽车时，只知道特斯拉和比亚迪。&lt;/p&gt;
&lt;p&gt;够用来聊天，不够用来做决策。&lt;/p&gt;
&lt;p&gt;如果你只是自己玩玩，知道哪个产品顺手就行。
但只要你要接 API、做产品、跑批量生成、算预算、考虑审核和商用，问题马上变了。&lt;/p&gt;
&lt;p&gt;你真正要问的不是“谁最强”，而是：&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;这家卖的到底是模型、平台，还是一个看起来像工具的流量入口？&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;国内文生图现在最容易让人误判的地方，不是效果，而是维度。
有的平台在卖模型能力，有的平台在卖云平台接入，有的平台更像创作产品入口，还有的平台其实主战场是视频，只是顺手也做了图像。&lt;/p&gt;
&lt;p&gt;这篇文章不做“谁吊打谁”的排行榜。&lt;/p&gt;
&lt;p&gt;我只做一件事：把国内主流玩家的类型、价格口径、接入成熟度和常见坑，先帮你捋顺。&lt;/p&gt;
&lt;p&gt;看完你至少能回答三个问题：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;如果你是开发者，先看哪几家最省时间&lt;/li&gt;
&lt;li&gt;如果你是企业决策者，哪几家最容易算成本&lt;/li&gt;
&lt;li&gt;如果你是内容团队，哪些名字适合拿来生产，哪些名字适合拿来传播&lt;/li&gt;
&lt;/ol&gt;
&lt;h2 id="先纠正一个认知国内文生图不是两家是至少-4-类玩家"&gt;先纠正一个认知：国内文生图不是两家，是至少 4 类玩家&lt;/h2&gt;
&lt;p&gt;这轮调研里，主流玩家大致能分成 4 类。&lt;/p&gt;
&lt;p&gt;第一类，自研大模型 + 云平台型。
代表是阿里云通义万相、腾讯混元、百度千帆、商汤日日新、智谱 BigModel、火山引擎方舟。&lt;/p&gt;
&lt;p&gt;这类平台的共同点，是你能看到比较完整的 API、控制台、文档、计费体系。它们不是单纯给你一个“点一下就出图”的网页产品，而是想让你把图像能力接进业务里。&lt;/p&gt;
&lt;p&gt;第二类，聚合 MaaS 平台型。
这次最典型的是硅基流动。&lt;/p&gt;
&lt;p&gt;它的价值不在于“自家文生图最强”，而在于你可以用一个平台接多个模型。对想快速试模型、又不想一开始就被单一厂商绑定的团队，这类平台很实用。&lt;/p&gt;
&lt;p&gt;第三类，偏内容创作产品，同时带平台能力。
最有代表性的就是即梦这类名字。&lt;/p&gt;
&lt;p&gt;它的传播力往往比技术平台更强。很多普通用户知道即梦，却未必知道背后还有火山方舟、Seedream、豆包生态这些更偏开发接入的层。&lt;/p&gt;
&lt;p&gt;第四类，相邻玩家。
比如 Vidu。&lt;/p&gt;
&lt;p&gt;它更偏视频生成，只是也有 image generating、reference-to-image 这类能力。你可以把它放进生态图里，但别把它和纯文生图平台硬摆在一条起跑线上。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;很多选型文章一上来就横向 PK，问题是它们比的根本不是一类东西。&lt;/strong&gt;&lt;/p&gt;
&lt;h2 id="如果你真要选先看这三个维度"&gt;如果你真要选，先看这三个维度&lt;/h2&gt;
&lt;p&gt;我更建议你用下面这套框架，不要先被品牌热度带着跑。&lt;/p&gt;
&lt;h3 id="1你要的是创作工具还是可接入平台"&gt;1）你要的是“创作工具”，还是“可接入平台”&lt;/h3&gt;
&lt;p&gt;如果你只是做海报、封面、社媒配图，产品入口和模板丰富度很重要。&lt;/p&gt;
&lt;p&gt;如果你要接到 App、工作流、营销系统或者企业内容生产里，文档、鉴权、并发、返回结果、计费规则，才是大头。&lt;/p&gt;
&lt;p&gt;很多人会混淆这两种需求。&lt;/p&gt;
&lt;p&gt;前者会觉得“好用最重要”，后者会发现“能不能稳定上线”比单次出图好不好看更关键。&lt;/p&gt;
&lt;h3 id="2你比的不是单价而是计费口径"&gt;2）你比的不是“单价”，而是“计费口径”&lt;/h3&gt;
&lt;p&gt;这是国内平台最容易把人带沟里的地方。&lt;/p&gt;
&lt;p&gt;有的平台按张计费。
有的平台页面上能看到的是模型价格，但真正落地时还会叠加部署、缓存、批处理之类的成本。
有的平台单张不贵，但默认并发很低，真上生产得额外加钱。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;同样写着便宜，便宜的可能根本不是同一件事。&lt;/strong&gt;&lt;/p&gt;
&lt;h3 id="3你要的是出图能力还是一整条内容工作流"&gt;3）你要的是“出图能力”，还是“一整条内容工作流”&lt;/h3&gt;
&lt;p&gt;阿里、百度、腾讯、火山这类平台，本质上都不只是给你一张图。&lt;/p&gt;
&lt;p&gt;它们想卖的是更完整的能力栈：图像、文本、视频、Agent、控制台、企业接入、云生态。&lt;/p&gt;
&lt;p&gt;如果你只从“这张图看起来像不像 Midjourney”去比，很多真正影响落地成本的东西会被你忽略掉。&lt;/p&gt;
&lt;h2 id="一张表先把主流玩家扫一遍"&gt;一张表，先把主流玩家扫一遍&lt;/h2&gt;
&lt;p&gt;下面这张表，不是效果排行榜，而是“决策入口表”。&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;平台&lt;/th&gt;
 &lt;th&gt;这次最值得关注的点&lt;/th&gt;
 &lt;th&gt;价格透明度&lt;/th&gt;
 &lt;th&gt;接入成熟度&lt;/th&gt;
 &lt;th&gt;更适合谁&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;阿里云通义万相 / 百炼&lt;/td&gt;
 &lt;td&gt;模型价格和免费额度相对清楚，OpenAI 兼容接口明确&lt;/td&gt;
 &lt;td&gt;高&lt;/td&gt;
 &lt;td&gt;高&lt;/td&gt;
 &lt;td&gt;开发者、企业应用团队&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;火山引擎方舟 / 即梦生态&lt;/td&gt;
 &lt;td&gt;热度高，图像和视频工作流更强，传播性最好写&lt;/td&gt;
 &lt;td&gt;中&lt;/td&gt;
 &lt;td&gt;高&lt;/td&gt;
 &lt;td&gt;内容团队、想做图视频联动的团队&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;腾讯混元&lt;/td&gt;
 &lt;td&gt;中文内容场景、企业接入和 API 体系比较完整&lt;/td&gt;
 &lt;td&gt;中&lt;/td&gt;
 &lt;td&gt;高&lt;/td&gt;
 &lt;td&gt;腾讯云生态用户、企业团队&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;百度千帆&lt;/td&gt;
 &lt;td&gt;图像生成价格页最完整，按张计费最好算预算&lt;/td&gt;
 &lt;td&gt;高&lt;/td&gt;
 &lt;td&gt;高&lt;/td&gt;
 &lt;td&gt;要做预算评估的团队&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;智谱 BigModel / CogView&lt;/td&gt;
 &lt;td&gt;平台化思路强，适合统一接入多模态能力&lt;/td&gt;
 &lt;td&gt;中偏低&lt;/td&gt;
 &lt;td&gt;高&lt;/td&gt;
 &lt;td&gt;已在智谱体系开发的团队&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;商汤日日新&lt;/td&gt;
 &lt;td&gt;价格低，但并发和 QPS 口径要一起看&lt;/td&gt;
 &lt;td&gt;中&lt;/td&gt;
 &lt;td&gt;中高&lt;/td&gt;
 &lt;td&gt;有企业并发需求的团队&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;硅基流动&lt;/td&gt;
 &lt;td&gt;聚合平台，不是单一模型厂商&lt;/td&gt;
 &lt;td&gt;取决于具体模型&lt;/td&gt;
 &lt;td&gt;高&lt;/td&gt;
 &lt;td&gt;想快速试多个模型的开发者&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Vidu&lt;/td&gt;
 &lt;td&gt;更偏视频，不建议当纯文生图主角写&lt;/td&gt;
 &lt;td&gt;低&lt;/td&gt;
 &lt;td&gt;中高&lt;/td&gt;
 &lt;td&gt;视频生成团队&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;如果只挑 4 家最适合放正文重点讲，我会选：阿里、火山、百度、腾讯。&lt;/p&gt;</description></item></channel></rss>