<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>性能测试 on Zampo Blog</title><link>https://blog.cpdd.fyi/tags/%E6%80%A7%E8%83%BD%E6%B5%8B%E8%AF%95/</link><description>Recent content in 性能测试 on Zampo Blog</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Fri, 17 Apr 2026 19:00:00 +0800</lastBuildDate><atom:link href="https://blog.cpdd.fyi/tags/%E6%80%A7%E8%83%BD%E6%B5%8B%E8%AF%95/index.xml" rel="self" type="application/rss+xml"/><item><title>Qwen3.6 vs Gemma4：本地 AI 模型性能基准测试，10000 tokens/秒是什么体验</title><link>https://blog.cpdd.fyi/posts/qwen3-6-vs-gemma4-benchmark/</link><pubDate>Fri, 17 Apr 2026 19:00:00 +0800</pubDate><guid>https://blog.cpdd.fyi/posts/qwen3-6-vs-gemma4-benchmark/</guid><description>&lt;p&gt;Qwen3.6 的发布，可能是本地 Agent 应用场景中最棒的发布之一。&lt;/p&gt;
&lt;p&gt;为什么？&lt;/p&gt;
&lt;p&gt;因为 Qwen3.5 27B 有一个致命问题：&lt;strong&gt;工具调用可靠性很强，但是慢。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;对于需要不断生成 token 的 Agent 工作流来说，这是关键批评。你有一个可靠的工具调用专家，但它生成 token 的速度慢到你无法实用。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;Qwen3.6 解决了这个问题&lt;/strong&gt;——速度大幅提升，同时保持工具调用可靠性。&lt;/p&gt;
&lt;p&gt;这篇是本地 AI 模型性能基准测试，基于真实测试数据，给你一份可操作的硬件选型指南。看完你知道：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Qwen3.6 比 Qwen3.5 27B 快多少&lt;/li&gt;
&lt;li&gt;24GB VRAM 为什么是魔法数字&lt;/li&gt;
&lt;li&gt;入门/中端/高端/极限四档配置怎么选&lt;/li&gt;
&lt;li&gt;量化等级 Q4/Q5/Q6/Q8 如何取舍&lt;/li&gt;
&lt;/ul&gt;
&lt;hr&gt;
&lt;h2 id="一测试硬件配置"&gt;一、测试硬件配置&lt;/h2&gt;
&lt;p&gt;先说测试平台。&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;平台&lt;/th&gt;
 &lt;th&gt;GPU 配置&lt;/th&gt;
 &lt;th&gt;总 VRAM&lt;/th&gt;
 &lt;th&gt;用途&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;HP Z440&lt;/td&gt;
 &lt;td&gt;2× RTX 3060 12GB&lt;/td&gt;
 &lt;td&gt;24GB&lt;/td&gt;
 &lt;td&gt;双卡并行测试&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Prox 2&lt;/td&gt;
 &lt;td&gt;8× GPU&lt;/td&gt;
 &lt;td&gt;多配置&lt;/td&gt;
 &lt;td&gt;极限吞吐量测试&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;单机&lt;/td&gt;
 &lt;td&gt;RTX 3090 24GB&lt;/td&gt;
 &lt;td&gt;24GB&lt;/td&gt;
 &lt;td&gt;单卡高配测试&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;单机&lt;/td&gt;
 &lt;td&gt;RTX 4090 24GB&lt;/td&gt;
 &lt;td&gt;24GB&lt;/td&gt;
 &lt;td&gt;单卡旗舰测试&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;h3 id="24gb-vram-是魔法数字"&gt;24GB VRAM 是魔法数字&lt;/h3&gt;
&lt;p&gt;为什么强调 24GB？&lt;/p&gt;</description></item></channel></rss>