LLM 模型全景报告 - 2026年06月22日 — BrewPage

⚡ 本周要点（TL;DR）

新模型（近 7 天 7 个）：智谱 GLM-5.2（6/13，1M 上下文，对标 Claude Opus 4.8）+ OpenRouter Fusion / Kimi K2.7 Code / Claude Fable 5 / NVIDIA Nemotron Rerank VL / Nex-N2-Pro
OpenRouter 周榜：DeepSeek V4 Flash 4.51T tokens 居首，腾讯 Hy3 Preview 紧随，MiniMax M3 第三 — 国产模型集体刷榜
云厂商动态：腾讯云近一周密集发 OCR/数学识别 API 迁移、ADP ClawPro 6/12 停止新购；华为云医疗 AI 使能平台案例更新；阿里云百炼 Agent 计费文档微调
价格 / 安全：本周三大云均无新增 AI 直接价格调整或工具链安全公告
报告校验：所有外链已逐条校验，全部 HTTP 200

📑 目录

1常用模型概括（16 个精选） 2市场主流 + 近 7 天新模型 3OpenRouter 周热门 Top 10 4云厂商动态（近 7 天）

⚡ 本周要点（TL;DR）

新模型（近 7 天 7 个）：智谱 GLM-5.2（6/13，1M 上下文，对标 Claude Opus 4.8）+ OpenRouter Fusion / Kimi K2.7 Code / Claude Fable 5 / NVIDIA Nemotron Rerank VL / Nex-N2-Pro
OpenRouter 周榜：DeepSeek V4 Flash 4.51T tokens 居首，腾讯 Hy3 Preview 紧随，MiniMax M3 第三 — 国产模型集体刷榜
云厂商动态：腾讯云近一周密集发 OCR/数学识别 API 迁移、ADP ClawPro 6/12 停止新购；华为云医疗 AI 使能平台案例更新；阿里云百炼 Agent 计费文档微调
价格 / 安全：本周三大云均无新增 AI 直接价格调整或工具链安全公告
报告校验：所有外链已逐条校验，全部 HTTP 200

📑 目录

1常用模型概括（16 个精选） 2市场主流 + 近 7 天新模型 3OpenRouter 周热门 Top 10 4云厂商动态（近 7 天）

⚡ 本周要点（TL;DR）

新模型（近 7 天 7 个）：智谱 GLM-5.2（6/13，1M 上下文，对标 Claude Opus 4.8）+ OpenRouter Fusion / Kimi K2.7 Code / Claude Fable 5 / NVIDIA Nemotron Rerank VL / Nex-N2-Pro
OpenRouter 周榜：DeepSeek V4 Flash 4.51T tokens 居首，腾讯 Hy3 Preview 紧随，MiniMax M3 第三 — 国产模型集体刷榜
云厂商动态：腾讯云近一周密集发 OCR/数学识别 API 迁移、ADP ClawPro 6/12 停止新购；华为云医疗 AI 使能平台案例更新；阿里云百炼 Agent 计费文档微调
价格 / 安全：本周三大云均无新增 AI 直接价格调整或工具链安全公告
报告校验：所有外链已逐条校验，全部 HTTP 200

📑 目录

1常用模型概括（16 个精选） 2市场主流 + 近 7 天新模型 3OpenRouter 周热门 Top 10 4云厂商动态（近 7 天）

📊 常用模型概括 16 个精选模型

💡 快速推荐（实时数据驱动）

                        🆕 近 7 天新模型：Google: Nano Banana 2 (Gemini 3.1 Flash Image)、Google: Nano Banana Pro (Gemini 3 Pro Image)、Cohere: North Mini Code (free)、Z.ai: GLM 5.2

                        🔥 OpenRouter 周榜 Top 3：🥇 DeepSeek V4 Flash / 🥈 MiniMax M3 / 🥉 MiMo-V2.5

                        💰 性价比代表：Qwen3-30B-A3B（¥0.75/M 输入，¥3.0/M 输出）

                        🧠 推理代表：DeepSeek-R1（¥4.0/M 输入，¥16.0/M 输出）

⚠ 本节为概览（部分硬编码），权威实时数据请见 📋 各厂商官方定价对照表 · ⚠ 本节为概览（部分硬编码），权威实时数据请见 📋 各厂商官方定价对照表 · ⚠ 本节为概览（部分硬编码），权威实时数据请见 📋 各厂商官方定价对照表 · 📅 第一部分价格数据截至 2026-06-22（部分硬编码价格，建议季度复核）

模型名称	厂商	输入价格	缓存命中	输出价格	概述	BU（业务单元）	业务场景
DeepSeek-V3.2	DeepSeek	¥2.0/M	¥0.5/M	¥3.0/M	旗舰通用模型，工具调用能力强，128K 上下文，构建 AI Agent 首选	企业服务	通用对话深度推理 Agent 首选
Qwen3-30B-A3B	通义千问	¥0.75/M	—	¥3.0/M	性价比最高，输入价格极低，性能强劲，30B 参数	云服务	企业级应用通用对话成本优化
GLM-5.1	智谱	＜32K：¥6.0/M	¥1.3-2/M	＜32K：¥24.0/M	Coding 能力对齐 Claude Opus 4.6，可独立工作 8 小时	开发者工具	生产级编程长程 Agent 复杂任务
Kimi K2.6 🆕	月之暗面	缓存未命中：¥6.5/M	¥1.6/M	¥27.0/M	4/20发布，编程挑战击败 Claude/GPT-5.5/Gemini，256K 上下文	消费级应用	编程之王长文本处理 Agent
DeepSeek-R1	DeepSeek	¥4.0/M	¥1.0/M	¥16.0/M	强推理模型，深度思考后回答，擅长复杂数学/逻辑/调试	企业服务	复杂推理数学计算逻辑分析
Qwen3.6-Plus	通义千问	≤256K: ¥2.0/M	¥0.4/M	≤256K: ¥12.0/M	千问Plus最新版，支持思考与非思考模式，1M上下文	云服务	通用对话推理 Agent
Qwen-Turbo	通义千问	¥0.3/M	¥0.06/M	非思考: ¥0.6/M	千问最便宜模型，支持思考与非思考模式，极低成本	开发者工具	高并发实时对话成本优化
GLM-4.7	智谱	＜32K: ¥2.0/M	¥0.4-0.8/M	＜32K: ¥8.0/M	高智能模型，编程更强更稳，工具调用能力强	企业服务	通用对话工具调用长文本
Step-3.5-Flash	阶跃星辰	缓存未命中：¥0.7/M	¥0.14/M	¥2.1/M	智能体优化，工具调用，高性价比	开发者工具	Agent 构建工具调用成本优化
MiniMax-M2.7	MiniMax	¥2.1/M	¥0.42/M	¥8.4/M	模型自我迭代，自行构建复杂 Agent Harness	消费级应用	角色扮演创意写作长文本
DeepSeek-r1-distill-qwen-32b	DeepSeek	¥4.0/M	—	¥16.0/M	推理蒸馏模型，32B 参数，平衡性能与成本	开发者工具	代码开发推理任务成本优化
Qwen3.6-27B 🆕	通义千问	¥0.75/M	—	¥3.0/M	4/21发布，27B 参数开源新模型，性能提升显著	云服务	通用对话企业应用开源部署
Qwen2.5-vl-7b	通义千问	≈¥0.8/M	—	≈¥2.0/M	视觉语言模型，多模态理解	开发者工具	视觉理解图文对话多模态
Qwen3-8b	通义千问	¥0.3/M	—	¥0.6/M	轻量级模型，极速响应	开发者工具	轻量任务高并发成本优化
DeepSeek-V4-Flash 🆕	DeepSeek	¥1.0/M	¥0.2/M	¥2.0/M	DeepSeek V4 Flash 版本，火山方舟接入，超低延迟+极致性价比	企业服务	高并发实时响应成本优化
Qwen3.6-35B-A3B 🆕	通义千问	¥1.8/M	—	¥10.8/M	Qwen3.6 开源系列旗舰小模型，支持思考与非思考模式，256K 上下文	开源/自部署	开源旗舰长上下文私有化

📋 各厂商官方定价对照表来自官方定价页

📌 数据来源（权威）

                        本节直接对照 8 家厂商官方定价页（阿里云百炼 / DeepSeek / 智谱 BigModel / 月之暗面 / MiniMax / 阶跃星辰 / 火山方舟 / 腾讯混元）；
                        每个表头都附「查看官方定价页 ↗」链接，价格单位统一为 元 / 百万 tokens；
                        缓存时间：2026-06-16T03:17:58.902978+00:00（24h 自动刷新，可手动 python3 scripts/fetch_official_prices.py --force）。
                        若发现某家显示「数据陈旧」，意味着上一轮抓取失败，请以官方页为准。
                    

阿里云百炼官方查看官方定价页 ↗

模型	分类	输入价 (元/M)	缓存命中 (元/M)	输出价 (元/M)	分档/备注
qwen3.7-max	旗舰	¥12	¥2.4	¥36	0
qwen3.6-max-preview	旗舰	¥9 / 15	¥1.8 / 3	¥54 / 90	≤128K / ≤256K
qwen3-max	旗舰	¥2.5 / 4 / 7	¥0.5 / 0.8 / 1.4	¥10 / 16 / 28	≤32K / ≤128K / ≤256K
qwen-max	旗舰	¥2.4	¥0.48	¥9.6	无阶梯
qwen3.7-plus	通用	¥2 / 6	¥0.4 / 1.2	¥8 / 24	≤256K / ≤1M
qwen3.6-plus	通用	≤256K: ¥2.0/M (同上)	¥0.4/M (同上)	¥12 / 48	≤256K / ≤1M
qwen-plus	通用	¥0.8 / 2.4 / 4.8	¥0.16 / 0.48 / 0.96	¥2 / 20 / 48	≤128K / ≤256K / ≤1M
qwen3.6-flash	高性价比	¥1.2 / 4.8	¥0.24 / 0.96	¥7.2 / 28.8	≤256K / ≤1M
qwen-flash	高性价比	¥0.15 / 0.6 / 1.2	¥0.03 / 0.12 / 0.24	¥1.5 / 6 / 12	≤128K / ≤256K / ≤1M
qwen-turbo	高性价比	¥0.3/M (同上)	¥0.06/M (同上)	¥0.6 / 3	非思考 / 思考
qwq-plus	推理	¥1.6	¥0.32	¥4	仅思考
qwen3-coder-plus	编程	¥4 / 6 / 10 / 20	¥0.8 / 1.2 / 2 / 4	¥16 / 24 / 40 / 200	≤32K / ≤128K / ≤256K / ≤1M
qwen3-coder-flash	编程	¥1 / 1.5 / 2.5 / 5	¥0.2 / 0.3 / 0.5 / 1	¥4 / 6 / 10 / 25	≤32K / ≤128K / ≤256K / ≤1M
qwen3-30b-a3b	开源	¥0.75/M (同上)	— (同上)	¥3	开源 30B
qwen3-8b	开源	¥0.3/M (同上)	— (同上)	¥0.6	开源 8B
qwen3-vl-plus	多模态	¥1 / 1.5 / 3	¥0.2 / 0.3 / 0.6	¥10 / 15 / 30	≤32K / ≤128K / ≤256K
qwen-vl-max	多模态	¥1.6	¥0.32	¥4	无阶梯
qwen3-vl-flash	多模态	¥0.15 / 0.3 / 0.6	¥0.03 / 0.06 / 0.12	¥1.5 / 3 / 6	≤32K / ≤128K / ≤256K

DeepSeek 官方查看官方定价页 ↗

模型	分类	输入价 (元/M)	缓存命中 (元/M)	输出价 (元/M)	分档/备注
deepseek-v4-pro	旗舰	¥12	¥1	¥24	1M 上下文 / 384K 输出 · 🆕 2026-04-24 发布·1.6T 总参/49B 激活·对标顶级闭源
deepseek-v4-flash	高性价比	¥1.0/M (同上)	¥0.2/M (同上)	¥2	1M 上下文 / 384K 输出 · 🆕 2026-04-24 发布·284B 总参/13B 激活·性价比之王
deepseek-chat	即将弃用	¥2	¥0.5	¥8	64K 上下文 · ⚠ 2026-07-24 弃用·自动路由到 V4-Flash 非思考模式
deepseek-reasoner	即将弃用	¥4	¥1	¥16	64K 上下文 + 32K 思维链 · ⚠ 2026-07-24 弃用·自动路由到 V4-Flash 思考模式

智谱 BigModel 官方查看官方定价页 ↗

模型	分类	输入价 (元/M)	缓存命中 (元/M)	输出价 (元/M)	分档/备注
GLM-5.1	旗舰	＜32K：¥6.0/M (同上)	¥1.3-2/M (同上)	¥24 / 28	<32K / ≥32K
GLM-5-Turbo	通用	¥5 / 7	¥1.2 / 1.8	¥22 / 26	<32K / ≥32K
GLM-5	通用	¥4 / 6	¥1 / 1.5	¥18 / 22	<32K / ≥32K
GLM-4.7	通用	＜32K: ¥2.0/M (同上)	¥0.4-0.8/M (同上)	¥8 / 14 / 16	阶梯计费
GLM-4.5-Air	高性价比	¥0.8 / 1.2	¥0.16 / 0.24	¥2 / 6 / 8	<32K / ≥32K
GLM-4.7-FlashX	高性价比	¥0.5	¥0.1	¥3	200K
GLM-4.7-Flash	免费	¥0	¥0	¥0	200K · 完全免费
GLM-4-Plus	通用	¥5	官方未公布	¥5	128K
GLM-4-Long	长文本	¥1	官方未公布	¥1	1M

月之暗面 Kimi 官方查看官方定价页 ↗

模型	分类	输入价 (元/M)	缓存命中 (元/M)	输出价 (元/M)	分档/备注
Kimi K2.7 Code	编程	¥1.5 / 6	¥1.5	¥30	缓存命中 / 未命中 · 限时促销 50% off
Kimi K2.6	通用	缓存未命中：¥6.5/M (同上)	¥1.6/M (同上)	¥27	缓存命中 / 未命中 · 256K 上下文
Kimi K2.5	通用	¥0.7 / 4	¥0.7	¥21	缓存命中 / 未命中 · 128K 上下文
Moonshot V1-32K	历史	¥24	官方未公布	¥24	32K 上下文

MiniMax 官方查看官方定价页 ↗

模型	分类	输入价 (元/M)	缓存命中 (元/M)	输出价 (元/M)	分档/备注
MiniMax-M3	旗舰	¥2.10 / 4.20	¥0.42 / 0.84	¥8.40 / 16.80	≤512K / >512K · 永久 5 折
MiniMax-M2.7	通用	¥2.1/M (同上)	¥0.42/M (同上)	¥8.4	缓存命中 0.42
MiniMax-M2.7-highspeed	高速	¥4.2	¥0.42	¥16.8	高速
MiniMax-M2.5	历史	¥2.1	¥0.21	¥8.4	历史模型
MiniMax-M2.1	历史	¥2.1	¥0.21	¥8.4	历史模型
MiniMax-M2	历史	¥2.1	¥0.21	¥8.4	历史模型

阶跃星辰 StepFun 官方查看官方定价页 ↗

模型	分类	输入价 (元/M)	缓存命中 (元/M)	输出价 (元/M)	分档/备注
step-3.7-flash	旗舰	¥0.27 / 1.35	¥0.27	¥8.1	缓存命中 / 未命中 · 多模态推理
step-3.5-flash	通用	缓存未命中：¥0.7/M (同上)	¥0.14/M (同上)	¥2.1	缓存命中 / 未命中 · 推理大模型
step-1o-turbo-vision	多模态	¥0.5 / 2.5	¥0.5	¥8	缓存命中 / 未命中 · 视觉
stepaudio-2.5-realtime	语音	¥2 / 10	¥2	¥70	缓存命中 / 未命中 · 实时语音

火山方舟（豆包）官方查看官方定价页 ↗

模型	分类	输入价 (元/M)	缓存命中 (元/M)	输出价 (元/M)	分档/备注
doubao-seed-2.0-pro	旗舰	¥3.2 / 4.8 / 9.6	¥0.64 / 0.96 / 1.92	¥16 / 24 / 48	≤32K / ≤128K / ≤256K
doubao-seed-2.0-lite	高性价比	¥0.6 / 0.9 / 1.8	¥0.12 / 0.18 / 0.36	¥3.6 / 5.4 / 10.8	≤32K / ≤128K / ≤256K
doubao-seed-2.0-mini	小模型	¥0.2 / 0.4 / 0.8	¥0.04 / 0.08 / 0.16	¥2 / 4 / 8	≤32K / ≤128K / ≤256K
doubao-seed-2.0-code	编程	¥3.2 / 4.8 / 9.6	¥0.64 / 0.96 / 1.92	¥16 / 24 / 48	≤32K / ≤128K / ≤256K
doubao-seed-1.6	通用	¥0.8 / 1.2 / 2.4	¥0.16	¥2 / 8 / 16 / 24	阶梯计费
doubao-seed-1.6-flash	高性价比	¥0.15 / 0.3 / 0.6	¥0.03	¥1.5 / 3 / 6	≤32K / ≤128K / ≤256K
glm-4.7	第三方	＜32K: ¥2.0/M (同上)	¥0.4-0.8/M (同上)	¥8 / 14 / 16	通过火山方舟接入
deepseek-v4-pro	第三方	¥12	¥1	¥24	通过火山方舟接入
deepseek-v4-flash	第三方	¥1.0/M (同上)	¥0.2/M (同上)	¥2	通过火山方舟接入
deepseek-v3.2	第三方	¥2.0/M (同上)	¥0.5/M (同上)	¥3 / 6	≤32K / ≤128K
deepseek-r1	第三方	¥4.0/M (同上)	¥1.0/M (同上)	¥16	通过火山方舟接入

腾讯混元官方查看官方定价页 ↗

模型	分类	输入价 (元/M)	缓存命中 (元/M)	输出价 (元/M)	分档/备注
Tencent HY 2.0 Think	旗舰	¥3.975 / 5.3	官方未公布	¥15.9 / 21.2	≤32K / ≤128K
Tencent HY 2.0 Instruct	通用	¥3.18 / 4.505	官方未公布	¥7.95 / 11.13	≤32K / ≤128K
Hunyuan-T1	推理	¥1	官方未公布	¥4	无阶梯
Hunyuan-TurboS	高性价比	¥0.8	官方未公布	¥2	无阶梯
Hunyuan-a13b	高性价比	¥0.5	官方未公布	¥2	无阶梯
Hunyuan-large-role	角色	¥2.4	官方未公布	¥9.6	角色扮演
Hunyuan-translation	翻译	¥1.2	官方未公布	¥3.6	翻译
HY Vision 1.5	多模态	¥3	官方未公布	¥9	视觉

📋 各厂商官方定价对照表来自官方定价页

📌 数据来源（权威）

                        本节直接对照 8 家厂商官方定价页（阿里云百炼 / DeepSeek / 智谱 BigModel / 月之暗面 / MiniMax / 阶跃星辰 / 火山方舟 / 腾讯混元）；
                        每个表头都附「查看官方定价页 ↗」链接，价格单位统一为 元 / 百万 tokens；
                        缓存时间：2026-06-16T03:17:58.902978+00:00（24h 自动刷新，可手动 python3 scripts/fetch_official_prices.py --force）。
                        若发现某家显示「数据陈旧」，意味着上一轮抓取失败，请以官方页为准。
                    

阿里云百炼官方查看官方定价页 ↗

模型	分类	输入价 (元/M)	缓存命中 (元/M)	输出价 (元/M)	分档/备注
qwen3.7-max	旗舰	¥12	¥2.4	¥36	0
qwen3.6-max-preview	旗舰	¥9 / 15	¥1.8 / 3	¥54 / 90	≤128K / ≤256K
qwen3-max	旗舰	¥2.5 / 4 / 7	¥0.5 / 0.8 / 1.4	¥10 / 16 / 28	≤32K / ≤128K / ≤256K
qwen-max	旗舰	¥2.4	¥0.48	¥9.6	无阶梯
qwen3.7-plus	通用	¥2 / 6	¥0.4 / 1.2	¥8 / 24	≤256K / ≤1M
qwen3.6-plus	通用	≤256K: ¥2.0/M (同上)	¥0.4/M (同上)	¥12 / 48	≤256K / ≤1M
qwen-plus	通用	¥0.8 / 2.4 / 4.8	¥0.16 / 0.48 / 0.96	¥2 / 20 / 48	≤128K / ≤256K / ≤1M
qwen3.6-flash	高性价比	¥1.2 / 4.8	¥0.24 / 0.96	¥7.2 / 28.8	≤256K / ≤1M
qwen-flash	高性价比	¥0.15 / 0.6 / 1.2	¥0.03 / 0.12 / 0.24	¥1.5 / 6 / 12	≤128K / ≤256K / ≤1M
qwen-turbo	高性价比	¥0.3/M (同上)	¥0.06/M (同上)	¥0.6 / 3	非思考 / 思考
qwq-plus	推理	¥1.6	¥0.32	¥4	仅思考
qwen3-coder-plus	编程	¥4 / 6 / 10 / 20	¥0.8 / 1.2 / 2 / 4	¥16 / 24 / 40 / 200	≤32K / ≤128K / ≤256K / ≤1M
qwen3-coder-flash	编程	¥1 / 1.5 / 2.5 / 5	¥0.2 / 0.3 / 0.5 / 1	¥4 / 6 / 10 / 25	≤32K / ≤128K / ≤256K / ≤1M
qwen3-30b-a3b	开源	¥0.75/M (同上)	— (同上)	¥3	开源 30B
qwen3-8b	开源	¥0.3/M (同上)	— (同上)	¥0.6	开源 8B
qwen3-vl-plus	多模态	¥1 / 1.5 / 3	¥0.2 / 0.3 / 0.6	¥10 / 15 / 30	≤32K / ≤128K / ≤256K
qwen-vl-max	多模态	¥1.6	¥0.32	¥4	无阶梯
qwen3-vl-flash	多模态	¥0.15 / 0.3 / 0.6	¥0.03 / 0.06 / 0.12	¥1.5 / 3 / 6	≤32K / ≤128K / ≤256K

DeepSeek 官方查看官方定价页 ↗

模型	分类	输入价 (元/M)	缓存命中 (元/M)	输出价 (元/M)	分档/备注
deepseek-v4-pro	旗舰	¥12	¥1	¥24	1M 上下文 / 384K 输出 · 🆕 2026-04-24 发布·1.6T 总参/49B 激活·对标顶级闭源
deepseek-v4-flash	高性价比	¥1.0/M (同上)	¥0.2/M (同上)	¥2	1M 上下文 / 384K 输出 · 🆕 2026-04-24 发布·284B 总参/13B 激活·性价比之王
deepseek-chat	即将弃用	¥2	¥0.5	¥8	64K 上下文 · ⚠ 2026-07-24 弃用·自动路由到 V4-Flash 非思考模式
deepseek-reasoner	即将弃用	¥4	¥1	¥16	64K 上下文 + 32K 思维链 · ⚠ 2026-07-24 弃用·自动路由到 V4-Flash 思考模式

智谱 BigModel 官方查看官方定价页 ↗

模型	分类	输入价 (元/M)	缓存命中 (元/M)	输出价 (元/M)	分档/备注
GLM-5.1	旗舰	＜32K：¥6.0/M (同上)	¥1.3-2/M (同上)	¥24 / 28	<32K / ≥32K
GLM-5-Turbo	通用	¥5 / 7	¥1.2 / 1.8	¥22 / 26	<32K / ≥32K
GLM-5	通用	¥4 / 6	¥1 / 1.5	¥18 / 22	<32K / ≥32K
GLM-4.7	通用	＜32K: ¥2.0/M (同上)	¥0.4-0.8/M (同上)	¥8 / 14 / 16	阶梯计费
GLM-4.5-Air	高性价比	¥0.8 / 1.2	¥0.16 / 0.24	¥2 / 6 / 8	<32K / ≥32K
GLM-4.7-FlashX	高性价比	¥0.5	¥0.1	¥3	200K
GLM-4.7-Flash	免费	¥0	¥0	¥0	200K · 完全免费
GLM-4-Plus	通用	¥5	官方未公布	¥5	128K
GLM-4-Long	长文本	¥1	官方未公布	¥1	1M

月之暗面 Kimi 官方查看官方定价页 ↗

模型	分类	输入价 (元/M)	缓存命中 (元/M)	输出价 (元/M)	分档/备注
Kimi K2.7 Code	编程	¥1.5 / 6	¥1.5	¥30	缓存命中 / 未命中 · 限时促销 50% off
Kimi K2.6	通用	缓存未命中：¥6.5/M (同上)	¥1.6/M (同上)	¥27	缓存命中 / 未命中 · 256K 上下文
Kimi K2.5	通用	¥0.7 / 4	¥0.7	¥21	缓存命中 / 未命中 · 128K 上下文
Moonshot V1-32K	历史	¥24	官方未公布	¥24	32K 上下文

MiniMax 官方查看官方定价页 ↗

模型	分类	输入价 (元/M)	缓存命中 (元/M)	输出价 (元/M)	分档/备注
MiniMax-M3	旗舰	¥2.10 / 4.20	¥0.42 / 0.84	¥8.40 / 16.80	≤512K / >512K · 永久 5 折
MiniMax-M2.7	通用	¥2.1/M (同上)	¥0.42/M (同上)	¥8.4	缓存命中 0.42
MiniMax-M2.7-highspeed	高速	¥4.2	¥0.42	¥16.8	高速
MiniMax-M2.5	历史	¥2.1	¥0.21	¥8.4	历史模型
MiniMax-M2.1	历史	¥2.1	¥0.21	¥8.4	历史模型
MiniMax-M2	历史	¥2.1	¥0.21	¥8.4	历史模型

阶跃星辰 StepFun 官方查看官方定价页 ↗

模型	分类	输入价 (元/M)	缓存命中 (元/M)	输出价 (元/M)	分档/备注
step-3.7-flash	旗舰	¥0.27 / 1.35	¥0.27	¥8.1	缓存命中 / 未命中 · 多模态推理
step-3.5-flash	通用	缓存未命中：¥0.7/M (同上)	¥0.14/M (同上)	¥2.1	缓存命中 / 未命中 · 推理大模型
step-1o-turbo-vision	多模态	¥0.5 / 2.5	¥0.5	¥8	缓存命中 / 未命中 · 视觉
stepaudio-2.5-realtime	语音	¥2 / 10	¥2	¥70	缓存命中 / 未命中 · 实时语音

火山方舟（豆包）官方查看官方定价页 ↗

模型	分类	输入价 (元/M)	缓存命中 (元/M)	输出价 (元/M)	分档/备注
doubao-seed-2.0-pro	旗舰	¥3.2 / 4.8 / 9.6	¥0.64 / 0.96 / 1.92	¥16 / 24 / 48	≤32K / ≤128K / ≤256K
doubao-seed-2.0-lite	高性价比	¥0.6 / 0.9 / 1.8	¥0.12 / 0.18 / 0.36	¥3.6 / 5.4 / 10.8	≤32K / ≤128K / ≤256K
doubao-seed-2.0-mini	小模型	¥0.2 / 0.4 / 0.8	¥0.04 / 0.08 / 0.16	¥2 / 4 / 8	≤32K / ≤128K / ≤256K
doubao-seed-2.0-code	编程	¥3.2 / 4.8 / 9.6	¥0.64 / 0.96 / 1.92	¥16 / 24 / 48	≤32K / ≤128K / ≤256K
doubao-seed-1.6	通用	¥0.8 / 1.2 / 2.4	¥0.16	¥2 / 8 / 16 / 24	阶梯计费
doubao-seed-1.6-flash	高性价比	¥0.15 / 0.3 / 0.6	¥0.03	¥1.5 / 3 / 6	≤32K / ≤128K / ≤256K
glm-4.7	第三方	＜32K: ¥2.0/M (同上)	¥0.4-0.8/M (同上)	¥8 / 14 / 16	通过火山方舟接入
deepseek-v4-pro	第三方	¥12	¥1	¥24	通过火山方舟接入
deepseek-v4-flash	第三方	¥1.0/M (同上)	¥0.2/M (同上)	¥2	通过火山方舟接入
deepseek-v3.2	第三方	¥2.0/M (同上)	¥0.5/M (同上)	¥3 / 6	≤32K / ≤128K
deepseek-r1	第三方	¥4.0/M (同上)	¥1.0/M (同上)	¥16	通过火山方舟接入

腾讯混元官方查看官方定价页 ↗

模型	分类	输入价 (元/M)	缓存命中 (元/M)	输出价 (元/M)	分档/备注
Tencent HY 2.0 Think	旗舰	¥3.975 / 5.3	官方未公布	¥15.9 / 21.2	≤32K / ≤128K
Tencent HY 2.0 Instruct	通用	¥3.18 / 4.505	官方未公布	¥7.95 / 11.13	≤32K / ≤128K
Hunyuan-T1	推理	¥1	官方未公布	¥4	无阶梯
Hunyuan-TurboS	高性价比	¥0.8	官方未公布	¥2	无阶梯
Hunyuan-a13b	高性价比	¥0.5	官方未公布	¥2	无阶梯
Hunyuan-large-role	角色	¥2.4	官方未公布	¥9.6	角色扮演
Hunyuan-translation	翻译	¥1.2	官方未公布	¥3.6	翻译
HY Vision 1.5	多模态	¥3	官方未公布	¥9	视觉

📋 各厂商官方定价对照表来自官方定价页

📌 数据来源（权威）

                        本节直接对照 8 家厂商官方定价页（阿里云百炼 / DeepSeek / 智谱 BigModel / 月之暗面 / MiniMax / 阶跃星辰 / 火山方舟 / 腾讯混元）；
                        每个表头都附「查看官方定价页 ↗」链接，价格单位统一为 元 / 百万 tokens；
                        缓存时间：2026-06-16T03:17:58.902978+00:00（24h 自动刷新，可手动 python3 scripts/fetch_official_prices.py --force）。
                        若发现某家显示「数据陈旧」，意味着上一轮抓取失败，请以官方页为准。
                    

阿里云百炼官方查看官方定价页 ↗

模型	分类	输入价 (元/M)	缓存命中 (元/M)	输出价 (元/M)	分档/备注
qwen3.7-max	旗舰	¥12	¥2.4	¥36	0
qwen3.6-max-preview	旗舰	¥9 / 15	¥1.8 / 3	¥54 / 90	≤128K / ≤256K
qwen3-max	旗舰	¥2.5 / 4 / 7	¥0.5 / 0.8 / 1.4	¥10 / 16 / 28	≤32K / ≤128K / ≤256K
qwen-max	旗舰	¥2.4	¥0.48	¥9.6	无阶梯
qwen3.7-plus	通用	¥2 / 6	¥0.4 / 1.2	¥8 / 24	≤256K / ≤1M
qwen3.6-plus	通用	¥2 / 8	¥0.4 / 1.6	¥12 / 48	≤256K / ≤1M
qwen-plus	通用	¥0.8 / 2.4 / 4.8	¥0.16 / 0.48 / 0.96	¥2 / 20 / 48	≤128K / ≤256K / ≤1M
qwen3.6-flash	高性价比	¥1.2 / 4.8	¥0.24 / 0.96	¥7.2 / 28.8	≤256K / ≤1M
qwen-flash	高性价比	¥0.15 / 0.6 / 1.2	¥0.03 / 0.12 / 0.24	¥1.5 / 6 / 12	≤128K / ≤256K / ≤1M
qwen-turbo	高性价比	¥0.3	¥0.06	¥0.6 / 3	非思考 / 思考
qwq-plus	推理	¥1.6	¥0.32	¥4	仅思考
qwen3-coder-plus	编程	¥4 / 6 / 10 / 20	¥0.8 / 1.2 / 2 / 4	¥16 / 24 / 40 / 200	≤32K / ≤128K / ≤256K / ≤1M
qwen3-coder-flash	编程	¥1 / 1.5 / 2.5 / 5	¥0.2 / 0.3 / 0.5 / 1	¥4 / 6 / 10 / 25	≤32K / ≤128K / ≤256K / ≤1M
qwen3-30b-a3b	开源	¥0.75	¥0.15	¥3	开源 30B
qwen3-8b	开源	¥0.3	¥0.06	¥0.6	开源 8B
qwen3-vl-plus	多模态	¥1 / 1.5 / 3	¥0.2 / 0.3 / 0.6	¥10 / 15 / 30	≤32K / ≤128K / ≤256K
qwen-vl-max	多模态	¥1.6	¥0.32	¥4	无阶梯
qwen3-vl-flash	多模态	¥0.15 / 0.3 / 0.6	¥0.03 / 0.06 / 0.12	¥1.5 / 3 / 6	≤32K / ≤128K / ≤256K

DeepSeek 官方查看官方定价页 ↗

模型	分类	输入价 (元/M)	缓存命中 (元/M)	输出价 (元/M)	分档/备注
deepseek-v4-pro	旗舰	¥12	¥1	¥24	1M 上下文 / 384K 输出 · 🆕 2026-04-24 发布·1.6T 总参/49B 激活·对标顶级闭源
deepseek-v4-flash	高性价比	¥1	¥0.2	¥2	1M 上下文 / 384K 输出 · 🆕 2026-04-24 发布·284B 总参/13B 激活·性价比之王
deepseek-chat	即将弃用	¥2	¥0.5	¥8	64K 上下文 · ⚠ 2026-07-24 弃用·自动路由到 V4-Flash 非思考模式
deepseek-reasoner	即将弃用	¥4	¥1	¥16	64K 上下文 + 32K 思维链 · ⚠ 2026-07-24 弃用·自动路由到 V4-Flash 思考模式

智谱 BigModel 官方查看官方定价页 ↗

模型	分类	输入价 (元/M)	缓存命中 (元/M)	输出价 (元/M)	分档/备注
GLM-5.1	旗舰	¥6 / 8	¥1.3 / 2	¥24 / 28	<32K / ≥32K
GLM-5-Turbo	通用	¥5 / 7	¥1.2 / 1.8	¥22 / 26	<32K / ≥32K
GLM-5	通用	¥4 / 6	¥1 / 1.5	¥18 / 22	<32K / ≥32K
GLM-4.7	通用	¥2 / 3 / 4	¥0.4 / 0.6 / 0.8	¥8 / 14 / 16	阶梯计费
GLM-4.5-Air	高性价比	¥0.8 / 1.2	¥0.16 / 0.24	¥2 / 6 / 8	<32K / ≥32K
GLM-4.7-FlashX	高性价比	¥0.5	¥0.1	¥3	200K
GLM-4.7-Flash	免费	¥0	¥0	¥0	200K · 完全免费
GLM-4-Plus	通用	¥5	官方未公布	¥5	128K
GLM-4-Long	长文本	¥1	官方未公布	¥1	1M

月之暗面 Kimi 官方查看官方定价页 ↗

模型	分类	输入价 (元/M)	缓存命中 (元/M)	输出价 (元/M)	分档/备注
Kimi K2.7 Code	编程	¥1.5 / 6	¥1.5	¥30	缓存命中 / 未命中 · 限时促销 50% off
Kimi K2.6	通用	¥1.6 / 6.5	¥1.6	¥27	缓存命中 / 未命中 · 256K 上下文
Kimi K2.5	通用	¥0.7 / 4	¥0.7	¥21	缓存命中 / 未命中 · 128K 上下文
Moonshot V1-32K	历史	¥24	官方未公布	¥24	32K 上下文

MiniMax 官方查看官方定价页 ↗

模型	分类	输入价 (元/M)	缓存命中 (元/M)	输出价 (元/M)	分档/备注
MiniMax-M3	旗舰	¥2.10 / 4.20	¥0.42 / 0.84	¥8.40 / 16.80	≤512K / >512K · 永久 5 折
MiniMax-M2.7	通用	¥2.1	¥0.42	¥8.4	缓存命中 0.42
MiniMax-M2.7-highspeed	高速	¥4.2	¥0.42	¥16.8	高速
MiniMax-M2.5	历史	¥2.1	¥0.21	¥8.4	历史模型
MiniMax-M2.1	历史	¥2.1	¥0.21	¥8.4	历史模型
MiniMax-M2	历史	¥2.1	¥0.21	¥8.4	历史模型

阶跃星辰 StepFun 官方查看官方定价页 ↗

模型	分类	输入价 (元/M)	缓存命中 (元/M)	输出价 (元/M)	分档/备注
step-3.7-flash	旗舰	¥0.27 / 1.35	¥0.27	¥8.1	缓存命中 / 未命中 · 多模态推理
step-3.5-flash	通用	¥0.14 / 0.7	¥0.14	¥2.1	缓存命中 / 未命中 · 推理大模型
step-1o-turbo-vision	多模态	¥0.5 / 2.5	¥0.5	¥8	缓存命中 / 未命中 · 视觉
stepaudio-2.5-realtime	语音	¥2 / 10	¥2	¥70	缓存命中 / 未命中 · 实时语音

火山方舟（豆包）官方查看官方定价页 ↗

模型	分类	输入价 (元/M)	缓存命中 (元/M)	输出价 (元/M)	分档/备注
doubao-seed-2.0-pro	旗舰	¥3.2 / 4.8 / 9.6	¥0.64 / 0.96 / 1.92	¥16 / 24 / 48	≤32K / ≤128K / ≤256K
doubao-seed-2.0-lite	高性价比	¥0.6 / 0.9 / 1.8	¥0.12 / 0.18 / 0.36	¥3.6 / 5.4 / 10.8	≤32K / ≤128K / ≤256K
doubao-seed-2.0-mini	小模型	¥0.2 / 0.4 / 0.8	¥0.04 / 0.08 / 0.16	¥2 / 4 / 8	≤32K / ≤128K / ≤256K
doubao-seed-2.0-code	编程	¥3.2 / 4.8 / 9.6	¥0.64 / 0.96 / 1.92	¥16 / 24 / 48	≤32K / ≤128K / ≤256K
doubao-seed-1.6	通用	¥0.8 / 1.2 / 2.4	¥0.16	¥2 / 8 / 16 / 24	阶梯计费
doubao-seed-1.6-flash	高性价比	¥0.15 / 0.3 / 0.6	¥0.03	¥1.5 / 3 / 6	≤32K / ≤128K / ≤256K
glm-4.7	第三方	¥2 / 3 / 4	¥0.4 / 0.6 / 0.8	¥8 / 14 / 16	通过火山方舟接入
deepseek-v4-pro	第三方	¥12	¥1	¥24	通过火山方舟接入
deepseek-v4-flash	第三方	¥1	¥0.2	¥2	通过火山方舟接入
deepseek-v3.2	第三方	¥2 / 4	¥0.4	¥3 / 6	≤32K / ≤128K
deepseek-r1	第三方	¥4	¥0.8	¥16	通过火山方舟接入

腾讯混元官方查看官方定价页 ↗

模型	分类	输入价 (元/M)	缓存命中 (元/M)	输出价 (元/M)	分档/备注
Tencent HY 2.0 Think	旗舰	¥3.975 / 5.3	官方未公布	¥15.9 / 21.2	≤32K / ≤128K
Tencent HY 2.0 Instruct	通用	¥3.18 / 4.505	官方未公布	¥7.95 / 11.13	≤32K / ≤128K
Hunyuan-T1	推理	¥1	官方未公布	¥4	无阶梯
Hunyuan-TurboS	高性价比	¥0.8	官方未公布	¥2	无阶梯
Hunyuan-a13b	高性价比	¥0.5	官方未公布	¥2	无阶梯
Hunyuan-large-role	角色	¥2.4	官方未公布	¥9.6	角色扮演
Hunyuan-translation	翻译	¥1.2	官方未公布	¥3.6	翻译
HY Vision 1.5	多模态	¥3	官方未公布	¥9	视觉

🎯 市场主流常用模型按应用场景分类

📅 第二部分场景分类参考数据截至 2026-06-22（按应用场景的代表模型概览，权威实时价格请见 📋 各厂商官方定价对照表）

💻 编程开发类

模型	厂商	输入价格	输出价格	核心特点
GLM-5.1	智谱	＜32K：¥6.0/M (同上)	¥1.3-2/M (同上)	【最新旗舰】Coding能力对齐Claude Opus 4.6；长程任务显著提升，可自主工作长达8小时
GLM-5V-Turbo	智谱	＜32K：¥5 ≥32K：¥7	＜32K：¥22 ≥32K：¥26	【多模态 Coding 基座】兼顾视觉理解与 Coding 能力；复杂视觉推理更准确
GLM-5	智谱	¥4 / 6 (同上)	¥1 / 1.5 (同上)	【高智能基座】编程能力对齐Claude Opus 4.5；擅长Agentic长程规划与执行
GLM-4.7	智谱	＜32K: ¥2.0/M (同上)	¥0.4-0.8/M (同上)	【高智能模型】通用对话、推理与智能体能力全面升级；编程更强、更稳
GLM-4.6V	智谱	＜32K：¥1 ＜128K：¥2	＜32K：¥3 ＜128K：¥6	【视觉推理】视觉推理能力；原生支持工具调用；长上下文
MiniMax-M2.5	MiniMax	¥2.1	¥0.21 (同上)	顶尖性能与极致性价比，轻松驾驭复杂任务
MiniMax-M2.1	MiniMax	¥2.1	¥0.21 (同上)	强大多语言编程能力，全面升级代码工程体验
kimi-k2.5	月之暗面	缓存未命中：¥4 缓存命中：¥0.7	¥21	Kimi K2.5 在 Agent、代码、视觉理解及一系列通用智能任务上取得开源 SoTA 表现
step-3.5-flash	阶跃星辰	缓存未命中：¥0.7/M (同上)	¥0.14/M (同上)	旗舰级推理模型，专为智能体构建而生，更擅长复杂项目规划与长程任务执行
deepseek-v3.1	DeepSeek	¥4	¥12	DeepSeek 的旗舰级通用模型。主打低延迟与极致性价比，响应速度极快
qwen3.6-max-preview	通义千问	¥9 / 15 (同上)	¥1.8 / 3 (同上)	在智能体编程、世界知识和指令遵循三大维度显著提升；适合复杂任务
qwen3-coder-plus	通义千问	¥4 / 6 / 10 / 20 (同上)	¥0.8 / 1.2 / 2 / 4 (同上)	千问Coder旗舰；支持上下文缓存
doubao-seed-2.0-code	豆包	¥3.2 / 4.8 / 9.6 (同上)	¥0.64 / 0.96 / 1.92 (同上)	Seed 2.0编程专用模型；支持视觉理解

🤖 Agent 智能体类

模型	厂商	输入价格	输出价格	核心特点
GLM-5-Turbo	智谱	¥5 / 7 (同上)	¥1.2 / 1.8 (同上)	【龙虾增强基座】龙虾任务核心需求专项优化；复杂长任务执行连续性好
DeepSeek-V3.2	DeepSeek	¥2.0/M (同上)	¥0.5/M (同上)	DeepSeek 旗舰通用模型在 V3.1 基础上强化了工具调用能力，是构建 AI Agent 的首选；128K上下文
qwen3.5-397b-a17b	通义千问	≤128K：¥1.2 ≤256K：¥3	≤128K：¥7.2 ≤256K：¥18	原生支持文本+图像+视频输入；性能更优且成本更低
qwen3.6-plus	通义千问	≤256K: ¥2.0/M (同上)	¥0.4/M (同上)	千问Plus最新版；支持思考与非思考模式
doubao-seed-2.0-pro	豆包	¥3.2 / 4.8 / 9.6 (同上)	¥0.64 / 0.96 / 1.92 (同上)	侧重长链路推理能力与复杂任务稳定性，适配真实业务中的复杂场景
doubao-seed-1.8	豆包	分段计费：¥0.8-2.4	分段计费：¥2-24	面向多模态Agent场景优化；输出价格按输出长度分档

🧠 复杂推理类

模型	厂商	输入价格	输出价格	核心特点
step-1o-turbo-vision	阶跃星辰	¥0.5 / 2.5 (同上)	¥0.5 (同上)	适合处理高难度的视觉决策任务
deepseek-r1	DeepSeek	¥4.0/M (同上)	¥1.0/M (同上)	DeepSeek 的强推理模型，回答前先进行深度思考，擅长解决普通模型无法处理的烧脑难题
qwen3.6-35b-a3b	通义千问	¥1.8/M (同上)	— (同上)	Qwen3.6开源系列小模型；支持思考与非思考模式；256K上下文
qwen3-max	通义千问	¥2.5 / 4 / 7 (同上)	¥0.5 / 0.8 / 1.4 (同上)	千问旗舰模型；支持思考与非思考模式
qwen3.6-flash	通义千问	¥1.2 / 4.8 (同上)	¥0.24 / 0.96 (同上)	千问Flash最新版；支持思考与非思考模式
qwen-turbo	通义千问	¥0.3/M (同上)	¥0.06/M (同上)	千问最便宜的模型；支持思考与非思考模式
qwq-plus	通义千问	¥1.6	¥0.32 (同上)	千问推理专用模型；仅思考模式
doubao-seed-1.6	豆包	¥0.8 / 1.2 / 2.4 (同上)	¥0.16 (同上)	上一代旗舰
Tencent HY 2.0 Think	混元	¥3.975 / 5.3 (同上)	官方未公布 (同上)	混元最新旗舰思考模型
Tencent HY 2.0 Instruct	混元	¥3.18 / 4.505 (同上)	官方未公布 (同上)	混元最新旗舰非思考模型
Hunyuan-T1	混元	¥1	官方未公布 (同上)	混元推理模型

💬 通用对话类

模型	厂商	输入价格	输出价格	核心特点
MiniMax-M2.7-highspeed	MiniMax	¥4.2	¥0.42 (同上)	与M2.7效果不变，速度大幅提升
Hunyuan-TurboS	混元	¥0.8	官方未公布 (同上)	混元主力性价比模型

🎭 角色扮演类

模型	厂商	输入价格	输出价格	核心特点
M2-Her	MiniMax	¥2.1	¥8.4	文本对话模型，专为角色扮演、多轮对话等场景设计

🆕 近期新增发布模型近7天 · 4个新模型

📌 数据来源说明

                        本节不使用飞书云文档，改为按运行时间向前 7 天检索。统计周期：2026-06-14 至 2026-06-21；数据源：OpenRouter Models API 实时拉取。
                        价格单位为 OpenRouter API 返回值换算后的 美元 / 百万 tokens；动态路由模型的价格显示为“动态路由”。
                    

模型名称	厂商	发布日期	输入/输出价格	核心亮点
Google: Nano Banana 2 (Gemini 3.1 Flash Image) ↗ google/gemini-3.1-flash-image	Google	2026-06-18	$0.5/$3 131K ctx · text+image → text+image	Gemini 3.1 Flash Image, a.k.a. "Nano Banana 2," is Google’s latest state of the art image generation and editing model, delivering Pro-level visual quality at Flash speed. It combines advanced...
Google: Nano Banana Pro (Gemini 3 Pro Image) ↗ google/gemini-3-pro-image	Google	2026-06-18	$2/$12 66K ctx · text+image → text+image	Nano Banana Pro is Google’s most advanced image-generation and editing model, built on Gemini 3 Pro. It extends the original Nano Banana with significantly improved multimodal reasoning, real-world grounding, and...
Cohere: North Mini Code (free) ↗ cohere/north-mini-code:free	Cohere	2026-06-17	$0/$0 256K ctx · text → text	North Mini Code is Cohere's first agentic coding model and the debut of its North family. A sparse mixture-of-experts model with 30B total parameters and 3B active, it is optimized...
Z.ai: GLM 5.2 ↗ z-ai/glm-5.2	Z.ai	2026-06-16	$1.2/$4.1 1.04858M ctx · text → text	GLM 5.2 is a large-scale reasoning model from Z.ai. It supports text input and output with a 1M-token context window, and is suited for long-horizon agent workflows, project-level software engineering,...

🌍 OpenRouter 热门模型按周调用量排名 Top 10

📈 数据来源与口径

                        数据来源：OpenRouter 排行页 https://openrouter.ai/rankings 的 Top Models / Weekly usage of models across OpenRouter 当前可见榜单；结合同页 Jina 镜像与 OpenRouter 排行接口交叉校验，提取时间：2026-06-22 00:12 CST。按页面展示的调用量 Top 10 填写，不展示价格列。

排名	模型名称	厂商	地区	周调用量	周变化	核心特点
🥇	DeepSeek V4 Flash	DeepSeek	中国	4.89T tokens/周	+8%	当前页面榜单第 1，主打高吞吐与高性价比通用推理。
🥈	MiniMax M3	MiniMax	中国	3.96T tokens/周	+4%	页面榜单第 2，多模态基础能力强，调用量保持高位。
🥉	MiMo-V2.5	Xiaomi	中国	3.84T tokens/周	+12%	小米系热门模型，本周仍在前三，增长明显。
4	Hy3 preview	Tencent	中国	3.53T tokens/周	+17%	腾讯系预览模型，当前页面榜单第 4，热度继续上行。
5	Claude Opus 4.7	Anthropic	国际	2.71T tokens/周	+23%	国际高端推理代表，复杂任务场景热度高。
6	DeepSeek V4 Pro	DeepSeek	中国	2.55T tokens/周	+28%	DeepSeek 高阶版本，在通用与 Agent 工作流中表现活跃。
7	Owl Alpha	OpenRouter	国际	2.47T tokens/周	+2%	OpenRouter 自有热门模型，当前稳定位于前十。
8	Claude Opus 4.8	Anthropic	国际	1.57T tokens/周	+19%	当前页面榜单第 8，仍维持高端推理模型热度。
9	Claude Sonnet 4.6	Anthropic	国际	1.55T tokens/周	+30%	高频生产级模型，编程与通用任务使用面广。
10	GLM 5.2	智谱	中国	1.07T tokens/周	new	当前页面榜单第 10，最新进入 Top 10 的智谱模型。

☁️ 云厂商动态最近一周 · 官方源

📌 检索口径

检索时间：2026-06-22 00:00 CST；统计周期：2026-06-15 至 2026-06-22。
数据源仅使用你之前指定的官方地址体系：阿里云公告中心 · 腾讯云公告中心 · 腾讯云 TokenHub 产品动态 · 华为云公告中心。本部分只保留最近一周内直接影响 AI / Agent / 模型平台的动态；若某厂商本周无直接相关新公告，会明确标注“本周无新增”。

🔥 本周观察：腾讯云模型编排变化最密集，阿里云百炼侧重网关/计费调整，华为云公告口径本周偏静默

腾讯云：TokenHub 在 6/16–6/18 连续出现模型供给变化，核心是 GLM-5.2 上线 与 DeepSeek-V3.2 下线迁移。
阿里云：百炼在最近一周可核实动态集中在 网关升级、商品名称调整 与 记忆/知识存储开始收费。
华为云：官方公告中心在本统计周期内未检索到新的 AI 直接相关公告，说明本周更多是延续前期发布而非新增公告密集周。

🟠 腾讯云（最近一周最活跃）

TokenHub 产品动态：新增支持 GLM-5.2 ↗

📅 2026-06-17 / 2026-06-18

官方产品动态页显示：6/17 新增支持 GLM-5.2，6/18 Token Plan 企业版专业套餐同步新增 GLM-5.2。含义是智谱最新主力模型已正式进入腾讯云的统一模型供给与套餐体系。

TokenHub 公告：DeepSeek-V3.2 将于 7 月中旬下线并自动迁移 ↗

📅 2026-06-16 17:12

腾讯云明确公告 DeepSeek-V3.2（model=deepseek-v3.2）将在 2026-07-16 下线，建议用户提前切换到 DeepSeek-V4 系列；若未手动迁移，系统将自动切换到最新 DeepSeek 模型。这直接影响依赖旧版 DeepSeek 的 Agent / 工作流兼容性。

TokenHub 产品动态：新增支持 DeepSeek-V4-Flash / V4-Pro 原厂直供 ↗

📅 2026-06-16

与 DeepSeek-V3.2 的退场对应，腾讯云在同一周把 DeepSeek-V4-Flash 与 DeepSeek-V4-Pro 原厂直供纳入 Token Plan。趋势非常明确：平台在把流量和套餐重心切向 V4 新代模型。

🔵 阿里云（百炼 / 记忆存储 / 网关调整）

阿里云百炼：北京网关安全增强与容量扩容，有损变更通告 ↗

📅 2026-06-18 02:49

官方公告称百炼国内站（北京）网关将在 6/23 晚至 6/24 凌晨升级，已建立连接可能被重置，建议调用端增加重试机制。对生产环境 AI API 调用来说，这是最需要提前防护的一条本周动态。

阿里云百炼：商品名称变更通知 ↗

📅 2026-06-17 19:19

这是官方口径层面的产品命名调整，虽然不直接改变模型能力，但会影响控制台、账单、采购和内部汇报中的产品名称映射，属于平台治理型变化。

阿里云表格存储：记忆存储与知识存储功能开始收费 ↗

📅 2026-06-18 01:52