🤖 LLM 模型全景报告

国内主流模型 + OpenRouter 排行榜 + 云厂商动态

生成时间:2026-06-22 00:00 | 数据来源:阿里云百炼、火山方舟、华为云 MaaS、OpenRouter、云厂商公告

⚡ 本周要点(TL;DR)

  • 新模型(近 7 天 7 个):智谱 GLM-5.2(6/13,1M 上下文,对标 Claude Opus 4.8)+ OpenRouter Fusion / Kimi K2.7 Code / Claude Fable 5 / NVIDIA Nemotron Rerank VL / Nex-N2-Pro
  • OpenRouter 周榜:DeepSeek V4 Flash 4.51T tokens 居首,腾讯 Hy3 Preview 紧随,MiniMax M3 第三 — 国产模型集体刷榜
  • 云厂商动态:腾讯云近一周密集发 OCR/数学识别 API 迁移、ADP ClawPro 6/12 停止新购;华为云医疗 AI 使能平台案例更新;阿里云百炼 Agent 计费文档微调
  • 价格 / 安全:本周三大云均无新增 AI 直接价格调整或工具链安全公告
  • 报告校验:所有外链已逐条校验,全部 HTTP 200

⚡ 本周要点(TL;DR)

  • 新模型(近 7 天 7 个):智谱 GLM-5.2(6/13,1M 上下文,对标 Claude Opus 4.8)+ OpenRouter Fusion / Kimi K2.7 Code / Claude Fable 5 / NVIDIA Nemotron Rerank VL / Nex-N2-Pro
  • OpenRouter 周榜:DeepSeek V4 Flash 4.51T tokens 居首,腾讯 Hy3 Preview 紧随,MiniMax M3 第三 — 国产模型集体刷榜
  • 云厂商动态:腾讯云近一周密集发 OCR/数学识别 API 迁移、ADP ClawPro 6/12 停止新购;华为云医疗 AI 使能平台案例更新;阿里云百炼 Agent 计费文档微调
  • 价格 / 安全:本周三大云均无新增 AI 直接价格调整或工具链安全公告
  • 报告校验:所有外链已逐条校验,全部 HTTP 200

⚡ 本周要点(TL;DR)

  • 新模型(近 7 天 7 个):智谱 GLM-5.2(6/13,1M 上下文,对标 Claude Opus 4.8)+ OpenRouter Fusion / Kimi K2.7 Code / Claude Fable 5 / NVIDIA Nemotron Rerank VL / Nex-N2-Pro
  • OpenRouter 周榜:DeepSeek V4 Flash 4.51T tokens 居首,腾讯 Hy3 Preview 紧随,MiniMax M3 第三 — 国产模型集体刷榜
  • 云厂商动态:腾讯云近一周密集发 OCR/数学识别 API 迁移、ADP ClawPro 6/12 停止新购;华为云医疗 AI 使能平台案例更新;阿里云百炼 Agent 计费文档微调
  • 价格 / 安全:本周三大云均无新增 AI 直接价格调整或工具链安全公告
  • 报告校验:所有外链已逐条校验,全部 HTTP 200
📊 常用模型概括 16 个精选模型
💡 快速推荐(实时数据驱动)
🆕 近 7 天新模型:Google: Nano Banana 2 (Gemini 3.1 Flash Image)、Google: Nano Banana Pro (Gemini 3 Pro Image)、Cohere: North Mini Code (free)、Z.ai: GLM 5.2
🔥 OpenRouter 周榜 Top 3:🥇 DeepSeek V4 Flash / 🥈 MiniMax M3 / 🥉 MiMo-V2.5
💰 性价比代表:Qwen3-30B-A3B(¥0.75/M 输入,¥3.0/M 输出)
🧠 推理代表:DeepSeek-R1(¥4.0/M 输入,¥16.0/M 输出)
⚠ 本节为概览(部分硬编码),权威实时数据请见 📋 各厂商官方定价对照表 · ⚠ 本节为概览(部分硬编码),权威实时数据请见 📋 各厂商官方定价对照表 · ⚠ 本节为概览(部分硬编码),权威实时数据请见 📋 各厂商官方定价对照表 · 📅 第一部分价格数据截至 2026-06-22(部分硬编码价格,建议季度复核)
模型名称 厂商 输入价格 缓存命中 输出价格 概述 BU(业务单元) 业务场景
DeepSeek-V3.2 DeepSeek ¥2.0/M ¥0.5/M ¥3.0/M 旗舰通用模型,工具调用能力强,128K 上下文,构建 AI Agent 首选 企业服务 通用对话 深度推理 Agent 首选
Qwen3-30B-A3B 通义千问 ¥0.75/M ¥3.0/M 性价比最高,输入价格极低,性能强劲,30B 参数 云服务 企业级应用 通用对话 成本优化
GLM-5.1 智谱 <32K:¥6.0/M ¥1.3-2/M <32K:¥24.0/M Coding 能力对齐 Claude Opus 4.6,可独立工作 8 小时 开发者工具 生产级编程 长程 Agent 复杂任务
Kimi K2.6 🆕 月之暗面 缓存未命中:¥6.5/M ¥1.6/M ¥27.0/M 4/20发布,编程挑战击败 Claude/GPT-5.5/Gemini,256K 上下文 消费级应用 编程之王 长文本处理 Agent
DeepSeek-R1 DeepSeek ¥4.0/M ¥1.0/M ¥16.0/M 强推理模型,深度思考后回答,擅长复杂数学/逻辑/调试 企业服务 复杂推理 数学计算 逻辑分析
Qwen3.6-Plus 通义千问 ≤256K: ¥2.0/M ¥0.4/M ≤256K: ¥12.0/M 千问Plus最新版,支持思考与非思考模式,1M上下文 云服务 通用对话 推理 Agent
Qwen-Turbo 通义千问 ¥0.3/M ¥0.06/M 非思考: ¥0.6/M 千问最便宜模型,支持思考与非思考模式,极低成本 开发者工具 高并发 实时对话 成本优化
GLM-4.7 智谱 <32K: ¥2.0/M ¥0.4-0.8/M <32K: ¥8.0/M 高智能模型,编程更强更稳,工具调用能力强 企业服务 通用对话 工具调用 长文本
Step-3.5-Flash 阶跃星辰 缓存未命中:¥0.7/M ¥0.14/M ¥2.1/M 智能体优化,工具调用,高性价比 开发者工具 Agent 构建 工具调用 成本优化
MiniMax-M2.7 MiniMax ¥2.1/M ¥0.42/M ¥8.4/M 模型自我迭代,自行构建复杂 Agent Harness 消费级应用 角色扮演 创意写作 长文本
DeepSeek-r1-distill-qwen-32b DeepSeek ¥4.0/M ¥16.0/M 推理蒸馏模型,32B 参数,平衡性能与成本 开发者工具 代码开发 推理任务 成本优化
Qwen3.6-27B 🆕 通义千问 ¥0.75/M ¥3.0/M 4/21发布,27B 参数开源新模型,性能提升显著 云服务 通用对话 企业应用 开源部署
Qwen2.5-vl-7b 通义千问 ≈¥0.8/M ≈¥2.0/M 视觉语言模型,多模态理解 开发者工具 视觉理解 图文对话 多模态
Qwen3-8b 通义千问 ¥0.3/M ¥0.6/M 轻量级模型,极速响应 开发者工具 轻量任务 高并发 成本优化
DeepSeek-V4-Flash 🆕 DeepSeek ¥1.0/M ¥0.2/M ¥2.0/M DeepSeek V4 Flash 版本,火山方舟接入,超低延迟+极致性价比 企业服务 高并发 实时响应 成本优化
Qwen3.6-35B-A3B 🆕 通义千问 ¥1.8/M ¥10.8/M Qwen3.6 开源系列旗舰小模型,支持思考与非思考模式,256K 上下文 开源/自部署 开源旗舰 长上下文 私有化
📋 各厂商官方定价对照表 来自官方定价页
📌 数据来源(权威)
本节直接对照 8 家厂商官方定价页(阿里云百炼 / DeepSeek / 智谱 BigModel / 月之暗面 / MiniMax / 阶跃星辰 / 火山方舟 / 腾讯混元); 每个表头都附「查看官方定价页 ↗」链接,价格单位统一为 元 / 百万 tokens; 缓存时间:2026-06-16T03:17:58.902978+00:00(24h 自动刷新,可手动 python3 scripts/fetch_official_prices.py --force)。 若发现某家显示「数据陈旧」,意味着上一轮抓取失败,请以官方页为准。
阿里云百炼 官方 查看官方定价页 ↗
模型 分类 输入价 (元/M) 缓存命中 (元/M) 输出价 (元/M) 分档/备注
qwen3.7-max 旗舰 ¥12 ¥2.4 ¥36 0
qwen3.6-max-preview 旗舰 ¥9 / 15 ¥1.8 / 3 ¥54 / 90 ≤128K / ≤256K
qwen3-max 旗舰 ¥2.5 / 4 / 7 ¥0.5 / 0.8 / 1.4 ¥10 / 16 / 28 ≤32K / ≤128K / ≤256K
qwen-max 旗舰 ¥2.4 ¥0.48 ¥9.6 无阶梯
qwen3.7-plus 通用 ¥2 / 6 ¥0.4 / 1.2 ¥8 / 24 ≤256K / ≤1M
qwen3.6-plus 通用 ≤256K: ¥2.0/M (同上) ¥0.4/M (同上) ¥12 / 48 ≤256K / ≤1M
qwen-plus 通用 ¥0.8 / 2.4 / 4.8 ¥0.16 / 0.48 / 0.96 ¥2 / 20 / 48 ≤128K / ≤256K / ≤1M
qwen3.6-flash 高性价比 ¥1.2 / 4.8 ¥0.24 / 0.96 ¥7.2 / 28.8 ≤256K / ≤1M
qwen-flash 高性价比 ¥0.15 / 0.6 / 1.2 ¥0.03 / 0.12 / 0.24 ¥1.5 / 6 / 12 ≤128K / ≤256K / ≤1M
qwen-turbo 高性价比 ¥0.3/M (同上) ¥0.06/M (同上) ¥0.6 / 3 非思考 / 思考
qwq-plus 推理 ¥1.6 ¥0.32 ¥4 仅思考
qwen3-coder-plus 编程 ¥4 / 6 / 10 / 20 ¥0.8 / 1.2 / 2 / 4 ¥16 / 24 / 40 / 200 ≤32K / ≤128K / ≤256K / ≤1M
qwen3-coder-flash 编程 ¥1 / 1.5 / 2.5 / 5 ¥0.2 / 0.3 / 0.5 / 1 ¥4 / 6 / 10 / 25 ≤32K / ≤128K / ≤256K / ≤1M
qwen3-30b-a3b 开源 ¥0.75/M (同上) (同上) ¥3 开源 30B
qwen3-8b 开源 ¥0.3/M (同上) (同上) ¥0.6 开源 8B
qwen3-vl-plus 多模态 ¥1 / 1.5 / 3 ¥0.2 / 0.3 / 0.6 ¥10 / 15 / 30 ≤32K / ≤128K / ≤256K
qwen-vl-max 多模态 ¥1.6 ¥0.32 ¥4 无阶梯
qwen3-vl-flash 多模态 ¥0.15 / 0.3 / 0.6 ¥0.03 / 0.06 / 0.12 ¥1.5 / 3 / 6 ≤32K / ≤128K / ≤256K
模型 分类 输入价 (元/M) 缓存命中 (元/M) 输出价 (元/M) 分档/备注
deepseek-v4-pro 旗舰 ¥12 ¥1 ¥24 1M 上下文 / 384K 输出 · 🆕 2026-04-24 发布·1.6T 总参/49B 激活·对标顶级闭源
deepseek-v4-flash 高性价比 ¥1.0/M (同上) ¥0.2/M (同上) ¥2 1M 上下文 / 384K 输出 · 🆕 2026-04-24 发布·284B 总参/13B 激活·性价比之王
deepseek-chat 即将弃用 ¥2 ¥0.5 ¥8 64K 上下文 · ⚠ 2026-07-24 弃用·自动路由到 V4-Flash 非思考模式
deepseek-reasoner 即将弃用 ¥4 ¥1 ¥16 64K 上下文 + 32K 思维链 · ⚠ 2026-07-24 弃用·自动路由到 V4-Flash 思考模式
智谱 BigModel 官方 查看官方定价页 ↗
模型 分类 输入价 (元/M) 缓存命中 (元/M) 输出价 (元/M) 分档/备注
GLM-5.1 旗舰 <32K:¥6.0/M (同上) ¥1.3-2/M (同上) ¥24 / 28 <32K / ≥32K
GLM-5-Turbo 通用 ¥5 / 7 ¥1.2 / 1.8 ¥22 / 26 <32K / ≥32K
GLM-5 通用 ¥4 / 6 ¥1 / 1.5 ¥18 / 22 <32K / ≥32K
GLM-4.7 通用 <32K: ¥2.0/M (同上) ¥0.4-0.8/M (同上) ¥8 / 14 / 16 阶梯计费
GLM-4.5-Air 高性价比 ¥0.8 / 1.2 ¥0.16 / 0.24 ¥2 / 6 / 8 <32K / ≥32K
GLM-4.7-FlashX 高性价比 ¥0.5 ¥0.1 ¥3 200K
GLM-4.7-Flash 免费 ¥0 ¥0 ¥0 200K · 完全免费
GLM-4-Plus 通用 ¥5 官方未公布 ¥5 128K
GLM-4-Long 长文本 ¥1 官方未公布 ¥1 1M
月之暗面 Kimi 官方 查看官方定价页 ↗
模型 分类 输入价 (元/M) 缓存命中 (元/M) 输出价 (元/M) 分档/备注
Kimi K2.7 Code 编程 ¥1.5 / 6 ¥1.5 ¥30 缓存命中 / 未命中 · 限时促销 50% off
Kimi K2.6 通用 缓存未命中:¥6.5/M (同上) ¥1.6/M (同上) ¥27 缓存命中 / 未命中 · 256K 上下文
Kimi K2.5 通用 ¥0.7 / 4 ¥0.7 ¥21 缓存命中 / 未命中 · 128K 上下文
Moonshot V1-32K 历史 ¥24 官方未公布 ¥24 32K 上下文
模型 分类 输入价 (元/M) 缓存命中 (元/M) 输出价 (元/M) 分档/备注
MiniMax-M3 旗舰 ¥2.10 / 4.20 ¥0.42 / 0.84 ¥8.40 / 16.80 ≤512K / >512K · 永久 5 折
MiniMax-M2.7 通用 ¥2.1/M (同上) ¥0.42/M (同上) ¥8.4 缓存命中 0.42
MiniMax-M2.7-highspeed 高速 ¥4.2 ¥0.42 ¥16.8 高速
MiniMax-M2.5 历史 ¥2.1 ¥0.21 ¥8.4 历史模型
MiniMax-M2.1 历史 ¥2.1 ¥0.21 ¥8.4 历史模型
MiniMax-M2 历史 ¥2.1 ¥0.21 ¥8.4 历史模型
阶跃星辰 StepFun 官方 查看官方定价页 ↗
模型 分类 输入价 (元/M) 缓存命中 (元/M) 输出价 (元/M) 分档/备注
step-3.7-flash 旗舰 ¥0.27 / 1.35 ¥0.27 ¥8.1 缓存命中 / 未命中 · 多模态推理
step-3.5-flash 通用 缓存未命中:¥0.7/M (同上) ¥0.14/M (同上) ¥2.1 缓存命中 / 未命中 · 推理大模型
step-1o-turbo-vision 多模态 ¥0.5 / 2.5 ¥0.5 ¥8 缓存命中 / 未命中 · 视觉
stepaudio-2.5-realtime 语音 ¥2 / 10 ¥2 ¥70 缓存命中 / 未命中 · 实时语音
火山方舟(豆包) 官方 查看官方定价页 ↗
模型 分类 输入价 (元/M) 缓存命中 (元/M) 输出价 (元/M) 分档/备注
doubao-seed-2.0-pro 旗舰 ¥3.2 / 4.8 / 9.6 ¥0.64 / 0.96 / 1.92 ¥16 / 24 / 48 ≤32K / ≤128K / ≤256K
doubao-seed-2.0-lite 高性价比 ¥0.6 / 0.9 / 1.8 ¥0.12 / 0.18 / 0.36 ¥3.6 / 5.4 / 10.8 ≤32K / ≤128K / ≤256K
doubao-seed-2.0-mini 小模型 ¥0.2 / 0.4 / 0.8 ¥0.04 / 0.08 / 0.16 ¥2 / 4 / 8 ≤32K / ≤128K / ≤256K
doubao-seed-2.0-code 编程 ¥3.2 / 4.8 / 9.6 ¥0.64 / 0.96 / 1.92 ¥16 / 24 / 48 ≤32K / ≤128K / ≤256K
doubao-seed-1.6 通用 ¥0.8 / 1.2 / 2.4 ¥0.16 ¥2 / 8 / 16 / 24 阶梯计费
doubao-seed-1.6-flash 高性价比 ¥0.15 / 0.3 / 0.6 ¥0.03 ¥1.5 / 3 / 6 ≤32K / ≤128K / ≤256K
glm-4.7 第三方 <32K: ¥2.0/M (同上) ¥0.4-0.8/M (同上) ¥8 / 14 / 16 通过火山方舟接入
deepseek-v4-pro 第三方 ¥12 ¥1 ¥24 通过火山方舟接入
deepseek-v4-flash 第三方 ¥1.0/M (同上) ¥0.2/M (同上) ¥2 通过火山方舟接入
deepseek-v3.2 第三方 ¥2.0/M (同上) ¥0.5/M (同上) ¥3 / 6 ≤32K / ≤128K
deepseek-r1 第三方 ¥4.0/M (同上) ¥1.0/M (同上) ¥16 通过火山方舟接入
腾讯混元 官方 查看官方定价页 ↗
模型 分类 输入价 (元/M) 缓存命中 (元/M) 输出价 (元/M) 分档/备注
Tencent HY 2.0 Think 旗舰 ¥3.975 / 5.3 官方未公布 ¥15.9 / 21.2 ≤32K / ≤128K
Tencent HY 2.0 Instruct 通用 ¥3.18 / 4.505 官方未公布 ¥7.95 / 11.13 ≤32K / ≤128K
Hunyuan-T1 推理 ¥1 官方未公布 ¥4 无阶梯
Hunyuan-TurboS 高性价比 ¥0.8 官方未公布 ¥2 无阶梯
Hunyuan-a13b 高性价比 ¥0.5 官方未公布 ¥2 无阶梯
Hunyuan-large-role 角色 ¥2.4 官方未公布 ¥9.6 角色扮演
Hunyuan-translation 翻译 ¥1.2 官方未公布 ¥3.6 翻译
HY Vision 1.5 多模态 ¥3 官方未公布 ¥9 视觉
📋 各厂商官方定价对照表 来自官方定价页
📌 数据来源(权威)
本节直接对照 8 家厂商官方定价页(阿里云百炼 / DeepSeek / 智谱 BigModel / 月之暗面 / MiniMax / 阶跃星辰 / 火山方舟 / 腾讯混元); 每个表头都附「查看官方定价页 ↗」链接,价格单位统一为 元 / 百万 tokens; 缓存时间:2026-06-16T03:17:58.902978+00:00(24h 自动刷新,可手动 python3 scripts/fetch_official_prices.py --force)。 若发现某家显示「数据陈旧」,意味着上一轮抓取失败,请以官方页为准。
阿里云百炼 官方 查看官方定价页 ↗
模型 分类 输入价 (元/M) 缓存命中 (元/M) 输出价 (元/M) 分档/备注
qwen3.7-max 旗舰 ¥12 ¥2.4 ¥36 0
qwen3.6-max-preview 旗舰 ¥9 / 15 ¥1.8 / 3 ¥54 / 90 ≤128K / ≤256K
qwen3-max 旗舰 ¥2.5 / 4 / 7 ¥0.5 / 0.8 / 1.4 ¥10 / 16 / 28 ≤32K / ≤128K / ≤256K
qwen-max 旗舰 ¥2.4 ¥0.48 ¥9.6 无阶梯
qwen3.7-plus 通用 ¥2 / 6 ¥0.4 / 1.2 ¥8 / 24 ≤256K / ≤1M
qwen3.6-plus 通用 ≤256K: ¥2.0/M (同上) ¥0.4/M (同上) ¥12 / 48 ≤256K / ≤1M
qwen-plus 通用 ¥0.8 / 2.4 / 4.8 ¥0.16 / 0.48 / 0.96 ¥2 / 20 / 48 ≤128K / ≤256K / ≤1M
qwen3.6-flash 高性价比 ¥1.2 / 4.8 ¥0.24 / 0.96 ¥7.2 / 28.8 ≤256K / ≤1M
qwen-flash 高性价比 ¥0.15 / 0.6 / 1.2 ¥0.03 / 0.12 / 0.24 ¥1.5 / 6 / 12 ≤128K / ≤256K / ≤1M
qwen-turbo 高性价比 ¥0.3/M (同上) ¥0.06/M (同上) ¥0.6 / 3 非思考 / 思考
qwq-plus 推理 ¥1.6 ¥0.32 ¥4 仅思考
qwen3-coder-plus 编程 ¥4 / 6 / 10 / 20 ¥0.8 / 1.2 / 2 / 4 ¥16 / 24 / 40 / 200 ≤32K / ≤128K / ≤256K / ≤1M
qwen3-coder-flash 编程 ¥1 / 1.5 / 2.5 / 5 ¥0.2 / 0.3 / 0.5 / 1 ¥4 / 6 / 10 / 25 ≤32K / ≤128K / ≤256K / ≤1M
qwen3-30b-a3b 开源 ¥0.75/M (同上) (同上) ¥3 开源 30B
qwen3-8b 开源 ¥0.3/M (同上) (同上) ¥0.6 开源 8B
qwen3-vl-plus 多模态 ¥1 / 1.5 / 3 ¥0.2 / 0.3 / 0.6 ¥10 / 15 / 30 ≤32K / ≤128K / ≤256K
qwen-vl-max 多模态 ¥1.6 ¥0.32 ¥4 无阶梯
qwen3-vl-flash 多模态 ¥0.15 / 0.3 / 0.6 ¥0.03 / 0.06 / 0.12 ¥1.5 / 3 / 6 ≤32K / ≤128K / ≤256K
模型 分类 输入价 (元/M) 缓存命中 (元/M) 输出价 (元/M) 分档/备注
deepseek-v4-pro 旗舰 ¥12 ¥1 ¥24 1M 上下文 / 384K 输出 · 🆕 2026-04-24 发布·1.6T 总参/49B 激活·对标顶级闭源
deepseek-v4-flash 高性价比 ¥1.0/M (同上) ¥0.2/M (同上) ¥2 1M 上下文 / 384K 输出 · 🆕 2026-04-24 发布·284B 总参/13B 激活·性价比之王
deepseek-chat 即将弃用 ¥2 ¥0.5 ¥8 64K 上下文 · ⚠ 2026-07-24 弃用·自动路由到 V4-Flash 非思考模式
deepseek-reasoner 即将弃用 ¥4 ¥1 ¥16 64K 上下文 + 32K 思维链 · ⚠ 2026-07-24 弃用·自动路由到 V4-Flash 思考模式
智谱 BigModel 官方 查看官方定价页 ↗
模型 分类 输入价 (元/M) 缓存命中 (元/M) 输出价 (元/M) 分档/备注
GLM-5.1 旗舰 <32K:¥6.0/M (同上) ¥1.3-2/M (同上) ¥24 / 28 <32K / ≥32K
GLM-5-Turbo 通用 ¥5 / 7 ¥1.2 / 1.8 ¥22 / 26 <32K / ≥32K
GLM-5 通用 ¥4 / 6 ¥1 / 1.5 ¥18 / 22 <32K / ≥32K
GLM-4.7 通用 <32K: ¥2.0/M (同上) ¥0.4-0.8/M (同上) ¥8 / 14 / 16 阶梯计费
GLM-4.5-Air 高性价比 ¥0.8 / 1.2 ¥0.16 / 0.24 ¥2 / 6 / 8 <32K / ≥32K
GLM-4.7-FlashX 高性价比 ¥0.5 ¥0.1 ¥3 200K
GLM-4.7-Flash 免费 ¥0 ¥0 ¥0 200K · 完全免费
GLM-4-Plus 通用 ¥5 官方未公布 ¥5 128K
GLM-4-Long 长文本 ¥1 官方未公布 ¥1 1M
月之暗面 Kimi 官方 查看官方定价页 ↗
模型 分类 输入价 (元/M) 缓存命中 (元/M) 输出价 (元/M) 分档/备注
Kimi K2.7 Code 编程 ¥1.5 / 6 ¥1.5 ¥30 缓存命中 / 未命中 · 限时促销 50% off
Kimi K2.6 通用 缓存未命中:¥6.5/M (同上) ¥1.6/M (同上) ¥27 缓存命中 / 未命中 · 256K 上下文
Kimi K2.5 通用 ¥0.7 / 4 ¥0.7 ¥21 缓存命中 / 未命中 · 128K 上下文
Moonshot V1-32K 历史 ¥24 官方未公布 ¥24 32K 上下文
模型 分类 输入价 (元/M) 缓存命中 (元/M) 输出价 (元/M) 分档/备注
MiniMax-M3 旗舰 ¥2.10 / 4.20 ¥0.42 / 0.84 ¥8.40 / 16.80 ≤512K / >512K · 永久 5 折
MiniMax-M2.7 通用 ¥2.1/M (同上) ¥0.42/M (同上) ¥8.4 缓存命中 0.42
MiniMax-M2.7-highspeed 高速 ¥4.2 ¥0.42 ¥16.8 高速
MiniMax-M2.5 历史 ¥2.1 ¥0.21 ¥8.4 历史模型
MiniMax-M2.1 历史 ¥2.1 ¥0.21 ¥8.4 历史模型
MiniMax-M2 历史 ¥2.1 ¥0.21 ¥8.4 历史模型
阶跃星辰 StepFun 官方 查看官方定价页 ↗
模型 分类 输入价 (元/M) 缓存命中 (元/M) 输出价 (元/M) 分档/备注
step-3.7-flash 旗舰 ¥0.27 / 1.35 ¥0.27 ¥8.1 缓存命中 / 未命中 · 多模态推理
step-3.5-flash 通用 缓存未命中:¥0.7/M (同上) ¥0.14/M (同上) ¥2.1 缓存命中 / 未命中 · 推理大模型
step-1o-turbo-vision 多模态 ¥0.5 / 2.5 ¥0.5 ¥8 缓存命中 / 未命中 · 视觉
stepaudio-2.5-realtime 语音 ¥2 / 10 ¥2 ¥70 缓存命中 / 未命中 · 实时语音
火山方舟(豆包) 官方 查看官方定价页 ↗
模型 分类 输入价 (元/M) 缓存命中 (元/M) 输出价 (元/M) 分档/备注
doubao-seed-2.0-pro 旗舰 ¥3.2 / 4.8 / 9.6 ¥0.64 / 0.96 / 1.92 ¥16 / 24 / 48 ≤32K / ≤128K / ≤256K
doubao-seed-2.0-lite 高性价比 ¥0.6 / 0.9 / 1.8 ¥0.12 / 0.18 / 0.36 ¥3.6 / 5.4 / 10.8 ≤32K / ≤128K / ≤256K
doubao-seed-2.0-mini 小模型 ¥0.2 / 0.4 / 0.8 ¥0.04 / 0.08 / 0.16 ¥2 / 4 / 8 ≤32K / ≤128K / ≤256K
doubao-seed-2.0-code 编程 ¥3.2 / 4.8 / 9.6 ¥0.64 / 0.96 / 1.92 ¥16 / 24 / 48 ≤32K / ≤128K / ≤256K
doubao-seed-1.6 通用 ¥0.8 / 1.2 / 2.4 ¥0.16 ¥2 / 8 / 16 / 24 阶梯计费
doubao-seed-1.6-flash 高性价比 ¥0.15 / 0.3 / 0.6 ¥0.03 ¥1.5 / 3 / 6 ≤32K / ≤128K / ≤256K
glm-4.7 第三方 <32K: ¥2.0/M (同上) ¥0.4-0.8/M (同上) ¥8 / 14 / 16 通过火山方舟接入
deepseek-v4-pro 第三方 ¥12 ¥1 ¥24 通过火山方舟接入
deepseek-v4-flash 第三方 ¥1.0/M (同上) ¥0.2/M (同上) ¥2 通过火山方舟接入
deepseek-v3.2 第三方 ¥2.0/M (同上) ¥0.5/M (同上) ¥3 / 6 ≤32K / ≤128K
deepseek-r1 第三方 ¥4.0/M (同上) ¥1.0/M (同上) ¥16 通过火山方舟接入
腾讯混元 官方 查看官方定价页 ↗
模型 分类 输入价 (元/M) 缓存命中 (元/M) 输出价 (元/M) 分档/备注
Tencent HY 2.0 Think 旗舰 ¥3.975 / 5.3 官方未公布 ¥15.9 / 21.2 ≤32K / ≤128K
Tencent HY 2.0 Instruct 通用 ¥3.18 / 4.505 官方未公布 ¥7.95 / 11.13 ≤32K / ≤128K
Hunyuan-T1 推理 ¥1 官方未公布 ¥4 无阶梯
Hunyuan-TurboS 高性价比 ¥0.8 官方未公布 ¥2 无阶梯
Hunyuan-a13b 高性价比 ¥0.5 官方未公布 ¥2 无阶梯
Hunyuan-large-role 角色 ¥2.4 官方未公布 ¥9.6 角色扮演
Hunyuan-translation 翻译 ¥1.2 官方未公布 ¥3.6 翻译
HY Vision 1.5 多模态 ¥3 官方未公布 ¥9 视觉
📋 各厂商官方定价对照表 来自官方定价页
📌 数据来源(权威)
本节直接对照 8 家厂商官方定价页(阿里云百炼 / DeepSeek / 智谱 BigModel / 月之暗面 / MiniMax / 阶跃星辰 / 火山方舟 / 腾讯混元); 每个表头都附「查看官方定价页 ↗」链接,价格单位统一为 元 / 百万 tokens; 缓存时间:2026-06-16T03:17:58.902978+00:00(24h 自动刷新,可手动 python3 scripts/fetch_official_prices.py --force)。 若发现某家显示「数据陈旧」,意味着上一轮抓取失败,请以官方页为准。
阿里云百炼 官方 查看官方定价页 ↗
模型 分类 输入价 (元/M) 缓存命中 (元/M) 输出价 (元/M) 分档/备注
qwen3.7-max 旗舰 ¥12 ¥2.4 ¥36 0
qwen3.6-max-preview 旗舰 ¥9 / 15 ¥1.8 / 3 ¥54 / 90 ≤128K / ≤256K
qwen3-max 旗舰 ¥2.5 / 4 / 7 ¥0.5 / 0.8 / 1.4 ¥10 / 16 / 28 ≤32K / ≤128K / ≤256K
qwen-max 旗舰 ¥2.4 ¥0.48 ¥9.6 无阶梯
qwen3.7-plus 通用 ¥2 / 6 ¥0.4 / 1.2 ¥8 / 24 ≤256K / ≤1M
qwen3.6-plus 通用 ¥2 / 8 ¥0.4 / 1.6 ¥12 / 48 ≤256K / ≤1M
qwen-plus 通用 ¥0.8 / 2.4 / 4.8 ¥0.16 / 0.48 / 0.96 ¥2 / 20 / 48 ≤128K / ≤256K / ≤1M
qwen3.6-flash 高性价比 ¥1.2 / 4.8 ¥0.24 / 0.96 ¥7.2 / 28.8 ≤256K / ≤1M
qwen-flash 高性价比 ¥0.15 / 0.6 / 1.2 ¥0.03 / 0.12 / 0.24 ¥1.5 / 6 / 12 ≤128K / ≤256K / ≤1M
qwen-turbo 高性价比 ¥0.3 ¥0.06 ¥0.6 / 3 非思考 / 思考
qwq-plus 推理 ¥1.6 ¥0.32 ¥4 仅思考
qwen3-coder-plus 编程 ¥4 / 6 / 10 / 20 ¥0.8 / 1.2 / 2 / 4 ¥16 / 24 / 40 / 200 ≤32K / ≤128K / ≤256K / ≤1M
qwen3-coder-flash 编程 ¥1 / 1.5 / 2.5 / 5 ¥0.2 / 0.3 / 0.5 / 1 ¥4 / 6 / 10 / 25 ≤32K / ≤128K / ≤256K / ≤1M
qwen3-30b-a3b 开源 ¥0.75 ¥0.15 ¥3 开源 30B
qwen3-8b 开源 ¥0.3 ¥0.06 ¥0.6 开源 8B
qwen3-vl-plus 多模态 ¥1 / 1.5 / 3 ¥0.2 / 0.3 / 0.6 ¥10 / 15 / 30 ≤32K / ≤128K / ≤256K
qwen-vl-max 多模态 ¥1.6 ¥0.32 ¥4 无阶梯
qwen3-vl-flash 多模态 ¥0.15 / 0.3 / 0.6 ¥0.03 / 0.06 / 0.12 ¥1.5 / 3 / 6 ≤32K / ≤128K / ≤256K
模型 分类 输入价 (元/M) 缓存命中 (元/M) 输出价 (元/M) 分档/备注
deepseek-v4-pro 旗舰 ¥12 ¥1 ¥24 1M 上下文 / 384K 输出 · 🆕 2026-04-24 发布·1.6T 总参/49B 激活·对标顶级闭源
deepseek-v4-flash 高性价比 ¥1 ¥0.2 ¥2 1M 上下文 / 384K 输出 · 🆕 2026-04-24 发布·284B 总参/13B 激活·性价比之王
deepseek-chat 即将弃用 ¥2 ¥0.5 ¥8 64K 上下文 · ⚠ 2026-07-24 弃用·自动路由到 V4-Flash 非思考模式
deepseek-reasoner 即将弃用 ¥4 ¥1 ¥16 64K 上下文 + 32K 思维链 · ⚠ 2026-07-24 弃用·自动路由到 V4-Flash 思考模式
智谱 BigModel 官方 查看官方定价页 ↗
模型 分类 输入价 (元/M) 缓存命中 (元/M) 输出价 (元/M) 分档/备注
GLM-5.1 旗舰 ¥6 / 8 ¥1.3 / 2 ¥24 / 28 <32K / ≥32K
GLM-5-Turbo 通用 ¥5 / 7 ¥1.2 / 1.8 ¥22 / 26 <32K / ≥32K
GLM-5 通用 ¥4 / 6 ¥1 / 1.5 ¥18 / 22 <32K / ≥32K
GLM-4.7 通用 ¥2 / 3 / 4 ¥0.4 / 0.6 / 0.8 ¥8 / 14 / 16 阶梯计费
GLM-4.5-Air 高性价比 ¥0.8 / 1.2 ¥0.16 / 0.24 ¥2 / 6 / 8 <32K / ≥32K
GLM-4.7-FlashX 高性价比 ¥0.5 ¥0.1 ¥3 200K
GLM-4.7-Flash 免费 ¥0 ¥0 ¥0 200K · 完全免费
GLM-4-Plus 通用 ¥5 官方未公布 ¥5 128K
GLM-4-Long 长文本 ¥1 官方未公布 ¥1 1M
月之暗面 Kimi 官方 查看官方定价页 ↗
模型 分类 输入价 (元/M) 缓存命中 (元/M) 输出价 (元/M) 分档/备注
Kimi K2.7 Code 编程 ¥1.5 / 6 ¥1.5 ¥30 缓存命中 / 未命中 · 限时促销 50% off
Kimi K2.6 通用 ¥1.6 / 6.5 ¥1.6 ¥27 缓存命中 / 未命中 · 256K 上下文
Kimi K2.5 通用 ¥0.7 / 4 ¥0.7 ¥21 缓存命中 / 未命中 · 128K 上下文
Moonshot V1-32K 历史 ¥24 官方未公布 ¥24 32K 上下文
模型 分类 输入价 (元/M) 缓存命中 (元/M) 输出价 (元/M) 分档/备注
MiniMax-M3 旗舰 ¥2.10 / 4.20 ¥0.42 / 0.84 ¥8.40 / 16.80 ≤512K / >512K · 永久 5 折
MiniMax-M2.7 通用 ¥2.1 ¥0.42 ¥8.4 缓存命中 0.42
MiniMax-M2.7-highspeed 高速 ¥4.2 ¥0.42 ¥16.8 高速
MiniMax-M2.5 历史 ¥2.1 ¥0.21 ¥8.4 历史模型
MiniMax-M2.1 历史 ¥2.1 ¥0.21 ¥8.4 历史模型
MiniMax-M2 历史 ¥2.1 ¥0.21 ¥8.4 历史模型
阶跃星辰 StepFun 官方 查看官方定价页 ↗
模型 分类 输入价 (元/M) 缓存命中 (元/M) 输出价 (元/M) 分档/备注
step-3.7-flash 旗舰 ¥0.27 / 1.35 ¥0.27 ¥8.1 缓存命中 / 未命中 · 多模态推理
step-3.5-flash 通用 ¥0.14 / 0.7 ¥0.14 ¥2.1 缓存命中 / 未命中 · 推理大模型
step-1o-turbo-vision 多模态 ¥0.5 / 2.5 ¥0.5 ¥8 缓存命中 / 未命中 · 视觉
stepaudio-2.5-realtime 语音 ¥2 / 10 ¥2 ¥70 缓存命中 / 未命中 · 实时语音
火山方舟(豆包) 官方 查看官方定价页 ↗
模型 分类 输入价 (元/M) 缓存命中 (元/M) 输出价 (元/M) 分档/备注
doubao-seed-2.0-pro 旗舰 ¥3.2 / 4.8 / 9.6 ¥0.64 / 0.96 / 1.92 ¥16 / 24 / 48 ≤32K / ≤128K / ≤256K
doubao-seed-2.0-lite 高性价比 ¥0.6 / 0.9 / 1.8 ¥0.12 / 0.18 / 0.36 ¥3.6 / 5.4 / 10.8 ≤32K / ≤128K / ≤256K
doubao-seed-2.0-mini 小模型 ¥0.2 / 0.4 / 0.8 ¥0.04 / 0.08 / 0.16 ¥2 / 4 / 8 ≤32K / ≤128K / ≤256K
doubao-seed-2.0-code 编程 ¥3.2 / 4.8 / 9.6 ¥0.64 / 0.96 / 1.92 ¥16 / 24 / 48 ≤32K / ≤128K / ≤256K
doubao-seed-1.6 通用 ¥0.8 / 1.2 / 2.4 ¥0.16 ¥2 / 8 / 16 / 24 阶梯计费
doubao-seed-1.6-flash 高性价比 ¥0.15 / 0.3 / 0.6 ¥0.03 ¥1.5 / 3 / 6 ≤32K / ≤128K / ≤256K
glm-4.7 第三方 ¥2 / 3 / 4 ¥0.4 / 0.6 / 0.8 ¥8 / 14 / 16 通过火山方舟接入
deepseek-v4-pro 第三方 ¥12 ¥1 ¥24 通过火山方舟接入
deepseek-v4-flash 第三方 ¥1 ¥0.2 ¥2 通过火山方舟接入
deepseek-v3.2 第三方 ¥2 / 4 ¥0.4 ¥3 / 6 ≤32K / ≤128K
deepseek-r1 第三方 ¥4 ¥0.8 ¥16 通过火山方舟接入
腾讯混元 官方 查看官方定价页 ↗
模型 分类 输入价 (元/M) 缓存命中 (元/M) 输出价 (元/M) 分档/备注
Tencent HY 2.0 Think 旗舰 ¥3.975 / 5.3 官方未公布 ¥15.9 / 21.2 ≤32K / ≤128K
Tencent HY 2.0 Instruct 通用 ¥3.18 / 4.505 官方未公布 ¥7.95 / 11.13 ≤32K / ≤128K
Hunyuan-T1 推理 ¥1 官方未公布 ¥4 无阶梯
Hunyuan-TurboS 高性价比 ¥0.8 官方未公布 ¥2 无阶梯
Hunyuan-a13b 高性价比 ¥0.5 官方未公布 ¥2 无阶梯
Hunyuan-large-role 角色 ¥2.4 官方未公布 ¥9.6 角色扮演
Hunyuan-translation 翻译 ¥1.2 官方未公布 ¥3.6 翻译
HY Vision 1.5 多模态 ¥3 官方未公布 ¥9 视觉
🎯 市场主流常用模型 按应用场景分类
📅 第二部分场景分类参考数据截至 2026-06-22(按应用场景的代表模型概览,权威实时价格请见 📋 各厂商官方定价对照表
💻 编程开发类
模型 厂商 输入价格 输出价格 核心特点
GLM-5.1 智谱 <32K:¥6.0/M (同上) ¥1.3-2/M (同上) 【最新旗舰】Coding能力对齐Claude Opus 4.6;长程任务显著提升,可自主工作长达8小时
GLM-5V-Turbo 智谱 <32K:¥5 ≥32K:¥7 <32K:¥22 ≥32K:¥26 【多模态 Coding 基座】兼顾视觉理解与 Coding 能力;复杂视觉推理更准确
GLM-5 智谱 ¥4 / 6 (同上) ¥1 / 1.5 (同上) 【高智能基座】编程能力对齐Claude Opus 4.5;擅长Agentic长程规划与执行
GLM-4.7 智谱 <32K: ¥2.0/M (同上) ¥0.4-0.8/M (同上) 【高智能模型】通用对话、推理与智能体能力全面升级;编程更强、更稳
GLM-4.6V 智谱 <32K:¥1 <128K:¥2 <32K:¥3 <128K:¥6 【视觉推理】视觉推理能力;原生支持工具调用;长上下文
MiniMax-M2.5 MiniMax ¥2.1 ¥0.21 (同上) 顶尖性能与极致性价比,轻松驾驭复杂任务
MiniMax-M2.1 MiniMax ¥2.1 ¥0.21 (同上) 强大多语言编程能力,全面升级代码工程体验
kimi-k2.5 月之暗面 缓存未命中:¥4 缓存命中:¥0.7 ¥21 Kimi K2.5 在 Agent、代码、视觉理解及一系列通用智能任务上取得开源 SoTA 表现
step-3.5-flash 阶跃星辰 缓存未命中:¥0.7/M (同上) ¥0.14/M (同上) 旗舰级推理模型,专为智能体构建而生,更擅长复杂项目规划与长程任务执行
deepseek-v3.1 DeepSeek ¥4 ¥12 DeepSeek 的旗舰级通用模型。主打低延迟与极致性价比,响应速度极快
qwen3.6-max-preview 通义千问 ¥9 / 15 (同上) ¥1.8 / 3 (同上) 在智能体编程、世界知识和指令遵循三大维度显著提升;适合复杂任务
qwen3-coder-plus 通义千问 ¥4 / 6 / 10 / 20 (同上) ¥0.8 / 1.2 / 2 / 4 (同上) 千问Coder旗舰;支持上下文缓存
doubao-seed-2.0-code 豆包 ¥3.2 / 4.8 / 9.6 (同上) ¥0.64 / 0.96 / 1.92 (同上) Seed 2.0编程专用模型;支持视觉理解
🤖 Agent 智能体类
模型 厂商 输入价格 输出价格 核心特点
GLM-5-Turbo 智谱 ¥5 / 7 (同上) ¥1.2 / 1.8 (同上) 【龙虾增强基座】龙虾任务核心需求专项优化;复杂长任务执行连续性好
DeepSeek-V3.2 DeepSeek ¥2.0/M (同上) ¥0.5/M (同上) DeepSeek 旗舰通用模型在 V3.1 基础上强化了工具调用能力,是构建 AI Agent 的首选;128K上下文
qwen3.5-397b-a17b 通义千问 ≤128K:¥1.2 ≤256K:¥3 ≤128K:¥7.2 ≤256K:¥18 原生支持文本+图像+视频输入;性能更优且成本更低
qwen3.6-plus 通义千问 ≤256K: ¥2.0/M (同上) ¥0.4/M (同上) 千问Plus最新版;支持思考与非思考模式
doubao-seed-2.0-pro 豆包 ¥3.2 / 4.8 / 9.6 (同上) ¥0.64 / 0.96 / 1.92 (同上) 侧重长链路推理能力与复杂任务稳定性,适配真实业务中的复杂场景
doubao-seed-1.8 豆包 分段计费:¥0.8-2.4 分段计费:¥2-24 面向多模态Agent场景优化;输出价格按输出长度分档
🧠 复杂推理类
模型 厂商 输入价格 输出价格 核心特点
step-1o-turbo-vision 阶跃星辰 ¥0.5 / 2.5 (同上) ¥0.5 (同上) 适合处理高难度的视觉决策任务
deepseek-r1 DeepSeek ¥4.0/M (同上) ¥1.0/M (同上) DeepSeek 的强推理模型,回答前先进行深度思考,擅长解决普通模型无法处理的烧脑难题
qwen3.6-35b-a3b 通义千问 ¥1.8/M (同上) (同上) Qwen3.6开源系列小模型;支持思考与非思考模式;256K上下文
qwen3-max 通义千问 ¥2.5 / 4 / 7 (同上) ¥0.5 / 0.8 / 1.4 (同上) 千问旗舰模型;支持思考与非思考模式
qwen3.6-flash 通义千问 ¥1.2 / 4.8 (同上) ¥0.24 / 0.96 (同上) 千问Flash最新版;支持思考与非思考模式
qwen-turbo 通义千问 ¥0.3/M (同上) ¥0.06/M (同上) 千问最便宜的模型;支持思考与非思考模式
qwq-plus 通义千问 ¥1.6 ¥0.32 (同上) 千问推理专用模型;仅思考模式
doubao-seed-1.6 豆包 ¥0.8 / 1.2 / 2.4 (同上) ¥0.16 (同上) 上一代旗舰
Tencent HY 2.0 Think 混元 ¥3.975 / 5.3 (同上) 官方未公布 (同上) 混元最新旗舰思考模型
Tencent HY 2.0 Instruct 混元 ¥3.18 / 4.505 (同上) 官方未公布 (同上) 混元最新旗舰非思考模型
Hunyuan-T1 混元 ¥1 官方未公布 (同上) 混元推理模型
💬 通用对话类
模型 厂商 输入价格 输出价格 核心特点
MiniMax-M2.7-highspeed MiniMax ¥4.2 ¥0.42 (同上) 与M2.7效果不变,速度大幅提升
Hunyuan-TurboS 混元 ¥0.8 官方未公布 (同上) 混元主力性价比模型
🎭 角色扮演类
模型 厂商 输入价格 输出价格 核心特点
M2-Her MiniMax ¥2.1 ¥8.4 文本对话模型,专为角色扮演、多轮对话等场景设计
🆕 近期新增发布模型 近7天 · 4个新模型
📌 数据来源说明
本节不使用飞书云文档,改为按运行时间向前 7 天检索。统计周期:2026-06-14 至 2026-06-21;数据源:OpenRouter Models API 实时拉取。 价格单位为 OpenRouter API 返回值换算后的 美元 / 百万 tokens;动态路由模型的价格显示为“动态路由”。
模型名称 厂商 发布日期 输入/输出价格 核心亮点
Google: Nano Banana 2 (Gemini 3.1 Flash Image) ↗
google/gemini-3.1-flash-image
Google 2026-06-18 $0.5/$3
131K ctx · text+image → text+image
Gemini 3.1 Flash Image, a.k.a. "Nano Banana 2," is Google’s latest state of the art image generation and editing model, delivering Pro-level visual quality at Flash speed. It combines advanced...
Google: Nano Banana Pro (Gemini 3 Pro Image) ↗
google/gemini-3-pro-image
Google 2026-06-18 $2/$12
66K ctx · text+image → text+image
Nano Banana Pro is Google’s most advanced image-generation and editing model, built on Gemini 3 Pro. It extends the original Nano Banana with significantly improved multimodal reasoning, real-world grounding, and...
Cohere: North Mini Code (free) ↗
cohere/north-mini-code:free
Cohere 2026-06-17 $0/$0
256K ctx · text → text
North Mini Code is Cohere's first agentic coding model and the debut of its North family. A sparse mixture-of-experts model with 30B total parameters and 3B active, it is optimized...
Z.ai: GLM 5.2 ↗
z-ai/glm-5.2
Z.ai 2026-06-16 $1.2/$4.1
1.04858M ctx · text → text
GLM 5.2 is a large-scale reasoning model from Z.ai. It supports text input and output with a 1M-token context window, and is suited for long-horizon agent workflows, project-level software engineering,...
🌍 OpenRouter 热门模型 按周调用量排名 Top 10
📈 数据来源与口径
数据来源:OpenRouter 排行页 https://openrouter.ai/rankingsTop Models / Weekly usage of models across OpenRouter 当前可见榜单;结合同页 Jina 镜像与 OpenRouter 排行接口交叉校验,提取时间:2026-06-22 00:12 CST。按页面展示的调用量 Top 10 填写,不展示价格列。
排名 模型名称 厂商 地区 周调用量 周变化 核心特点
🥇 DeepSeek V4 Flash DeepSeek 中国 4.89T tokens/周 +8% 当前页面榜单第 1,主打高吞吐与高性价比通用推理。
🥈 MiniMax M3 MiniMax 中国 3.96T tokens/周 +4% 页面榜单第 2,多模态基础能力强,调用量保持高位。
🥉 MiMo-V2.5 Xiaomi 中国 3.84T tokens/周 +12% 小米系热门模型,本周仍在前三,增长明显。
4 Hy3 preview Tencent 中国 3.53T tokens/周 +17% 腾讯系预览模型,当前页面榜单第 4,热度继续上行。
5 Claude Opus 4.7 Anthropic 国际 2.71T tokens/周 +23% 国际高端推理代表,复杂任务场景热度高。
6 DeepSeek V4 Pro DeepSeek 中国 2.55T tokens/周 +28% DeepSeek 高阶版本,在通用与 Agent 工作流中表现活跃。
7 Owl Alpha OpenRouter 国际 2.47T tokens/周 +2% OpenRouter 自有热门模型,当前稳定位于前十。
8 Claude Opus 4.8 Anthropic 国际 1.57T tokens/周 +19% 当前页面榜单第 8,仍维持高端推理模型热度。
9 Claude Sonnet 4.6 Anthropic 国际 1.55T tokens/周 +30% 高频生产级模型,编程与通用任务使用面广。
10 GLM 5.2 智谱 中国 1.07T tokens/周 new 当前页面榜单第 10,最新进入 Top 10 的智谱模型。
☁️ 云厂商动态 最近一周 · 官方源
📌 检索口径
检索时间:2026-06-22 00:00 CST;统计周期:2026-06-15 至 2026-06-22
数据源仅使用你之前指定的官方地址体系: 阿里云公告中心 · 腾讯云公告中心 · 腾讯云 TokenHub 产品动态 · 华为云公告中心。 本部分只保留最近一周内直接影响 AI / Agent / 模型平台的动态;若某厂商本周无直接相关新公告,会明确标注“本周无新增”。

🔥 本周观察:腾讯云模型编排变化最密集,阿里云百炼侧重网关/计费调整,华为云公告口径本周偏静默

  • 腾讯云:TokenHub 在 6/16–6/18 连续出现模型供给变化,核心是 GLM-5.2 上线DeepSeek-V3.2 下线迁移
  • 阿里云:百炼在最近一周可核实动态集中在 网关升级商品名称调整记忆/知识存储开始收费
  • 华为云:官方公告中心在本统计周期内未检索到新的 AI 直接相关公告,说明本周更多是延续前期发布而非新增公告密集周。
🟠 腾讯云(最近一周最活跃)
📅 2026-06-17 / 2026-06-18
官方产品动态页显示:6/17 新增支持 GLM-5.2,6/18 Token Plan 企业版专业套餐同步新增 GLM-5.2。含义是智谱最新主力模型已正式进入腾讯云的统一模型供给与套餐体系。
📅 2026-06-16 17:12
腾讯云明确公告 DeepSeek-V3.2(model=deepseek-v3.2)将在 2026-07-16 下线,建议用户提前切换到 DeepSeek-V4 系列;若未手动迁移,系统将自动切换到最新 DeepSeek 模型。这直接影响依赖旧版 DeepSeek 的 Agent / 工作流兼容性。
📅 2026-06-16
与 DeepSeek-V3.2 的退场对应,腾讯云在同一周把 DeepSeek-V4-Flash 与 DeepSeek-V4-Pro 原厂直供纳入 Token Plan。趋势非常明确:平台在把流量和套餐重心切向 V4 新代模型。
🔵 阿里云(百炼 / 记忆存储 / 网关调整)
📅 2026-06-18 02:49
官方公告称百炼国内站(北京)网关将在 6/23 晚至 6/24 凌晨升级,已建立连接可能被重置,建议调用端增加重试机制。对生产环境 AI API 调用来说,这是最需要提前防护的一条本周动态。
📅 2026-06-17 19:19
这是官方口径层面的产品命名调整,虽然不直接改变模型能力,但会影响控制台、账单、采购和内部汇报中的产品名称映射,属于平台治理型变化。
📅 2026-06-18 01:52
官方公告明确:6/25 起开始收取 Credit 费用,7/31 起再开始收取短期/长期记忆条数费与知识存储大小费。对基于记忆库、知识库存储的 Agent / RAG 应用,这是成本模型发生变化的直接信号。
🔴 华为云(本周无新增 AI 直接公告)
📅 2026-06-15 至 2026-06-22
按最近一周口径检查官方公告中心,未发现新的 ModelArts / MaaS / Agent 平台直接公告。因此这一周华为云在“官方公告”维度相对安静,没有像腾讯云、阿里云那样出现密集的模型/计费变更。
📅 2026-06-05
虽然不计入本周统计,但它仍是最近一轮最重要的公开 AI 动作:华为云发布 Agentic Infra、ModelArts Next、AgentArts 等系列新品。可作为理解华为云近阶段策略方向的背景参考,但不纳入“最近一周新增动态”计数。
✅ 本周对业务最有影响的 3 条
1) 腾讯云 GLM-5.2 上线 TokenHub / Token Plan
影响:模型选型 / 套餐抵扣 / 国产编程模型替换
如果你的报告重点跟踪国产模型供给,这条应被视为本周最关键的新增项之一。
2) 腾讯云明确 DeepSeek-V3.2 下线迁移时间表
影响:旧模型兼容 / 工作流稳定性 / SDK 配置
凡是仍显式写死 deepseek-v3.2 的场景,都需要在 7/16 前完成切换验证。
3) 阿里云百炼网关有损升级 + 记忆/知识存储进入收费阶段
影响:可用性 / 成本模型
一个影响稳定性,一个影响预算,两者都属于 Agent / RAG 生产环境需要提前处理的硬变化。