这份笔记偏向大模型本身的分类、选型、价格与常用信息来源,尽量把“模型怎么选、钱怎么算、去哪里查”单独整理出来,主要回答几个问题:“该选什么模型、成本大概怎样、去哪里查资料”。

这篇笔记的内容具有明显的时效性,当前原始信息时间是 2026 年 3 月,我并没有精力去持续更新。

主要基于 OpenRouter 排行榜,表中的数据只是作为大致参考,不保证准确性,同一个表格中的顺序也没有意义,个人觉得差不多都属于同一梯队或者同一类型。

一、大模型的基本分类

大模型可以按照是否开源进行分类:

  • 第一类,闭源模型,只能通过自家提供的产品或 API 访问。
  • 第二类,开放权重模型(open-weights model),公开模型权重以及主要架构信息,但训练过程和训练源码并没有公开。
  • 第三类,完全开源模型,其他用户可以尝试复现。

目前能力最强的大模型大多属于闭源模型,其完整架构和训练细节通常不会公开。市场上较为主流的开源模型多属于开放权重模型,例如 DeepSeek、Qwen 等,公开模型权重并允许第三方部署,但训练数据和训练过程通常不会完全公开。完全开源、可以复现训练过程的大模型主要来自研究社区,其规模和能力通常与前两类模型存在一定差距。

二、选型时主要看什么

关于大模型的选择,可以优先考虑以下维度:

  • 模型定位:通用模型、编程模型、数学模型、推理模型、多模态模型。
  • 任务复杂度:简单任务与复杂任务对模型能力要求差异很大。对于简单任务,目前多数主流模型都能满足需求,而且往往还能通过免费额度或免费版本使用;对于复杂任务,对模型要求更高,有时必须为此付费,而且通常是按量付费。
  • 输入输出形式:文本、多模态、图像、音频、视频。
  • 模型规模:决定能力上限,也直接影响训练和部署资源需求。
  • 上下文窗口长度:影响长对话、长文档分析、编程等复杂任务。目前的顶级大模型,例如 GPT-5.4、Claude Opus 4.6、Gemini 3.1,可以做到最多 100 万 tokens 的上下文窗口,主流大模型,例如 Kimi K2.5、MiniMax M2.5,大概处于 20 万 tokens 左右上下文窗口的水平。
  • 产品形态:是通过 Web、API、聚合平台,还是通过订阅计划来使用。

补充:

  • 即使大模型厂商公开了某个模型的权重,不同平台部署的版本和体验也可能并不相同,因为推理系统、参数配置以及微调版本都会影响最终效果。
  • 多模态能力也需要单独考虑。现在很多模型都强调图片、音频、视频、文本的统一输入输出能力,但即使是顶级模型,也往往只是部分完成这个目标。由于多模态模型训练需要大量非文本数据,这方面大厂通常更有优势。
  • 这些模型的命名规则没有统一规定,命名非常混乱,并且需要注意的是,fast 一类的后缀通常不是指阉割版,而是加速版,因此对应的价格也会更高。

常见场景下可以粗略这样理解:

  • 日常聊天、搜索和轻度内容生成:多数主流通用模型都够用,优先考虑价格和可用性。
  • 编程或 agent 使用:更看重代码能力、工具调用稳定性和长上下文表现。
  • 长文档分析:更看重上下文窗口和检索、缓存等配套能力。
  • 低成本批量调用:更看重输入输出单价、缓存价格和平台稳定性。

三、主流厂商及其主力模型

国外顶级

厂商 主力模型 备注
OpenAI GPT-5.4 OpenRouter
Anthropic Claude 4.6 OpenRouter
Google Gemini Gemini 3.1 OpenRouter

国外其它大厂

厂商 主力模型 备注
xAI Grok Grok 4.1 OpenRouter
Meta Llama 4 OpenRouter

国内大模型厂商

厂商 主力模型 备注
稀宇科技 (MiniMax) MiniMax M2.5 OpenRouter
深度求索 (Deepseek) DeepSeek-V3.2 (DeepSeek-V4 ?) OpenRouter
月之暗面 (Moonshotai) Kimi K2.5 OpenRouter
阶跃星辰 (Stepfun) Step 3.5 OpenRouter
智谱 (Z.ai, BigModel) GLM-5 OpenRouter

国内大厂

厂商 主力模型 备注
阿里巴巴 Qwen3.5 OpenRouter
字节跳动 豆包2.0, Seedance 2.0 OpenRouter

四、价格与付费方式

4.1 API token 计费

除了订阅制(Coding Plan),通过 API 调用大模型对话一般基于 token 计费,单位一般为每百万 tokens(1M)多少美元或人民币。有的模型对输入 token 和输出 token 的计费价格不同,输出通常比输入贵很多;有的模型会存在阶梯价格,如果缓存命中,则会降低价格。

为了给出 API 的大致价位,下面列出一些代表性的文本模型价格,数据来源是 OpenRouter

国外顶级厂商的主力大模型价格较高:

模型 发布时间 输入价格 (每百万Tokens) 输出价格 (每百万Tokens)
OpenAI: GPT-5.4 Mar 5, 2026 $2.5 $15
OpenAI: GPT-5.4 Pro Mar 5, 2026 $30 $180
Anthropic: Claude Sonnet 4.6 Feb 17, 2026 $3 $15
Anthropic: Claude Opus 4.6 Feb 4, 2026 $5 $25
Google: Gemini 3.1 Pro Preview Feb 19, 2026 $2 $12

国外其它大厂的非主力模型价格相对更低:

模型 发布时间 输入价格 (每百万Tokens) 输出价格 (每百万Tokens)
xAI: Grok 4.1 Fast Nov 19, 2025 $0.2 $0.5
Meta: Llama 4 Maverick Apr 5, 2025 $0.15 $0.6

国内大模型厂商的模型价格则便宜很多:

模型 发布时间 输入价格 (每百万Tokens) 输出价格 (每百万Tokens)
MiniMax: MiniMax M2.5 Feb 12, 2026 $0.295 $1.20
DeepSeek: DeepSeek V3.2 Dec 1, 2025 $0.25 $0.40
MoonshotAI: Kimi K2.5 Jan 27, 2026 $0.45 $2.20
StepFun: Step 3.5 Flash Jan 29, 2026 $0.10 $0.30
Z.ai: GLM 5 Feb 11, 2026 $0.80 $2.56

国内大厂的模型价格也差不多:

模型 发布时间 输入价格 (每百万Tokens) 输出价格 (每百万Tokens)
Qwen: Qwen3.5 Plus 2026-02-15 Feb 16, 2026 $0.26 $1.56
Qwen: Qwen3.5 397B A17B Feb 16, 2026 $0.39 $2.34
ByteDance Seed: Seed-2.0-Mini Feb 26, 2026 $0.10 $0.40

小结:对于按 token 计费的大模型,国外顶级模型的价格约为输入 $2-5、输出 $10-20;国内模型通常低得多。

补充说明:

  • 这里只是文本类模型,涉及图像和视频输入输出时,价格通常更高,而且 token 消耗速度也快得多。
  • 对于大模型的推理部分有时也可能被计费,有的甚至直接按照输出价格计费。
  • Anthropic 的模型描述词比较特殊:Haiku 是轻量版,Sonnet 是中等或默认档,Opus 是全能版。
  • 这些大模型官网也公布了 API 价格,与 OpenRouter 上的价格通常大体一致:

4.2 国外订阅套餐

OpenAI: 通用订阅

  • ChatGPT Go: $8
  • ChatGPT Plus: $20
  • ChatGPT Pro: $200

Anthropic: 纯粹的编程向订阅,限制于 Claude Code 中应用。

  • Claude Pro: $17
  • Claude Max: $100

Google: AI 全家桶服务

  • Google AI Plus: $8
  • Google AI Pro: $20
  • Google AI Ultra: $250

注:

  • 这些厂商的订阅套餐通常只能在自家的 Web 或应用中使用,与它们自家 API 的按量付费相互独立。
  • API 的价格通常比订阅制显得更贵。
  • Google 可能会有学生免费一年的优惠,但也可能没有。

4.3 国内 Coding Plan

一些国内厂商提供了面向编程开发者的订阅 API 服务,即 Coding Plan:不是按量付费,而是订阅制付费。

名称 价格 模型 备注
智谱 Coding Plan Lite 49元/月,Pro 149元/月,Max 469元/月 自家模型 GLM 系列 Lite 性价比很低,甚至不提供 GLM-5
MiniMax Coding Plan Starter 29元/月,Plus 49元/月,Max 119元/月 自家模型 MiniMax 系列 极速版套餐价格翻倍,Starter 额度偏少,偶尔使用
Kimi Coding Plan Andante 49元/月,Moderato 99元/月,Allegretto 199元/月 自家模型 Kimi 系列 性价比低
字节跳动 - 火山引擎 - 方舟 Coding Plan Lite 40 元/月(首月优惠10元以内),Pro 200元/月 Doubao、Kimi、GLM等
阿里云百炼 Coding Plan Lite 40 元/月(首月优惠10元以内),Pro 200元/月 Qwen、GLM、Kimi、MiniMax等

补充:

  • 这些厂商大多采用“5 小时请求数 + 周请求数 + 月请求数”的三重限制方式。对于请求数,有的按 API 调用次数计算,有的按 prompts 计算,对长对话会更友好。
  • 这些 Coding Plan 提供的专用 API,与聚合平台中按量付费的通用 API 并不相同。

五、常用网站

5.1 API 聚合平台

这类平台提供统一接口,可以调用不同厂商的大模型 API,按量付费,不同模型价格也不一样。

补充:

  • OpenRouter 在账户充值后,可以调用部分 free-tier 模型,并提供一定额度的免费 API 调用,还可以直接使用 openrouter/free,此时 OpenRouter 会自动选择合适的免费模型,适合简单测试。
  • OpenRouter 对同一个模型还提供不同后缀,例如 Nitro 更偏速度优先,Exacto 更偏输出质量优先。

5.2 模型社区

这类平台主要用于发布、下载和共享开源模型。

5.3 模型评测与排行榜

这类平台用于对不同模型能力进行公开评测。