Y996 Tokens

Claude Code API Pricing

为高强度 AI 编程准备的模型额度方案

统一接入 Claude、Codex/GPT、Gemini 和国产模型。人民币余额计费,套餐决定通道优先级、服务支持和模型倍率,适合个人开发者、工作室和自动化 Agent 团队。

按月付 按年付 省 2 个月
100 人同时在线目标 3+ 热门模型冗余上游 CNY 余额和支付
Free

简单尝鲜,验证工具能不能跑通。

¥0 / 月
免费体验

套餐权益

  • 赠送少量体验额度
  • 适合首次接入测试
  • 不承诺高峰期优先级

服务支持

  • 全天可用
  • 社区支持
  • 公开文档和示例

模型倍率

Claude按量Codex按量国产模型按量
免费体验
Pro

每天 4-5 小时中度使用,适合个人开发者。

¥39 / 月
年付 ¥390

套餐权益

  • 共享稳定通道
  • 适合 Cursor / Cline 日常写代码
  • 小额套餐优先推荐

服务支持

  • 全天可用
  • 工单优先处理
  • 异常订单人工补单

模型倍率

Claude1.60xCodex1.50x国产模型1.00x
立即购买
Ultra

工作室、RPA、Agent 批量调用和团队共享。

顶级
¥299 / 月
年付 ¥2990

套餐权益

  • 独享 API Key 和高速通道
  • 可配置团队额度
  • 支持专属模型白名单

服务支持

  • 专属人工支持
  • 上线接入协助
  • 异常调用优先处理

模型倍率

Claude1.15xCodex1.15x国产模型0.80x
联系开通

Production Target

第一版按 100 人同时在线设计

页面展示的是套餐,真正承载在线用户的是 NewAPI、上游冗余、支付回调和监控。100 人同时在线不是靠单一上游硬扛,而是通过分组、限流、failover 和缓存把风险拆开。

NewAPI 底座

用户、Token、充值、日志和模型倍率交给 NewAPI,官网只负责获客和转化。

多上游冗余

Claude / GPT / Gemini 至少 2-3 个渠道,SiliconFlow 承接国产高频调用。

限流与分组

Free / Pro / Max / Ultra 分组设置 RPM、TPM、倍率和高峰期优先级。

监控与补单

支付回调、余额异常、上游失败和毛利波动都需要后台可见并能人工处理。

计费说明

套餐负责额度、通道优先级和服务支持;模型实际扣费仍按 NewAPI 的模型倍率和分组价格计算。上线后充值、套餐购买、兑换码和人工补单统一交给 NewAPI 支付系统。

进入控制台购买套餐 →

Model Multipliers

模型倍率

国外最新大模型更贵,国产模型成本低、利润空间更大。这里给用户看的是清晰可理解的档位,实际倍率在 NewAPI 分组里配置。

模型套餐倍率说明
Anthropic Claude1.15x - 1.60x国外最新模型,稳定渠道更贵,低价渠道做补充。
OpenAI Codex / GPT1.15x - 1.50x代码、Agent、工具调用重点测试 failover。
Google Gemini1.20x - 1.45x大上下文和多模态补充,按实测模型名开放。
DeepSeek / Qwen / 豆包0.80x - 1.00x国产模型成本低,适合做默认推荐和利润主力。
最低充值 ¥10.00,余额按 CNY 扣费。

文本

Claude、GPT、Gemini、DeepSeek、Qwen、豆包、Kimi、GLM。

代码

Claude Sonnet、GPT Codex、Qwen Coder、DeepSeek Coder,重点服务 Claude Code / Cursor。

图像

Flux、GPT Image、通义万相、豆包图像,生产版放到 NewAPI 渠道里开放。

视频 / Embedding

Kling / 可灵后续扩展;Embedding 用 Qwen、BGE 等国产低成本线路。

按量模型单价

模型线路输入价格输出价格最低毛利
yu-chat-autoAutomatic chat route with margin protection.auto¥1.6000 / M tokens¥5.5000 / M tokens30%
yu-code-autoAutomatic coding route across Claude/GPT/Qwen/DeepSeek.auto¥2.2000 / M tokens¥8.8000 / M tokens30%
yu-jsonStructured output route.auto¥0.8000 / M tokens¥2.4000 / M tokens50%
claude-haiku-3-5Anthropic Claude Haiku 3.5 — fast and cheap.economy¥3.0000 / M tokens¥15.0000 / M tokens20%
claude-sonnet-economyClaude-like low-cost line for AI coding.economy¥4.2000 / M tokens¥20.0000 / M tokens15%
deepseek-chatLow-cost Chinese and general chat.economy¥0.6000 / M tokens¥1.8000 / M tokens40%
doubao-fastFast Chinese route.economy¥0.5000 / M tokens¥1.5000 / M tokens40%
gemini-2.5-flashGoogle Gemini 2.5 Flash — very fast, free tier available.economy¥1.4000 / M tokens¥5.6000 / M tokens20%
gemini-flashFast Gemini-compatible route.economy¥0.9000 / M tokens¥3.6000 / M tokens20%
gpt-4o-miniOpenAI GPT-4o Mini — fast and affordable.economy¥1.4000 / M tokens¥5.6000 / M tokens20%
gpt-economyGPT-compatible economy line.economy¥2.8000 / M tokens¥12.0000 / M tokens15%
claude-sonnet-4-5Anthropic Claude Sonnet 4.5 — balanced performance.stable¥28.0000 / M tokens¥140.0000 / M tokens20%
claude-sonnet-stableClaude-like stable line with failover.stable¥5.6000 / M tokens¥26.0000 / M tokens25%
deepseek-reasonerReasoning route.stable¥1.2000 / M tokens¥4.8000 / M tokens40%
gemini-2.5-proGoogle Gemini 2.5 Pro — premium quality.stable¥18.0000 / M tokens¥72.0000 / M tokens20%
gpt-4oOpenAI GPT-4o flagship model.stable¥22.0000 / M tokens¥88.0000 / M tokens20%
gpt-stableGPT-compatible stable line.stable¥4.5000 / M tokens¥18.0000 / M tokens25%
qwen-coderCoding route via Qwen Coder.stable¥0.8000 / M tokens¥2.6000 / M tokens40%
qwen-plusQwen stable Chinese route.stable¥0.7000 / M tokens¥2.2000 / M tokens40%