按模型类型选择计算器
推理模型、文本模型、音频模型、图像模型和视频模型的计费逻辑不同,拆分页面后可以按真实使用场景扩展。
AI模型价格
价格信息进入独立内容分类,后续可以按推理模型、文本模型、音频、图像和视频模型逐步补充。
最新指南
围绕 Token 预算、缓存策略、模型选择和成本优化沉淀内容。
降低 AI API 成本的 7 个实用方法
整理降低 AI API 成本的 7 个实用方法,包括缩短上下文、控制输出长度、使用缓存、模型分层、批处理、限流和监控异常请求,适合上线后持续优化模型调用费用,并通过请求配额、账单监控、失败重试分析和高成本场景拆分减少无效 token 消耗。
阅读全文AI 应用 Token 预算模板:上线前怎么填
提供一个实用的 AI 应用 Token 预算模板,帮助团队在上线前填写请求量、输入 token、输出 token、缓存比例、模型单价和安全余量,快速得到月度 API 成本估算,并在上线后用真实请求量、平均 token、缓存命中率和账单金额持续校准预算。
阅读全文如何选择低成本 AI 模型而不牺牲效果
从任务类型、输入输出长度、上下文需求、缓存能力和失败成本出发选择低成本 AI 模型,帮助开发者在 Claude、GPT、Gemini、DeepSeek 等模型之间做更实际的预算取舍,并结合成功率、重试率、人工审核时间和真实样本测试,避免只按单价选择模型。
阅读全文常见问题
这些价格准确吗?
价格来自官方模型价格页面,但当前阶段仍以站点结构和内容承载为主。生产环境预算请务必以官方后台为准。
我的提示词会被发送出去吗?
不会。所有计算都在你的浏览器中运行。你的 Token 数量和提示词永远不会离开你的设备。
什么是缓存命中?
缓存命中是指输入 Token 匹配了之前已缓存的上下文。供应商通常会对缓存命中收取更低价格。
为什么要区分推理模型和文本模型?
国内使用语境里,推理模型通常指复杂推理、代码、Agent 和长上下文任务;文本模型更适合摘要、翻译、内容生成和批处理。两类场景的成本结构和预算关注点不同。
如何报告错误的模型价格?
请使用报告价格错误页面来标记不正确的价格。