Provider profile

DeepInfra 计费模式与接口信息

适合需要 OpenAI 兼容入口和较多开源模型选择的开发者。

按量计费企业定制部分核验核验 2026-05-10

快速结论

DeepInfra 适合:开源模型推理、Embedding 与 Rerank、专属实例。不适合:只接受官方一手闭源模型接口的场景。

本站只整理公开来源。价格、免费额度、模型列表、区域和限额可能变化,接入前请再次打开来源链接核对。

基础信息

状态页
查看状态
接口兼容
OpenAI 兼容接口 / Dedicated endpoints / 模型目录
支持模型摘要
Llama / Qwen / DeepSeek / Mistral / Embedding / Rerank / Vision / Speech
文档完整度
较完整
风险提示
中等

计费模式说明

  • 计费模式:按量计费 / 企业定制
  • 最低门槛:公开来源未显示统一最低充值,需以账户页为准。
  • 免费额度:公开页面未显示统一免费额度,需以当前账户页为准。
  • 退款规则:退款规则需查看服务条款。
  • 限额说明:文档说明 OpenAI 兼容入口和专属实例,限额需在控制台确认。

隐私与数据处理提示

使用开源模型托管时,需要确认是否使用共享端点或专属实例。

数据处理与日志保留需查看隐私政策。

使用前检查清单

  • 用当前价格页确认输入、输出、缓存、工具或图片费用。
  • 用最小请求测试鉴权、模型名、流式输出、错误码和 usage 字段。
  • 确认 API Key 保存位置、请求日志、数据保留和第三方供应方边界。
  • 设置预算上限、速率限制和异常调用告警。

来源链接

相近服务

适合希望通过一个 OpenAI 兼容入口访问多模型的开发者。价格、供应方和可用模型变化较快,接入前应逐项核对模型页。

按量计费余额充值免费额度
接口
OpenAI 兼容接口 / 统一路由
核验
2026-05-10
风险
中等

适合开源模型、专属端点和批量推理场景。模型价格与限制需要在当前定价页和控制台共同核对。

按量计费余额或账单企业定制
接口
OpenAI 兼容接口 / Serverless API
核验
2026-05-10
风险
中等

计费页把 Serverless token、GPU 时长和训练 token 分开说明,适合需要比较不同部署方式的用户。

按量计费免费额度企业定制
接口
OpenAI 兼容接口 / Serverless inference
核验
2026-05-10
风险
较低

Groq

88

适合对延迟敏感、且模型列表与 GroqCloud 覆盖范围匹配的应用。

按量计费免费额度企业定制
接口
OpenAI 兼容接口 / Chat Completions
核验
2026-05-10
风险
较低

常见问题

DeepInfra 的价格是否实时更新?

不是。本站显示最近核验日期和来源入口,实际价格、模型可用性和免费额度应以服务方当前页面为准。

是否可以直接把生产请求切到这个服务?

建议先用低风险数据做最小调用测试,确认鉴权、模型名、限额、错误码、日志和费用字段,再逐步放量。

本站是否评价服务稳定性?

不评价。本站只整理可核验的公开信息和检查清单,不提供 uptime 排名或购买建议。