Model topic

Embedding 与 Rerank API Service怎么选

Embedding 和 Rerank 常用于 RAG 检索系统。成本不仅来自生成Model,还来自文档分块、批量嵌入、重排请求和重复索引。

EmbeddingRerank检索RAG

Provider List

Providers to Verify

11 entries · Updated 2026-05-10

适合需要 Qwen、DashScope 或阿里云账户体系的团队。费用项较多,接入前应分项核对。

Pay-as-you-goFree Tier预付资源
API
DashScope API / OpenAI Compatible模式
Verified
2026-05-10
Risk
Moderate

适合直接接入 Gemini。需要特别关注Free层、付费层和 Google Cloud 账单边界。

Pay-as-you-goFree TierEnterprise
API
Official Gemini API / Google AI Studio
Verified
2026-05-10
Risk
Moderate

与 Gemini Developer API 不同,Vertex AI 更偏Enterprise云场景。价格和数据边界需要按项目与区域核对。

Pay-as-you-go批量Billing预置资源
API
Google Cloud API / Model Garden
Verified
2026-05-10
Risk
Low

适合需要搜索增强能力的应用。费用不只来自Model token,也可能来自搜索请求。

Pay-as-you-go请求费用token Billing
API
Official Perplexity API / 搜索增强API
Verified
2026-05-10
Risk
Moderate

适合重视 Rerank、Embedding 和Enterprise检索的团队。Cost Estimator时要按端点分别计算。

Pay-as-you-goFree试用Enterprise
API
Official Cohere API / Chat API
Verified
2026-05-10
Risk
Low

适合试用Open-source Models和多供应方Reasoning。需要分清 Routed by Hugging Face 与自带供应方 Key 两种Method。

Pay-as-you-goFree Tier自带供应方 Key
API
Inference Providers / 自定义 Provider Key
Verified
2026-05-10
Risk
Moderate

适合需要 OpenAI CompatibleEndpoint和较多Open-source Models选择的开发者。

Pay-as-you-goEnterprise
API
OpenAI CompatibleAPI / Dedicated endpoints
Verified
2026-05-10
Risk
Moderate

适合直接使用 Mistral Model,尤其是对欧洲供应方和部署区域有要求的团队。

Pay-as-you-goSubscription PlanEnterprise
API
Official Mistral API / OpenAI Compatible需View当前文档
Verified
2026-05-10
Risk
Low

覆盖 LLM、Image、视频等多种 API,Billing单位差异较大,适合逐项Verified后使用。

Pay-as-you-go按 token按图片或视频
API
OpenAI CompatibleAPI / Model API
Verified
2026-05-10
Risk
Moderate

适合需要国内云厂商Model Service和Model接入点的团队。账单应按Model Service与上层应用分别核对。

Pay-as-you-go预付Model单元资源包
API
火山方舟 API / Model接入点
Verified
2026-05-10
Risk
Moderate

适合需要百度云和文心生态的团队。费用项与资源包规则需要在当前文档中逐项核对。

Pay-as-you-goFree Tier预付 tokens 包
API
千帆 API / Model Service
Verified
2026-05-10
Risk
Moderate

Key Checks Before Use

  • 确认向量维度和Model版本
  • 估算文档分块和批量嵌入成本
  • 核对 Rerank 每次请求的文档数量限制
  • 确认文档数据是否会被保存或训练使用

Embedding 与 Rerank API FAQ

Do these services always support the current model version?

Not necessarily. Model versions, regions, account permissions and free tiers may change. Check the provider's current docs and console before use.

Can I make a decision based solely on this list?

Not recommended. This list helps narrow options. Before integration, test requests, billing fields, limits, privacy policy and terms of service.