📚

用同一个 key 构建 embedding + LLM 的 RAG 流水线

向量化、检索、生成——JJAPI 让你在同一接口里调 OpenAI / Voyage / Cohere embedding 和任何 LLM。

立即开始 → 查看文档

embedding 和生成同一份账单

传统 RAG 让你 OpenAI 管 embedding、另一家管生成。JJAPI 统一两者——账单、审计日志、速率限制全部合一。

按索引混搭 embedding 模型

英文文档用 text-embedding-3-large，中文用 voyage-3-multilingual，跨语言检索用 cohere-embed-multilingual-v3——同一接口换模型即可。

重排提升召回

向量检索后用 /v1/rerank（Cohere / Voyage 重排器）对 top-50 重排。recall@5 通常提升 15-30%。

RAG 流水线最简示例

示例

from openai import OpenAI
client = OpenAI(base_url="https://api.jjapi.net/v1", api_key="sk-jjapi-...")

# 1. 向量化用户提问
q_vec = client.embeddings.create(
    model="text-embedding-3-large",
    input="退款政策是什么？",
).data[0].embedding

# 2.（你的向量数据库返回 top-5 段落）
chunks = vector_db.search(q_vec, k=5)

# 3. 用检索到的上下文生成答案
resp = client.chat.completions.create(
    model="claude-sonnet-4-6",
    messages=[
        {"role": "system", "content": "仅基于提供的上下文回答。"},
        {"role": "user", "content": f"上下文：\n{chunks}\n\n问题：退款政策？"},
    ],
)

立即开始 →

用同一个 key 构建 embedding + LLM 的 RAG 流水线

推荐模型

embedding 和生成同一份账单

按索引混搭 embedding 模型

重排提升召回

RAG 流水线最简示例