J JJAPI
📚

用同一个 key 构建 embedding + LLM 的 RAG 流水线

向量化、检索、生成——JJAPI 让你在同一接口里调 OpenAI / Voyage / Cohere embedding 和任何 LLM。

推荐模型

点击任意模型可查看当前 ID 和发布日期,参见 实时模型目录

embedding 和生成同一份账单

传统 RAG 让你 OpenAI 管 embedding、另一家管生成。JJAPI 统一两者——账单、审计日志、速率限制全部合一。

按索引混搭 embedding 模型

英文文档用 text-embedding-3-large,中文用 voyage-3-multilingual,跨语言检索用 cohere-embed-multilingual-v3——同一接口换模型即可。

重排提升召回

向量检索后用 /v1/rerank(Cohere / Voyage 重排器)对 top-50 重排。recall@5 通常提升 15-30%。

RAG 流水线最简示例

示例
from openai import OpenAI
client = OpenAI(base_url="https://api.jjapi.net/v1", api_key="sk-jjapi-...")

# 1. 向量化用户提问
q_vec = client.embeddings.create(
    model="text-embedding-3-large",
    input="退款政策是什么?",
).data[0].embedding

# 2.(你的向量数据库返回 top-5 段落)
chunks = vector_db.search(q_vec, k=5)

# 3. 用检索到的上下文生成答案
resp = client.chat.completions.create(
    model="claude-3-5-sonnet",
    messages=[
        {"role": "system", "content": "仅基于提供的上下文回答。"},
        {"role": "user", "content": f"上下文:\n{chunks}\n\n问题:退款政策?"},
    ],
)
立即开始 →