📚
用同一个 key 构建 embedding + LLM 的 RAG 流水线
向量化、检索、生成——JJAPI 让你在同一接口里调 OpenAI / Voyage / Cohere embedding 和任何 LLM。
推荐模型
text-embedding-3-large →
通用 embedding 之最——3072 维,准确率顶级。
Voyage 3 系列
新一代模型,多语言和领域检索更强。
Claude Sonnet (最新) →
长上下文综合检索内容能力极佳。
点击任意模型可查看当前 ID 和发布日期,参见 实时模型目录。
embedding 和生成同一份账单
传统 RAG 让你 OpenAI 管 embedding、另一家管生成。JJAPI 统一两者——账单、审计日志、速率限制全部合一。
按索引混搭 embedding 模型
英文文档用 text-embedding-3-large,中文用 voyage-3-multilingual,跨语言检索用 cohere-embed-multilingual-v3——同一接口换模型即可。
重排提升召回
向量检索后用 /v1/rerank(Cohere / Voyage 重排器)对 top-50 重排。recall@5 通常提升 15-30%。
RAG 流水线最简示例
示例
from openai import OpenAI
client = OpenAI(base_url="https://api.jjapi.net/v1", api_key="sk-jjapi-...")
# 1. 向量化用户提问
q_vec = client.embeddings.create(
model="text-embedding-3-large",
input="退款政策是什么?",
).data[0].embedding
# 2.(你的向量数据库返回 top-5 段落)
chunks = vector_db.search(q_vec, k=5)
# 3. 用检索到的上下文生成答案
resp = client.chat.completions.create(
model="claude-3-5-sonnet",
messages=[
{"role": "system", "content": "仅基于提供的上下文回答。"},
{"role": "user", "content": f"上下文:\n{chunks}\n\n问题:退款政策?"},
],
)