# DS2API 接口文档 语言 / Language: [中文](API.md) | [English](API.en.md) 本文档描述当前 Go 代码库的实际 API 行为。 文档导航:[总览](README.MD) / [架构说明](docs/ARCHITECTURE.md) / [部署指南](docs/DEPLOY.md) / [测试指南](docs/TESTING.md) --- ## 目录 - [基础信息](#基础信息) - [配置最佳实践](#配置最佳实践) - [鉴权规则](#鉴权规则) - [路由总览](#路由总览) - [健康检查](#健康检查) - [OpenAI 兼容接口](#openai-兼容接口) - [Claude 兼容接口](#claude-兼容接口) - [Gemini 兼容接口](#gemini-兼容接口) - [Admin 接口](#admin-接口) - [错误响应格式](#错误响应格式) - [cURL 示例](#curl-示例) --- ## 基础信息 | 项目 | 说明 | | --- | --- | | Base URL | `http://localhost:5001` 或你的部署域名 | | 默认 Content-Type | `application/json` | | 健康检查 | `GET /healthz`、`GET /readyz` | | CORS | 已启用(统一覆盖 `/v1/*`、`/anthropic/*`、`/v1beta/models/*`、`/admin/*`;浏览器有 `Origin` 时回显该 Origin,否则为 `*`;默认允许 `Content-Type`, `Authorization`, `X-API-Key`, `X-Ds2-Target-Account`, `X-Ds2-Source`, `X-Vercel-Protection-Bypass`, `X-Goog-Api-Key`, `Anthropic-Version`, `Anthropic-Beta`,并会放行预检里声明的第三方请求头,如 `x-stainless-*`;Vercel 上 `/v1/chat/completions` 的 Node Runtime 也对齐相同行为;内部专用头 `X-Ds2-Internal-Token` 仍被拦截) | ### 3.0 接口适配层说明 - OpenAI / Claude / Gemini 三套协议已统一挂在同一 `chi` 路由树上,由 `internal/server/router.go` 负责装配。 - 适配器层职责收敛为:**请求归一化 → DeepSeek 调用 → 协议形态渲染**,减少历史版本中“同能力多处实现”的分叉。 - Tool Calling 的解析策略在 Go 与 Node Runtime 间保持一致:推荐模型输出 DSML 外壳 `<|DSML|tool_calls>` → `<|DSML|invoke name="...">` → `<|DSML|parameter name="...">`;兼容层也接受 DSML wrapper 别名 ``、`<|tool_calls>`、`<|tool_calls>`、常见 DSML 分隔符漏写形态(如 `<|DSML tool_calls>`)、`DSML` 与工具标签名黏连的常见 typo(如 ``),以及旧式 canonical XML `` → `` → ``。实现上采用窄容错结构扫描:只有 `tool_calls` wrapper 或可修复的缺失 opening wrapper 会进入工具路径,裸 `` 不计为已支持语法;流式场景继续执行防泄漏筛分。若参数体本身是合法 JSON 字面量(如 `123`、`true`、`null`、数组或对象),会按结构化值输出,不再一律当作字符串;若 CDATA 偶发漏闭合,则会在最终 parse / flush 恢复阶段做窄修复,尽量保住已完整包裹的外层工具调用。 - `Admin API` 将配置与运行时策略分开:`/admin/config*` 管静态配置,`/admin/settings*` 管运行时行为。 --- ## 配置最佳实践 推荐把 `config.json` 作为唯一配置源: ```bash cp config.example.json config.json # 编辑 config.json(keys/accounts) ``` 按部署方式使用: - 本地运行:直接读取 `config.json` - Docker / Vercel:从 `config.json` 生成 Base64,填入 `DS2API_CONFIG_JSON`,也可以直接填原始 JSON ```bash DS2API_CONFIG_JSON="$(base64 < config.json | tr -d '\n')" ``` Vercel 一键部署可先只填 `DS2API_ADMIN_KEY`,部署后在 `/admin` 导入配置,再通过 “Vercel 同步” 写回环境变量。 --- ## 鉴权规则 ### 业务接口(`/v1/*`、`/anthropic/*`、`/v1beta/models/*`) 支持两种传参方式: | 方式 | 示例 | | --- | --- | | Bearer Token | `Authorization: Bearer ` | | API Key Header | `x-api-key: `(无 `Bearer` 前缀) | | Gemini 兼容 | `x-goog-api-key: ` 或 `?key=` / `?api_key=` | **鉴权行为**: - token 在 `config.keys` 中 → **托管账号模式**,自动轮询选择账号 - token 不在 `config.keys` 中 → **直通 token 模式**,直接作为 DeepSeek token 使用 **可选请求头**:`X-Ds2-Target-Account: ` — 指定使用某个托管账号。 Gemini 兼容客户端还可以使用 `x-goog-api-key`、`?key=` 或 `?api_key=` 作为凭据来源。 ### Admin 接口(`/admin/*`) | 端点 | 鉴权 | | --- | --- | | `POST /admin/login` | 无需鉴权 | | `GET /admin/verify` | `Authorization: Bearer `(仅 JWT) | | 其他 `/admin/*` | `Authorization: Bearer ` 或 `Authorization: Bearer `(直传管理密钥) | --- ## 路由总览 | 方法 | 路径 | 鉴权 | 说明 | | --- | --- | --- | --- | | GET | `/healthz` | 无 | 存活探针 | | HEAD | `/healthz` | 无 | 存活探针(无响应体) | | GET | `/readyz` | 无 | 就绪探针 | | HEAD | `/readyz` | 无 | 就绪探针(无响应体) | | GET | `/v1/models` | 无 | OpenAI 模型列表 | | GET | `/v1/models/{id}` | 无 | OpenAI 单模型查询(支持 alias 入参) | | POST | `/v1/chat/completions` | 业务 | OpenAI 对话补全 | | POST | `/v1/responses` | 业务 | OpenAI Responses 接口(流式/非流式) | | GET | `/v1/responses/{response_id}` | 业务 | 查询已生成 response(内存 TTL) | | POST | `/v1/embeddings` | 业务 | OpenAI Embeddings 接口 | | POST | `/v1/files` | 业务 | OpenAI Files 上传(multipart/form-data) | | GET | `/anthropic/v1/models` | 无 | Claude 模型列表 | | POST | `/anthropic/v1/messages` | 业务 | Claude 消息接口 | | POST | `/anthropic/v1/messages/count_tokens` | 业务 | Claude token 计数 | | POST | `/v1/messages` | 业务 | Claude 消息快捷路径 | | POST | `/messages` | 业务 | Claude 消息快捷路径 | | POST | `/v1/messages/count_tokens` | 业务 | Claude token 计数快捷路径 | | POST | `/messages/count_tokens` | 业务 | Claude token 计数快捷路径 | | POST | `/v1beta/models/{model}:generateContent` | 业务 | Gemini 非流式 | | POST | `/v1beta/models/{model}:streamGenerateContent` | 业务 | Gemini 流式 | | POST | `/v1/models/{model}:generateContent` | 业务 | Gemini 非流式兼容路径 | | POST | `/v1/models/{model}:streamGenerateContent` | 业务 | Gemini 流式兼容路径 | | POST | `/admin/login` | 无 | 管理登录 | | GET | `/admin/verify` | JWT | 校验管理 JWT | | GET | `/admin/vercel/config` | Admin | 读取 Vercel 预配置 | | GET | `/admin/config` | Admin | 读取配置(脱敏) | | POST | `/admin/config` | Admin | 更新配置 | | GET | `/admin/settings` | Admin | 读取运行时设置 | | PUT | `/admin/settings` | Admin | 更新运行时设置(热更新) | | POST | `/admin/settings/password` | Admin | 更新 Admin 密码并使旧 JWT 失效 | | POST | `/admin/config/import` | Admin | 导入配置(merge/replace) | | GET | `/admin/config/export` | Admin | 导出完整配置(含 `config`/`json`/`base64`) | | POST | `/admin/keys` | Admin | 添加 API key(可附 name/remark) | | PUT | `/admin/keys/{key}` | Admin | 更新 API key 备注信息 | | DELETE | `/admin/keys/{key}` | Admin | 删除 API key | | GET | `/admin/proxies` | Admin | 代理列表 | | POST | `/admin/proxies` | Admin | 添加代理 | | PUT | `/admin/proxies/{proxyID}` | Admin | 更新代理(留空 password 表示保留原密码) | | DELETE | `/admin/proxies/{proxyID}` | Admin | 删除代理(自动解绑引用该代理的账号) | | POST | `/admin/proxies/test` | Admin | 测试代理连通性 | | GET | `/admin/accounts` | Admin | 分页账号列表 | | POST | `/admin/accounts` | Admin | 添加账号 | | PUT | `/admin/accounts/{identifier}` | Admin | 更新账号 name/remark | | DELETE | `/admin/accounts/{identifier}` | Admin | 删除账号 | | PUT | `/admin/accounts/{identifier}/proxy` | Admin | 为账号绑定/解绑代理 | | GET | `/admin/queue/status` | Admin | 账号队列状态 | | POST | `/admin/accounts/test` | Admin | 测试单个账号 | | POST | `/admin/accounts/test-all` | Admin | 测试全部账号 | | POST | `/admin/accounts/sessions/delete-all` | Admin | 删除某账号的全部会话 | | POST | `/admin/import` | Admin | 批量导入 keys/accounts | | POST | `/admin/test` | Admin | 测试当前 API 可用性 | | POST | `/admin/dev/raw-samples/capture` | Admin | 直接发起一次请求并保存为 raw sample | | GET | `/admin/dev/raw-samples/query` | Admin | 按问题关键词查询当前内存抓包链 | | POST | `/admin/dev/raw-samples/save` | Admin | 把命中的内存抓包链保存为 raw sample | | POST | `/admin/vercel/sync` | Admin | 同步配置到 Vercel | | GET | `/admin/vercel/status` | Admin | Vercel 同步状态 | | POST | `/admin/vercel/status` | Admin | Vercel 同步状态 / 草稿对比 | | GET | `/admin/export` | Admin | 导出配置 JSON/Base64 | | GET | `/admin/dev/captures` | Admin | 查看本地抓包记录 | | DELETE | `/admin/dev/captures` | Admin | 清空本地抓包记录 | | GET | `/admin/chat-history` | Admin | 查看服务器端对话记录 | | DELETE | `/admin/chat-history` | Admin | 清空服务器端对话记录 | | GET | `/admin/chat-history/{id}` | Admin | 查看单条服务器端对话记录 | | DELETE | `/admin/chat-history/{id}` | Admin | 删除单条服务器端对话记录 | | PUT | `/admin/chat-history/settings` | Admin | 更新对话记录保留条数 | | GET | `/admin/version` | Admin | 查询当前版本与最新 Release | --- ## 健康检查 ### `GET /healthz` ```json {"status": "ok"} ``` ### `GET /readyz` ```json {"status": "ready"} ``` --- ## OpenAI 兼容接口 ### `GET /v1/models` 无需鉴权。返回当前支持的 DeepSeek 原生模型列表。 **响应示例**: ```json { "object": "list", "data": [ {"id": "deepseek-v4-flash", "object": "model", "created": 1677610602, "owned_by": "deepseek", "permission": []}, {"id": "deepseek-v4-flash-nothinking", "object": "model", "created": 1677610602, "owned_by": "deepseek", "permission": []}, {"id": "deepseek-v4-pro", "object": "model", "created": 1677610602, "owned_by": "deepseek", "permission": []}, {"id": "deepseek-v4-pro-nothinking", "object": "model", "created": 1677610602, "owned_by": "deepseek", "permission": []}, {"id": "deepseek-v4-flash-search", "object": "model", "created": 1677610602, "owned_by": "deepseek", "permission": []}, {"id": "deepseek-v4-flash-search-nothinking", "object": "model", "created": 1677610602, "owned_by": "deepseek", "permission": []}, {"id": "deepseek-v4-pro-search", "object": "model", "created": 1677610602, "owned_by": "deepseek", "permission": []}, {"id": "deepseek-v4-pro-search-nothinking", "object": "model", "created": 1677610602, "owned_by": "deepseek", "permission": []}, {"id": "deepseek-v4-vision", "object": "model", "created": 1677610602, "owned_by": "deepseek", "permission": []}, {"id": "deepseek-v4-vision-nothinking", "object": "model", "created": 1677610602, "owned_by": "deepseek", "permission": []}, {"id": "deepseek-v4-vision-search", "object": "model", "created": 1677610602, "owned_by": "deepseek", "permission": []}, {"id": "deepseek-v4-vision-search-nothinking", "object": "model", "created": 1677610602, "owned_by": "deepseek", "permission": []} ] } ``` > 说明:`/v1/models` 返回的是规范化后的 DeepSeek 原生模型 ID;常见 alias 仅用于请求入参解析,不会在该接口中单独展开返回。带 `-nothinking` 后缀的模型表示无论请求里是否显式开启 thinking / reasoning,都会强制关闭思考输出。 ### 模型 alias 解析策略 对 `chat` / `responses` / `embeddings` 的 `model` 字段采用“宽进严出”: 1. 先匹配 DeepSeek 原生模型。 2. 再匹配 `model_aliases` 精确映射。 3. 如果请求名以 `-nothinking` 结尾,则在最终解析出的规范模型上追加对应的无思考变体。 4. 未命中时按模型家族规则回退(如 `o*`、`gpt-*`、`claude-*`)。 5. 仍未命中则返回 `invalid_request_error`。 当前内置默认 alias 来自 `internal/config/models.go`,`config.model_aliases` 会在运行时覆盖或补充同名映射。节选: - OpenAI / Codex:`gpt-4o`、`gpt-4.1`、`gpt-5`、`gpt-5.5`、`gpt-5-codex`、`gpt-5.3-codex`、`codex-mini-latest` - OpenAI reasoning:`o1`、`o3`、`o3-deep-research`、`o4-mini` - Claude:`claude-opus-4-6`、`claude-sonnet-4-6`、`claude-haiku-4-5`、`claude-3-5-sonnet-latest` - Gemini:`gemini-2.5-pro`、`gemini-2.5-flash`、`gemini-pro-vision` - 其他兼容族:`llama-*`、`qwen-*`、`mistral-*`、`command-*` 会按家族启发式回退 上述 alias 若在请求名后追加 `-nothinking` 后缀,也会映射到对应的强制关闭 thinking 版本。 退役历史模型(如 `claude-1.*`、`claude-2.*`、`claude-instant-*`、`gpt-3.5*`)会被显式拒绝。 ### `POST /v1/chat/completions` **请求头**: ```http Authorization: Bearer your-api-key Content-Type: application/json ``` **请求体**: | 字段 | 类型 | 必填 | 说明 | | --- | --- | --- | --- | | `model` | string | ✅ | 支持 DeepSeek 原生模型 + 常见 alias(如 `gpt-5.5`、`gpt-5.4-mini`、`gpt-5.3-codex`、`o3`、`claude-opus-4-6`、`claude-sonnet-4-6`、`gemini-2.5-pro`、`gemini-2.5-flash` 等);若模型名带 `-nothinking` 后缀,则强制关闭 thinking / reasoning | | `messages` | array | ✅ | OpenAI 风格消息数组 | | `stream` | boolean | ❌ | 默认 `false` | | `tools` | array | ❌ | Function Calling 定义 | | `temperature` 等 | any | ❌ | 兼容透传字段(最终效果由上游决定) | #### 非流式响应 ```json { "id": "", "object": "chat.completion", "created": 1738400000, "model": "deepseek-v4-pro", "choices": [ { "index": 0, "message": { "role": "assistant", "content": "最终回复", "reasoning_content": "思考内容(开启 thinking 时)" }, "finish_reason": "stop" } ], "usage": { "prompt_tokens": 10, "completion_tokens": 20, "total_tokens": 30, "completion_tokens_details": { "reasoning_tokens": 5 } } } ``` #### 流式响应(`stream=true`) SSE 格式:每段为 `data: \n\n`,结束为 `data: [DONE]`。 ```text data: {"id":"...","object":"chat.completion.chunk","choices":[{"delta":{"role":"assistant"},"index":0}]} data: {"id":"...","object":"chat.completion.chunk","choices":[{"delta":{"reasoning_content":"..."},"index":0}]} data: {"id":"...","object":"chat.completion.chunk","choices":[{"delta":{"content":"..."},"index":0}]} data: {"id":"...","object":"chat.completion.chunk","choices":[{"delta":{},"index":0,"finish_reason":"stop"}],"usage":{...}} data: [DONE] ``` **字段说明**: - 首个 delta 包含 `role: assistant` - 开启 thinking 时会输出 `delta.reasoning_content` - 普通文本输出 `delta.content` - 最后一段包含 `finish_reason` 和 `usage` - token 计数优先透传上游 DeepSeek SSE(如 `accumulated_token_usage` / `token_usage`);仅在上游缺失时回退本地估算 #### Tool Calls 当请求中含 `tools` 时,DS2API 做防泄漏处理: **非流式**:识别到工具调用时,返回 `message.tool_calls`,设置 `finish_reason=tool_calls`,`message.content=null`。 ```json { "choices": [ { "index": 0, "message": { "role": "assistant", "content": null, "tool_calls": [ { "id": "call_xxx", "type": "function", "function": { "name": "get_weather", "arguments": "{\"city\":\"beijing\"}" } } ] }, "finish_reason": "tool_calls" } ] } ``` **流式**:命中高置信特征后立即输出 `delta.tool_calls`(不等待完整工具参数闭合),并持续发送 arguments 增量;已确认的工具调用片段不会回流到 `delta.content`。 补充说明: - **非代码块上下文**下,工具负载即使与普通文本混合,也会按特征识别并产出可执行 tool call(前后普通文本仍可透传)。 - 解析器当前把 DSML 外壳(`<|DSML|tool_calls>` / `<|DSML|invoke name="...">` / `<|DSML|parameter name="...">`)、DSML wrapper 别名(``、`<|tool_calls>`、`<|tool_calls>`)、常见 DSML 分隔符漏写形态(如 `<|DSML tool_calls>` / `<|DSML invoke>` / `<|DSML parameter>`)、`DSML` 与工具标签名黏连的常见 typo(如 `` / `` / ``)和旧式 canonical XML 工具块(`` / `` / ``)作为可执行调用解析;DSML 会先归一化回 XML,内部仍以 XML 解析语义为准。旧式 ``、``、``、``、``、`tool_use`、antml 风格与纯 JSON `tool_calls` 片段默认都会按普通文本处理。 - 当最终可见正文为空但思维链里包含可执行工具调用时,Chat / Responses 会在收尾阶段补发标准 OpenAI `tool_calls` / `function_call` 输出;如果客户端未开启 thinking / reasoning,该思维链只用于检测,不会作为可见正文或 `reasoning_content` 暴露。 - Markdown fenced code block(例如 ```json ... ```)中的 `tool_calls` 仅视为示例文本,不会被执行。 --- ### `GET /v1/models/{id}` 无需鉴权。入参支持 alias(例如 `gpt-4o`),返回的是映射后的 DeepSeek 模型对象。 ### `POST /v1/responses` OpenAI Responses 风格接口,兼容 `input` 或 `messages`。 | 字段 | 类型 | 必填 | 说明 | | --- | --- | --- | --- | | `model` | string | ✅ | 支持原生模型 + alias 自动映射 | | `input` | string/array/object | ❌ | 与 `messages` 二选一 | | `messages` | array | ❌ | 与 `input` 二选一 | | `instructions` | string | ❌ | 自动前置为 system 消息 | | `stream` | boolean | ❌ | 默认 `false` | | `tools` | array | ❌ | 与 chat 同样的工具识别与转译策略(含代码块示例豁免) | | `tool_choice` | string/object | ❌ | 支持 `auto`/`none`/`required` 与强制函数(`{"type":"function","name":"..."}`) | **非流式响应**:返回标准 `response` 对象,`id` 形如 `resp_xxx`,并写入内存 TTL 存储。 当 `tool_choice=required` 且未产出有效工具调用时,返回 HTTP `422`(`error.code=tool_choice_violation`)。 **流式响应(SSE)**:最小事件序列如下。 ```text event: response.created data: {"type":"response.created","id":"resp_xxx","status":"in_progress",...} event: response.output_item.added data: {"type":"response.output_item.added","response_id":"resp_xxx","item":{"type":"message|function_call",...},...} event: response.content_part.added data: {"type":"response.content_part.added","response_id":"resp_xxx","part":{"type":"output_text",...},...} event: response.output_text.delta data: {"type":"response.output_text.delta","response_id":"resp_xxx","item_id":"msg_xxx","output_index":0,"content_index":0,"delta":"..."} event: response.function_call_arguments.delta data: {"type":"response.function_call_arguments.delta","response_id":"resp_xxx","call_id":"call_xxx","delta":"..."} event: response.function_call_arguments.done data: {"type":"response.function_call_arguments.done","response_id":"resp_xxx","call_id":"call_xxx","name":"tool","arguments":"{...}"} event: response.content_part.done data: {"type":"response.content_part.done","response_id":"resp_xxx",...} event: response.output_item.done data: {"type":"response.output_item.done","response_id":"resp_xxx","item":{"type":"message|function_call",...},...} event: response.completed data: {"type":"response.completed","response":{...}} data: [DONE] ``` 流式场景下若 `tool_choice=required` 违规,会返回 `response.failed` 后结束(不再发送 `response.completed`)。 > 当前版本说明:解析层默认“尽量提取结构化 tool call”,未启用基于 `tools` allow-list 的硬拒绝;是否执行仍应由你的工具执行器做白名单校验。 ### `GET /v1/responses/{response_id}` 需要业务鉴权。查询 `POST /v1/responses` 生成并缓存的 response 对象(按调用方鉴权隔离,仅同一 key/token 可读取)。 > 当前为内存 TTL 存储,默认过期时间 `900s`(可用 `responses.store_ttl_seconds` 调整)。 ### `POST /v1/embeddings` 需要业务鉴权。返回 OpenAI Embeddings 兼容结构。 | 字段 | 类型 | 必填 | 说明 | | --- | --- | --- | --- | | `model` | string | ✅ | 支持原生模型 + alias 自动映射 | | `input` | string/array | ✅ | 支持字符串、字符串数组、token 数组 | > 需配置 `embeddings.provider`。当前支持:`mock` / `deterministic` / `builtin`。未配置或不支持时返回标准错误结构(HTTP 501)。 ### `POST /v1/files` 需要业务鉴权。兼容 OpenAI Files 上传接口,当前仅支持 `multipart/form-data`。 | 字段 | 类型 | 必填 | 说明 | | --- | --- | --- | --- | | `file` | file | ✅ | 上传文件二进制 | | `purpose` | string | ❌ | 透传到上游用途字段 | 约束与行为: - 请求必须为 `multipart/form-data`,否则返回 `400`。 - 请求体总大小上限 `100 MiB`(超限返回 `413`)。 - 成功返回 OpenAI `file` 对象(`id/object/bytes/filename/purpose/status` 等字段),并附带 `account_id` 便于定位来源账号。 --- ## Claude 兼容接口 除标准路径 `/anthropic/v1/*` 外,还支持快捷路径 `/v1/messages`、`/messages`、`/v1/messages/count_tokens`、`/messages/count_tokens`。 实现上统一走 OpenAI Chat Completions 解析与回译链路,避免多套解析逻辑分叉维护。 ### `GET /anthropic/v1/models` 无需鉴权。 **响应示例**: ```json { "object": "list", "data": [ {"id": "claude-sonnet-4-6", "object": "model", "created": 1715635200, "owned_by": "anthropic"}, {"id": "claude-sonnet-4-6-nothinking", "object": "model", "created": 1715635200, "owned_by": "anthropic"}, {"id": "claude-haiku-4-5", "object": "model", "created": 1715635200, "owned_by": "anthropic"}, {"id": "claude-haiku-4-5-nothinking", "object": "model", "created": 1715635200, "owned_by": "anthropic"}, {"id": "claude-opus-4-6", "object": "model", "created": 1715635200, "owned_by": "anthropic"}, {"id": "claude-opus-4-6-nothinking", "object": "model", "created": 1715635200, "owned_by": "anthropic"} ], "first_id": "claude-opus-4-6", "last_id": "claude-3-haiku-20240307-nothinking", "has_more": false } ``` > 说明:示例仅展示部分模型;实际返回除当前主别名外,还包含 Claude 4.x snapshots、3.x 历史模型 ID 与常见别名,并为这些可映射模型额外提供 `-nothinking` 变体。 ### `POST /anthropic/v1/messages` **请求头**: ```http x-api-key: your-api-key Content-Type: application/json anthropic-version: 2023-06-01 ``` > `anthropic-version` 可省略,服务端会自动补为 `2023-06-01`。 **请求体**: | 字段 | 类型 | 必填 | 说明 | | --- | --- | --- | --- | | `model` | string | ✅ | 例如 `claude-sonnet-4-6` / `claude-opus-4-6` / `claude-haiku-4-5`(兼容 `claude-sonnet-4-5`、`claude-3-5-haiku-latest`),并支持历史 Claude 模型 ID;若模型名带 `-nothinking` 后缀,则强制关闭 thinking / reasoning | | `messages` | array | ✅ | Claude 风格消息数组 | | `max_tokens` | number | ❌ | 缺省自动补 `8192`;当前实现不会硬性截断上游输出 | | `stream` | boolean | ❌ | 默认 `false` | | `system` | string | ❌ | 可选系统提示 | | `tools` | array | ❌ | Claude tool 定义 | #### 非流式响应 ```json { "id": "msg_1738400000000000000", "type": "message", "role": "assistant", "model": "claude-sonnet-4-6", "content": [ {"type": "text", "text": "回复内容"} ], "stop_reason": "end_turn", "stop_sequence": null, "usage": { "input_tokens": 12, "output_tokens": 34 } } ``` 若识别到工具调用,`stop_reason=tool_use`,`content` 中返回 `tool_use` block。 #### 流式响应(`stream=true`) SSE 使用 `event:` + `data:` 双行格式,JSON 中保留 `type` 字段。 ```text event: message_start data: {"type":"message_start","message":{...}} event: content_block_start data: {"type":"content_block_start","index":0,"content_block":{"type":"text","text":""}} event: content_block_delta data: {"type":"content_block_delta","index":0,"delta":{"type":"text_delta","text":"hello"}} event: ping data: {"type":"ping"} event: content_block_stop data: {"type":"content_block_stop","index":0} event: message_delta data: {"type":"message_delta","delta":{"stop_reason":"end_turn","stop_sequence":null},"usage":{"output_tokens":12}} event: message_stop data: {"type":"message_stop"} ``` **说明**: - 默认模型会按各 surface 的既有规则输出 thinking / reasoning 相关增量 - 带 `-nothinking` 后缀的模型会强制关闭 thinking,即使请求显式传了 `thinking` / `reasoning` / `reasoning_effort` 也不会输出 `thinking_delta` - 不会输出 `signature_delta`(上游 DeepSeek 未提供可验证签名) - `tools` 场景优先避免泄露原始工具 JSON,不强制发送 `input_json_delta` ### `POST /anthropic/v1/messages/count_tokens` **请求**: ```json { "model": "claude-sonnet-4-6", "messages": [ {"role": "user", "content": "你好"} ] } ``` **响应**: ```json { "input_tokens": 5 } ``` --- ## Gemini 兼容接口 支持路径: - `/v1beta/models/{model}:generateContent` - `/v1beta/models/{model}:streamGenerateContent` - `/v1/models/{model}:generateContent`(兼容路径) - `/v1/models/{model}:streamGenerateContent`(兼容路径) 鉴权方式同业务接口(`Authorization: Bearer ` 或 `x-api-key`)。 实现上统一走 OpenAI Chat Completions 解析与回译链路,避免多套解析逻辑分叉维护。 ### `POST /v1beta/models/{model}:generateContent` 请求体兼容 Gemini `contents` / `tools` 字段,模型名可用 alias 自动映射到 DeepSeek 模型;若路径中的模型名带 `-nothinking` 后缀,则最终会映射到对应的无思考模型。 响应为 Gemini 兼容结构,核心字段包括: - `candidates[].content.parts[].text` - `candidates[].content.parts[].functionCall`(工具调用时) - `usageMetadata`(`promptTokenCount` / `candidatesTokenCount` / `totalTokenCount`) ### `POST /v1beta/models/{model}:streamGenerateContent` 返回 SSE(`text/event-stream`),每个 chunk 为一条 `data: `: - 常规文本:持续返回增量文本 chunk - `tools` 场景:会缓冲并在结束时输出 `functionCall` 结构 - 结束 chunk:包含 `finishReason: "STOP"` 与 `usageMetadata` - token 计数优先透传上游 DeepSeek SSE(如 `accumulated_token_usage` / `token_usage`);仅在上游缺失时回退本地估算 --- ## Admin 接口 ### `POST /admin/login` 无需鉴权。 **请求**: ```json { "admin_key": "admin", "expire_hours": 24 } ``` `expire_hours` 可省略,默认 `24`。 **响应**: ```json { "success": true, "token": "", "expires_in": 86400 } ``` ### `GET /admin/verify` 需要 JWT:`Authorization: Bearer ` **响应**: ```json { "valid": true, "expires_at": 1738400000, "remaining_seconds": 72000 } ``` ### `GET /admin/vercel/config` 返回 Vercel 预配置状态。 ```json { "has_token": true, "project_id": "prj_xxx", "team_id": null } ``` ### `GET /admin/config` 返回脱敏后的配置,包含 `keys` 与 `api_keys`。 ```json { "keys": ["k1", "k2"], "api_keys": [ {"key": "k1", "name": "主 Key", "remark": "生产流量"}, {"key": "k2", "name": "备用 Key", "remark": "压测"} ], "env_backed": false, "env_source_present": true, "env_writeback_enabled": true, "config_path": "/data/config.json", "accounts": [ { "identifier": "user@example.com", "email": "user@example.com", "mobile": "", "has_password": true, "has_token": true, "token_preview": "abcde..." } ], "model_aliases": { "claude-sonnet-4-6": "deepseek-v4-flash", "claude-opus-4-6": "deepseek-v4-pro" } } ``` ### `POST /admin/config` 只更新 `keys`、`api_keys`、`accounts`、`model_aliases`。 如果同时发送 `api_keys` 与 `keys`,优先保留 `api_keys` 中的结构化 `name` / `remark`;`keys` 仅作为旧格式兼容回退。 **请求**: ```json { "keys": ["k1", "k2"], "api_keys": [ {"key": "k1", "name": "主 Key", "remark": "生产流量"}, {"key": "k2", "name": "备用 Key", "remark": "压测"} ], "accounts": [ {"email": "user@example.com", "password": "pwd", "token": ""} ], "model_aliases": { "claude-sonnet-4-6": "deepseek-v4-flash", "claude-opus-4-6": "deepseek-v4-pro" } } ``` ### `GET /admin/settings` 读取运行时设置与状态,返回: - `success` - `admin`(`has_password_hash`、`jwt_expire_hours`、`jwt_valid_after_unix`、`default_password_warning`) - `runtime`(`account_max_inflight`、`account_max_queue`、`global_max_inflight`、`token_refresh_interval_hours`) - `compat`(`wide_input_strict_output`、`strip_reference_markers`) - `responses` / `embeddings` - `auto_delete`(`mode`:`none` / `single` / `all`;旧配置 `sessions=true` 仍按 `all` 处理) - `current_input_file`(`enabled` 默认返回 `true`、`min_chars`) - `model_aliases` - `env_backed`、`needs_vercel_sync` - `toolcall` 策略已固定为 `feature_match + high`,不再通过 settings 返回或修改 ### `PUT /admin/settings` 热更新运行时设置。支持更新: - `admin.jwt_expire_hours` - `runtime.account_max_inflight` / `runtime.account_max_queue` / `runtime.global_max_inflight` / `runtime.token_refresh_interval_hours` - `compat.wide_input_strict_output` / `compat.strip_reference_markers` - `responses.store_ttl_seconds` - `embeddings.provider` - `auto_delete.mode` - `current_input_file.enabled` / `current_input_file.min_chars` - `model_aliases` - `history_split` 仅作为旧配置兼容字段保留,不再影响请求处理 - `toolcall` 策略已固定,不再作为可写入字段 ### `POST /admin/settings/password` 更新管理密码并使旧 JWT 失效。 请求示例: ```json {"new_password":"your-new-password"} ``` 也兼容 `{"password":"your-new-password"}`。 ### `POST /admin/config/import` 导入完整配置,支持: - `mode=merge`(默认) - `mode=replace` 请求可直接传配置对象,或使用 `{"config": {...}, "mode":"merge"}` 包裹格式。 也支持在查询参数里传 `?mode=merge` / `?mode=replace`。 `replace` 模式会按完整配置结构替换(保留 Vercel 同步元信息);`merge` 模式会合并 `keys`、`api_keys`、`accounts`、`model_aliases`,并覆盖 `admin`、`runtime`、`responses`、`embeddings` 中的非空字段。`compat`、`auto_delete`、`current_input_file` 建议通过 `/admin/settings` 或配置文件管理;`history_split` 仅保留为旧配置兼容字段;`toolcall` 相关字段会被忽略。 > 注意:`merge` 模式不会更新 `compat`、`auto_delete`、`current_input_file`。 ### `GET /admin/config/export` 导出完整配置,返回 `config`、`json`、`base64` 三种格式。 响应示例: > 注:`_vercel_sync_hash` 和 `_vercel_sync_time` 为内部同步元数据字段,用于 Vercel 配置漂移检测。 ### `POST /admin/keys` ```json {"key": "new-api-key", "name": "主 Key", "remark": "生产流量"} ``` **响应**:`{"success": true, "total_keys": 3}` ### `PUT /admin/keys/{key}` 更新指定 API key 的 `name` / `remark`,路径参数中的 `key` 为只读标识,不可修改。 ```json {"name": "备用 Key", "remark": "压测"} ``` **响应**:`{"success": true, "total_keys": 3}` ### `DELETE /admin/keys/{key}` **响应**:`{"success": true, "total_keys": 2}` ### `GET /admin/proxies` 列出代理配置(密码不回传,仅返回 `has_password` 标记)。 ### `POST /admin/proxies` 新增代理。请求体支持 `id`(可选,未传则自动生成)、`name`、`type`(`http` / `socks5`)、`host`、`port`、`username`、`password`。 ### `PUT /admin/proxies/{proxyID}` 更新指定代理。若请求中 `password` 为空字符串,则保留原密码。 ### `DELETE /admin/proxies/{proxyID}` 删除代理,并自动清空所有引用该代理账号的 `proxy_id`。 ### `POST /admin/proxies/test` 测试代理连通性:传 `proxy_id` 时测试已保存代理;不传时按请求体代理字段做临时连通性测试。 ### `GET /admin/accounts` **查询参数**: | 参数 | 默认 | 范围 | | --- | --- | --- | | `page` | `1` | ≥ 1 | | `page_size` | `10` | 1–5000 | | `q` | 空 | 按 identifier / email / mobile 过滤 | **响应**: ```json { "items": [ { "identifier": "user@example.com", "email": "user@example.com", "mobile": "", "has_password": true, "has_token": true, "token_preview": "abc...", "test_status": "ok" } ], "total": 25, "page": 1, "page_size": 10, "total_pages": 3 } ``` ### `POST /admin/accounts` ```json {"email": "user@example.com", "password": "pwd"} ``` **响应**:`{"success": true, "total_accounts": 6}` ### `PUT /admin/accounts/{identifier}` 更新指定账号的 `name` / `remark`。路径参数中的 `identifier` 可以是 email 或 mobile,且不可修改。 ```json {"name": "主账号", "remark": "团队共享"} ``` **响应**:`{"success": true, "total_accounts": 6}` ### `DELETE /admin/accounts/{identifier}` `identifier` 可为 email、mobile,或 token-only 账号的合成标识(`token:`)。 **响应**:`{"success": true, "total_accounts": 5}` ### `PUT /admin/accounts/{identifier}/proxy` 更新指定账号绑定代理。 - 请求体:`{"proxy_id":"..."}`; - `proxy_id` 传空字符串时表示解绑代理; - `identifier` 支持 email / mobile / token-only 合成标识。 ### `GET /admin/queue/status` ```json { "available": 3, "in_use": 1, "total": 4, "available_accounts": ["a@example.com"], "in_use_accounts": ["b@example.com"], "max_inflight_per_account": 2, "global_max_inflight": 8, "recommended_concurrency": 8, "waiting": 0, "max_queue_size": 8 } ``` | 字段 | 说明 | | --- | --- | | `available` | 仍有剩余并发槽位的账号数 | | `in_use` | 当前已占用的 in-flight 槽位数 | | `total` | 总账号数 | | `available_accounts` | 仍有剩余并发槽位的账号 ID 列表 | | `in_use_accounts` | 当前处于使用中的账号 ID 列表 | | `max_inflight_per_account` | 每账号并发上限 | | `global_max_inflight` | 全局并发上限 | | `recommended_concurrency` | 建议并发值(`total × max_inflight_per_account`) | | `waiting` | 当前等待中的请求数 | | `max_queue_size` | 等待队列上限 | ### `POST /admin/accounts/test` | 字段 | 必填 | 说明 | | --- | --- | --- | | `identifier` | ✅ | email / mobile / token-only 合成标识 | | `model` | ❌ | 默认 `deepseek-v4-flash` | | `message` | ❌ | 空字符串时仅测试会话创建 | **响应**: ```json { "account": "user@example.com", "success": true, "response_time": 1240, "message": "API 测试成功(仅会话创建)", "model": "deepseek-v4-flash", "session_count": 0, "config_writable": true } ``` 如果传入 `message`,还会附带 `thinking`(当上游返回思考内容时)。 ### `POST /admin/accounts/test-all` 可选请求字段:`model` ```json { "total": 5, "success": 4, "failed": 1, "results": [...] } ``` 内部并发上限当前固定为 5。 ### `POST /admin/accounts/sessions/delete-all` 清空指定账号的所有 DeepSeek 会话。请求体示例: ```json {"identifier":"user@example.com"} ``` 响应: ```json {"success": true, "message": "删除成功"} ``` 如果账号不存在或删除失败,`success` 会是 `false`,`message` 会返回错误原因。 ### `POST /admin/import` 批量导入 keys 与 accounts。 **请求**: ```json { "keys": ["k1", "k2"], "accounts": [ {"email": "user@example.com", "password": "pwd", "token": ""} ] } ``` **响应**: ```json { "success": true, "imported_keys": 2, "imported_accounts": 1 } ``` ### `POST /admin/test` 测试当前 API 可用性(通过自身接口调用)。 | 字段 | 必填 | 默认值 | | --- | --- | --- | | `model` | ❌ | `deepseek-v4-flash` | | `message` | ❌ | `你好` | | `api_key` | ❌ | 配置中第一个 key | **响应**: ```json { "success": true, "status_code": 200, "response": {"id": "..."} } ``` ### `POST /admin/dev/raw-samples/capture` 直接通过服务自身发起一次 `/v1/chat/completions` 请求,并把请求元信息和上游原始 SSE 保存到 `tests/raw_stream_samples//`。 常用请求字段: | 字段 | 必填 | 默认值 | 说明 | | --- | --- | --- | --- | | `message` | 否 | `你好` | 便捷单轮用户消息 | | `messages` | 否 | 自动由 `message` 生成 | OpenAI 风格消息数组 | | `model` | 否 | `deepseek-v4-flash` | 目标模型 | | `stream` | 否 | `true` | 建议保留流式,以记录原始 SSE | | `api_key` | 否 | 配置中第一个 key | 调用业务接口使用的 key | | `sample_id` | 否 | 自动生成 | 样本目录名 | 成功时会在响应头里附带: - `X-Ds2-Sample-Id` - `X-Ds2-Sample-Dir` - `X-Ds2-Sample-Meta` - `X-Ds2-Sample-Upstream` 如果请求本身成功,但当前进程没有记录到新的上游抓包,会返回: ```json {"detail":"no upstream capture was recorded"} ``` ### `GET /admin/dev/raw-samples/query` 按关键词查询当前进程内存里的抓包记录,并按 `chat_session_id` 归并 `completion + continue` 链。 **查询参数**: | 参数 | 默认值 | 说明 | | --- | --- | --- | | `q` | 空 | 按请求体/响应体关键词模糊匹配 | | `limit` | `20` | 返回链条数上限 | **响应字段**包含: - `items[].chain_key` - `items[].capture_ids` - `items[].round_count` - `items[].initial_label` - `items[].request_preview` - `items[].response_preview` ### `POST /admin/dev/raw-samples/save` 把当前内存中的某条抓包链落盘为 `tests/raw_stream_samples//`。 支持以下任一种选中方式: ```json {"chain_key":"session:xxxx","sample_id":"tmp-from-memory"} ``` ```json {"capture_id":"cap_xxx","sample_id":"tmp-from-memory"} ``` ```json {"query":"广州天气","sample_id":"tmp-from-memory"} ``` 成功响应会返回 `sample_id`、`dir`、`meta_path`、`upstream_path`。 ### `POST /admin/vercel/sync` | 字段 | 必填 | 说明 | | --- | --- | --- | | `vercel_token` | ❌ | 空或 `__USE_PRECONFIG__` 则读环境变量 | | `project_id` | ❌ | 空则读 `VERCEL_PROJECT_ID` | | `team_id` | ❌ | 空则读 `VERCEL_TEAM_ID` | | `auto_validate` | ❌ | 默认 `true` | | `save_credentials` | ❌ | 默认 `true` | **成功响应**: ```json { "success": true, "validated_accounts": 3, "message": "配置已同步,正在重新部署...", "deployment_url": "https://..." } ``` 或需要手动部署: ```json { "success": true, "validated_accounts": 3, "message": "配置已同步到 Vercel,请手动触发重新部署", "manual_deploy_required": true } ``` 失败校验的账号会通过 `failed_accounts` 返回;成功保存到 Vercel 的凭据会通过 `saved_credentials` 返回。 ### `GET /admin/vercel/status` ```json { "synced": true, "last_sync_time": 1738400000, "has_synced_before": true, "env_backed": false, "config_hash": "....", "last_synced_hash": "....", "draft_hash": "....", "draft_differs": false } ``` `POST /admin/vercel/status` 还可以携带 `config_override`,用于对比“草稿配置”和当前已同步配置。 ### `GET /admin/export` ```json { "json": "{...}", "base64": "ey4uLn0=" } ``` 该接口与 `GET /admin/config/export` 返回相同内容,只是路径更短。 ### `GET /admin/version` 查询当前构建版本与 GitHub 最新 Release: ```json { "success": true, "current_version": "3.0.0", "current_tag": "v3.0.0", "source": "file:VERSION", "checked_at": "2026-03-29T00:00:00Z", "latest_tag": "v3.0.0", "latest_version": "3.0.0", "release_url": "https://github.com/CJackHwang/ds2api/releases/tag/v3.0.0", "published_at": "2026-03-28T12:00:00Z", "has_update": false } ``` 如果 GitHub API 不可用,响应里会额外包含 `check_error`,但 HTTP 状态仍为 200。 ### `GET /admin/dev/captures` 查看本地抓包状态与最近记录(需 Admin 鉴权): - `enabled` - `limit` - `max_body_bytes` - `items` ### `DELETE /admin/dev/captures` 清空抓包记录,返回: ```json {"success":true,"detail":"capture logs cleared"} ``` --- ## 错误响应格式 兼容路由(`/v1/*`、`/anthropic/*`)统一使用以下结构: ```json { "error": { "message": "...", "type": "invalid_request_error", "code": "invalid_request", "param": null } } ``` Admin 接口保持 `{"detail":"..."}`。 Gemini 路由使用 Google 风格错误结构: ```json { "error": { "code": 400, "message": "invalid json", "status": "INVALID_ARGUMENT" } } ``` 建议客户端处理逻辑:检查 HTTP 状态码 + 解析 `error` 或 `detail` 字段。 **常见状态码**: | 状态码 | 说明 | | --- | --- | | `401` | 鉴权失败(key/token 无效,或 Admin JWT 过期) | | `429` | 请求过多(超出并发上限 + 等待队列) | | `503` | 模型不可用或上游服务异常 | --- ## cURL 示例 ### OpenAI 非流式 ```bash curl http://localhost:5001/v1/chat/completions \ -H "Authorization: Bearer your-api-key" \ -H "Content-Type: application/json" \ -d '{ "model": "deepseek-v4-flash", "messages": [{"role": "user", "content": "你好"}], "stream": false }' ``` ### OpenAI 流式 ```bash curl http://localhost:5001/v1/chat/completions \ -H "Authorization: Bearer your-api-key" \ -H "Content-Type: application/json" \ -d '{ "model": "deepseek-v4-pro", "messages": [{"role": "user", "content": "解释一下量子纠缠"}], "stream": true }' ``` ### OpenAI Responses(流式) ```bash curl http://localhost:5001/v1/responses \ -H "Authorization: Bearer your-api-key" \ -H "Content-Type: application/json" \ -d '{ "model": "gpt-5.3-codex", "input": "写一个 golang 的 hello world", "stream": true }' ``` ### OpenAI Embeddings ```bash curl http://localhost:5001/v1/embeddings \ -H "Authorization: Bearer your-api-key" \ -H "Content-Type: application/json" \ -d '{ "model": "gpt-4o", "input": ["第一段文本", "第二段文本"] }' ``` ### OpenAI 带搜索 ```bash curl http://localhost:5001/v1/chat/completions \ -H "Authorization: Bearer your-api-key" \ -H "Content-Type: application/json" \ -d '{ "model": "deepseek-v4-flash-search", "messages": [{"role": "user", "content": "今天的新闻"}], "stream": true }' ``` ### OpenAI Tool Calling ```bash curl http://localhost:5001/v1/chat/completions \ -H "Authorization: Bearer your-api-key" \ -H "Content-Type: application/json" \ -d '{ "model": "deepseek-v4-flash", "messages": [{"role": "user", "content": "北京今天天气怎么样?"}], "tools": [ { "type": "function", "function": { "name": "get_weather", "description": "获取指定城市的天气", "parameters": { "type": "object", "properties": { "city": {"type": "string", "description": "城市名"} }, "required": ["city"] } } } ] }' ``` ### Gemini 非流式 ```bash curl "http://localhost:5001/v1beta/models/gemini-2.5-pro:generateContent" \ -H "Authorization: Bearer your-api-key" \ -H "Content-Type: application/json" \ -d '{ "contents": [ { "role": "user", "parts": [{"text": "用三句话介绍 Go 语言"}] } ] }' ``` ### Gemini 流式 ```bash curl "http://localhost:5001/v1beta/models/gemini-2.5-flash:streamGenerateContent" \ -H "Authorization: Bearer your-api-key" \ -H "Content-Type: application/json" \ -d '{ "contents": [ { "role": "user", "parts": [{"text": "写一个简短摘要"}] } ] }' ``` ### Claude 非流式 ```bash curl http://localhost:5001/anthropic/v1/messages \ -H "x-api-key: your-api-key" \ -H "Content-Type: application/json" \ -H "anthropic-version: 2023-06-01" \ -d '{ "model": "claude-sonnet-4-6", "max_tokens": 1024, "messages": [{"role": "user", "content": "你好"}] }' ``` ### Claude 流式 ```bash curl http://localhost:5001/anthropic/v1/messages \ -H "x-api-key: your-api-key" \ -H "Content-Type: application/json" \ -H "anthropic-version: 2023-06-01" \ -d '{ "model": "claude-opus-4-6", "max_tokens": 1024, "messages": [{"role": "user", "content": "解释相对论"}], "stream": true }' ``` ### Admin 登录 ```bash curl http://localhost:5001/admin/login \ -H "Content-Type: application/json" \ -d '{"admin_key": "admin"}' ``` ### 指定账号请求 ```bash curl http://localhost:5001/v1/chat/completions \ -H "Authorization: Bearer your-api-key" \ -H "X-Ds2-Target-Account: user@example.com" \ -H "Content-Type: application/json" \ -d '{ "model": "deepseek-v4-flash", "messages": [{"role": "user", "content": "你好"}] }' ```