remove upstream token-usage plumbing and always estimate from content

2026-05-19 23:47:45 +08:00 · 2026-04-07 20:12:18 +08:00
parent a14e5b0847
commit d9e65c9710
17 changed files with 24 additions and 306 deletions
--- a/internal/js/chat-stream/vercel_stream_impl.js
+++ b/internal/js/chat-stream/vercel_stream_impl.js
@@ -125,8 +125,6 @@ async function handleVercelStream(req, res, rawBody, payload) {
    let currentType = thinkingEnabled ? 'thinking' : 'text';
    let thinkingText = '';
    let outputText = '';
-    let promptTokens = 0;
-    let outputTokens = 0;
    const toolSieveEnabled = toolPolicy.toolSieveEnabled;
    const toolSieveState = createToolSieveState();
    let toolCallsEmitted = false;
@@ -179,7 +177,7 @@ async function handleVercelStream(req, res, rawBody, payload) {
        created,
        model,
        choices: [{ delta: {}, index: 0, finish_reason: reason }],
-        usage: buildUsage(finalPrompt, thinkingText, outputText, outputTokens, promptTokens),
+        usage: buildUsage(finalPrompt, thinkingText, outputText),
      });
      if (!res.writableEnded && !res.destroyed) {
        res.write('data: [DONE]\n\n');
@@ -228,12 +226,6 @@ async function handleVercelStream(req, res, rawBody, payload) {
          if (!parsed.parsed) {
            continue;
          }
-          if (parsed.promptTokens > 0) {
-            promptTokens = parsed.promptTokens;
-          }
-          if (parsed.outputTokens > 0) {
-            outputTokens = parsed.outputTokens;
-          }
          currentType = parsed.newType;
          if (parsed.errorMessage) {
            await finish('content_filter');