[GH-ISSUE #315] claude, sillytavern. #223

Closed
opened 2026-02-27 07:18:33 +03:00 by kerem · 1 comment
Owner

Originally created by @ivanaboba194-sketch on GitHub (Feb 9, 2026).
Original GitHub issue: https://github.com/justlovemaki/AIClient-2-API/issues/315

Title: [Bug] Kiro 供应商 Claude 模型回复在 8k tokens 左右被截断 (SillyTavern)
问题描述 (Problem Description) 在使用 SillyTavern 搭配 AIClient-2-API (Kiro 供应商) 时,模型生成长文本会出现提前截断的问题。尽管我在前端设置了极高的参数,但回复总是在 7000-8000 tokens 左右戛然而止。

环境信息 (Environment)

软件版本: 2026-02-09 最新版 (v2.9.x)

供应商: Kiro (Claude-Kiro-OAuth)

模型: Claude 3.5 Sonnet / 4.5

前端: SillyTavern

我的具体配置 (My Configuration) 为了排除前端限制,我已在 SillyTavern 中应用了以下设置:

Context Size: 200,000 tokens

Max Response Length: 16,000 tokens

Temperature: 1.0

Top K: 90

复现步骤 (Steps to Reproduce)

使用上述高配额参数。

发送需要长篇回复的 Prompt(或进行长文本续写)。

观察回复在达到约 8k tokens 时中断。控制台 (Console) 没有报错信息,看起来是连接正常关闭,但内容并未完成。

核心疑问
Kiro 限制: 请问 Kiro 供应商本身是否有单次输出的硬性限制?

解锁 16k: 是否可以通过添加 anthropic-beta 相关 Header (如 max-tokens-3-5-sonnet-2024-07-15) 来尝试解锁 16k 输出?

静默截断: 为什么在没有报错的情况下回复会被截断?这是 Kiro 后端的策略还是 API 转换层的处理逻辑?

尝试过的方案 (Attempts) 已确认非 SillyTavern 限制。由于控制台完全没有错误日志,判断这并非由于崩溃导致,而是某种预设的输出上限。

Originally created by @ivanaboba194-sketch on GitHub (Feb 9, 2026). Original GitHub issue: https://github.com/justlovemaki/AIClient-2-API/issues/315 Title: [Bug] Kiro 供应商 Claude 模型回复在 8k tokens 左右被截断 (SillyTavern) 问题描述 (Problem Description) 在使用 SillyTavern 搭配 AIClient-2-API (Kiro 供应商) 时,模型生成长文本会出现提前截断的问题。尽管我在前端设置了极高的参数,但回复总是在 7000-8000 tokens 左右戛然而止。 环境信息 (Environment) 软件版本: 2026-02-09 最新版 (v2.9.x) 供应商: Kiro (Claude-Kiro-OAuth) 模型: Claude 3.5 Sonnet / 4.5 前端: SillyTavern 我的具体配置 (My Configuration) 为了排除前端限制,我已在 SillyTavern 中应用了以下设置: Context Size: 200,000 tokens Max Response Length: 16,000 tokens Temperature: 1.0 Top K: 90 复现步骤 (Steps to Reproduce) 使用上述高配额参数。 发送需要长篇回复的 Prompt(或进行长文本续写)。 观察回复在达到约 8k tokens 时中断。控制台 (Console) 没有报错信息,看起来是连接正常关闭,但内容并未完成。 核心疑问 Kiro 限制: 请问 Kiro 供应商本身是否有单次输出的硬性限制? 解锁 16k: 是否可以通过添加 anthropic-beta 相关 Header (如 max-tokens-3-5-sonnet-2024-07-15) 来尝试解锁 16k 输出? 静默截断: 为什么在没有报错的情况下回复会被截断?这是 Kiro 后端的策略还是 API 转换层的处理逻辑? 尝试过的方案 (Attempts) 已确认非 SillyTavern 限制。由于控制台完全没有错误日志,判断这并非由于崩溃导致,而是某种预设的输出上限。
kerem closed this issue 2026-02-27 07:18:33 +03:00
Author
Owner

@justlovemaki commented on GitHub (Feb 9, 2026):

毕竟是反代,不是原版,各种限制都是存在的。
理解并接受,不接受可以用原版。

<!-- gh-comment-id:3870799489 --> @justlovemaki commented on GitHub (Feb 9, 2026): 毕竟是反代,不是原版,各种限制都是存在的。 理解并接受,不接受可以用原版。
Sign in to join this conversation.
No labels
pull-request
No milestone
No project
No assignees
1 participant
Notifications
Due date
The due date is invalid or out of range. Please use the format "yyyy-mm-dd".

No due date set.

Dependencies

No dependencies set.

Reference
starred/AIClient-2-API-justlovemaki#223
No description provided.