mirror of
https://github.com/justlovemaki/AIClient-2-API.git
synced 2026-04-27 02:15:50 +03:00
[GH-ISSUE #315] claude, sillytavern. #223
Labels
No labels
pull-request
No milestone
No project
No assignees
1 participant
Notifications
Due date
No due date set.
Dependencies
No dependencies set.
Reference
starred/AIClient-2-API-justlovemaki#223
Loading…
Add table
Add a link
Reference in a new issue
No description provided.
Delete branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
Originally created by @ivanaboba194-sketch on GitHub (Feb 9, 2026).
Original GitHub issue: https://github.com/justlovemaki/AIClient-2-API/issues/315
Title: [Bug] Kiro 供应商 Claude 模型回复在 8k tokens 左右被截断 (SillyTavern)
问题描述 (Problem Description) 在使用 SillyTavern 搭配 AIClient-2-API (Kiro 供应商) 时,模型生成长文本会出现提前截断的问题。尽管我在前端设置了极高的参数,但回复总是在 7000-8000 tokens 左右戛然而止。
环境信息 (Environment)
软件版本: 2026-02-09 最新版 (v2.9.x)
供应商: Kiro (Claude-Kiro-OAuth)
模型: Claude 3.5 Sonnet / 4.5
前端: SillyTavern
我的具体配置 (My Configuration) 为了排除前端限制,我已在 SillyTavern 中应用了以下设置:
Context Size: 200,000 tokens
Max Response Length: 16,000 tokens
Temperature: 1.0
Top K: 90
复现步骤 (Steps to Reproduce)
使用上述高配额参数。
发送需要长篇回复的 Prompt(或进行长文本续写)。
观察回复在达到约 8k tokens 时中断。控制台 (Console) 没有报错信息,看起来是连接正常关闭,但内容并未完成。
核心疑问
Kiro 限制: 请问 Kiro 供应商本身是否有单次输出的硬性限制?
解锁 16k: 是否可以通过添加 anthropic-beta 相关 Header (如 max-tokens-3-5-sonnet-2024-07-15) 来尝试解锁 16k 输出?
静默截断: 为什么在没有报错的情况下回复会被截断?这是 Kiro 后端的策略还是 API 转换层的处理逻辑?
尝试过的方案 (Attempts) 已确认非 SillyTavern 限制。由于控制台完全没有错误日志,判断这并非由于崩溃导致,而是某种预设的输出上限。
@justlovemaki commented on GitHub (Feb 9, 2026):
毕竟是反代,不是原版,各种限制都是存在的。
理解并接受,不接受可以用原版。