• v1.1.3 be0523d48b

    v1.1.3 Stable

    kerem released this 2026-02-27 04:13:34 +03:00 | 86 commits to master since this release

    📅 Originally published on GitHub: Fri, 27 Feb 2026 01:31:01 GMT
    🏷️ Git tag created: Fri, 27 Feb 2026 01:13:34 GMT

    新功能

    • 凭据级 Region 编辑 — Admin UI 支持在线修改凭据的 Region 和 API Region
    • Kiro Account Manager 导入 — 支持导入 KAM 导出的 JSON 凭据文件
    • 凭证禁用状态持久化 — 手动禁用凭据的状态跨重启保留
    • Usage 诊断日志 — 流式/非流式请求均增加用量诊断日志输出

    🐛 修复

    • 修复凭据指定 Region 时额度查询和 API 请求走错 endpoint 导致 403 的问题
    • 修复批量导入丢失 apiRegion 字段的问题
    • 修复 WebSearch SSE 事件序列错误
    • 修复 Region 编辑后提交旧值覆盖服务端数据的问题
    • 修复 Region 值带空格导致生成无效 URL 的问题
    • 修复 HTTP 环境下批量导入报错的问题
    • 修复 Token Manager 统计数据未及时回写的问题
    • 修复 Docker 端口绑定和配置目录挂载问题
    • 移除重复的 Sonnet 4.6 模型项
    • 防止自动禁用状态被错误持久化导致无法自愈
    • 兼容旧配置文件中的 authRegion 字段
    • 过滤超长工具名避免上游拒绝整个请求
    • 429 错误不再输出完整请求体

    🔧 改进

    • 合并三个导入对话框为一个,自动识别多种凭据格式
    • 上游网络错误归类为瞬态错误,返回 502 且不输出请求体
    • Region 配置精简,删除冗余的 auth_region 字段
    • Opus 模型默认映射调整为 claude-opus-4.6
    • 默认 kiro_version 更新至 0.10.0
    • 移除未使用的负载均衡模式切换功能

    Full Changelog: https://github.com/BenedictKing/kiro.rs/compare/v1.1.1...v1.1.3

    Downloads
  • v1.1.1 91e0089954

    v1.1.1 Stable

    kerem released this 2026-02-18 05:01:54 +03:00 | 120 commits to master since this release

    📅 Originally published on GitHub: Wed, 18 Feb 2026 03:44:38 GMT
    🏷️ Git tag created: Wed, 18 Feb 2026 02:01:54 GMT

    新功能

    • 新增 Claude Sonnet 4.6 模型支持,包括 thinking 和 agentic 变体
    • Sonnet 4.6 支持 1M 上下文窗口和 64K 最大输出 tokens

    🐛 修复

    • 修复 Sonnet 4.6 thinking 配置未正确生效的问题
    • 修复空消息内容(空字符串、空白字符、空数组)导致上游请求失败的问题
    • 修复 "Improperly formed request" 被错误归类为上下文过长错误的问题
    • 修复小尺寸高质量图片直接透传导致请求体过大的问题

    🔧 改进

    • 图片处理限制放宽:单图总像素限制从 1.15M 提升至 4M,长边限制从 1568 提升至 4000,支持更高分辨率图片
    • 图片文件大小超过 200KB 时自动重新编码降低质量,减小请求体积

    Full Changelog: https://github.com/BenedictKing/kiro.rs/compare/v1.0.19...v1.1.1

    Downloads
  • v1.0.19 ef38837d6c

    v1.0.19 Stable

    kerem released this 2026-02-17 11:20:34 +03:00 | 131 commits to master since this release

    📅 Originally published on GitHub: Tue, 17 Feb 2026 10:00:59 GMT
    🏷️ Git tag created: Tue, 17 Feb 2026 08:20:34 GMT

    🔧 改进

    • 自适应压缩策略优化:请求体大小校验改为以实际序列化后的总字节数为准,压缩层级重排优先截断超长消息,新增预检跳过无效迭代,历史消息批量移除提升大上下文场景效率
    • 请求体大小阈值默认上调至 4.5MiB,匹配上游实际限制

    🐛 修复

    • 代码格式化

    Full Changelog: https://github.com/BenedictKing/kiro.rs/compare/v1.0.18...v1.0.19

    Downloads
  • v1.0.13 28f1ab663b

    v1.0.13 Stable

    kerem released this 2026-02-14 18:26:51 +03:00 | 144 commits to master since this release

    📅 Originally published on GitHub: Sat, 14 Feb 2026 15:52:43 GMT
    🏷️ Git tag created: Sat, 14 Feb 2026 15:26:51 GMT

    新功能

    • 5 层输入压缩管道:自动压缩超大请求,规避上游 ~400KB 请求体限制(空白压缩、thinking 块处理、tool_result 截断、历史截断等)
    • 自适应二次压缩:请求体超阈值时自动迭代压缩,逐步降低截断阈值直至满足限制
    • 图片 Token 估算与自动压缩:大图自动缩放,支持多图模式下的差异化像素限制
    • WebSearch 工具支持:自动检测纯搜索请求并路由到本地处理,支持流式和非流式响应
    • 模型 -thinking 后缀支持:模型名含 -thinking 后缀时自动覆写 thinking 配置
    • 批量导入 token.json:支持拖放上传或粘贴 JSON,自动去重和格式映射
    • 缓存余额查询接口:列表页直接显示缓存余额,30 秒自动轮询
    • 用户亲和性绑定:连续对话优先使用同一凭据,保持会话连续性
    • 负载均衡模式:新增 Balanced(Least-Used)模式,支持前端切换
    • 多维度设备指纹系统:每个凭据生成独立的确定性指纹
    • 精细化速率限制:每日请求限制、请求间隔控制、指数退避策略
    • 凭据级代理和 Region 配置:支持每个凭据独立设置 HTTP 代理和 API Region
    • Bonus 用量包支持:合并基础额度、免费试用和激活的 bonuses
    • Kiro Web Portal API:支持查询账号套餐、用量、邮箱等信息
    • 前端批量操作:批量导入、验活、选择、删除、恢复功能
    • sensitive-logs feature flag:显式启用才允许打印敏感信息
    • 请求体大小预检:可配置阈值,序列化后拦截超大请求

    🐛 修复

    • 请求体大小预检现在会扣除图片 base64 字节,避免含图片的请求被误拒
    • WebSearch 混合工具场景不再误路由:仅纯搜索请求走本地处理,混合工具剔除 web_search 后转发上游
    • 压缩后自动修复孤立的 tool_use/tool_result 配对,避免上游返回 400
    • 配额耗尽时正确返回 429 而非 502
    • 亲和性检查不再消耗速率配额
    • 修复多字节字符(中文等)切片导致的 panic 风险
    • 修复 SSE 流 ping 保活首次立即触发的问题
    • 修复 assistant prefill 消息导致的 400 错误,改为静默丢弃
    • 修复凭据文件并发写入可能损坏的问题(原子写入)
    • 修复 IDC 凭据返回 403 的问题(Token 和 profile_arn 不匹配)
    • 修复 NaN 余额导致凭据选择异常的问题
    • API Key 日志泄露修复:默认仅显示末 4 位
    • system 字段兼容字符串和数组两种格式
    • 工具描述截断 max_description_chars=0 现在正确表示"不截断"

    🔧 改进

    • 凭据选择算法升级为三级排序:使用次数最少 → 余额最多 → 轮询
    • stop_reason 基于优先级覆盖,高优先级原因不会被低优先级覆盖
    • 动态余额缓存 TTL:高频凭据更短刷新间隔
    • 后台 Token 自动刷新:定期检查即将过期的 Token 并批量刷新
    • 独立冷却管理:7 种冷却原因,差异化冷却时长
    • 压缩统计日志改用字节单位,更准确
    • 日志中 user_id 自动掩码处理
    • 重试策略优化:单凭据最多重试 2 次,单请求最多重试 5 次
    • 移除 current_id 概念,凭据选择完全动态化

    Full Changelog: https://github.com/BenedictKing/kiro.rs/compare/v1.0.4...v1.0.13

    Downloads
  • v1.0.4 f7697d020d

    v1.0.4 Stable

    kerem released this 2026-02-09 03:46:09 +03:00 | 182 commits to master since this release

    📅 Originally published on GitHub: Mon, 09 Feb 2026 01:23:51 GMT
    🏷️ Git tag created: Mon, 09 Feb 2026 00:46:09 GMT

    kiro.rs v1.0.4 — 首次正式发布 🎉

    kiro-rs 是一个用 Rust 编写的 Anthropic Claude API 兼容代理服务,将 Anthropic API 请求转换为 Kiro API 请求。支持多凭据管理、自动故障转移、流式响应和 Web 管理界面。

    核心功能

    • 完整的 Anthropic Messages API 兼容层(/v1/messages/v1/messages/count_tokens/v1/models
    • Anthropic ↔ Kiro 双向协议转换,支持流式 SSE 响应
    • AWS Event Stream 二进制协议解析器
    • 兼容 new-api 的 Claude 请求格式
    • Claude Code 专用缓冲流端点(/cc/v1
    • SSE 流 ping 保活机制

    🔑 多凭据管理

    • 多凭据格式支持(单凭据向后兼容 + 数组格式)
    • 凭据优先级排序与负载均衡模式切换(priority / balanced)
    • 后台 Token 自动刷新(支持 IdC Token)
    • 多维度设备指纹系统,每个凭据生成独立的确定性指纹
    • 凭据级 region 和 machineId 配置
    • 自动认证方式检测(IDC / Builder ID)
    • 凭据统计与持久化(成功次数、最后使用时间)
    • 批量导入 token.json 功能

    🔄 故障转移与调度

    • 用户亲和性绑定,连续对话优先使用同一凭据
    • 余额感知故障转移,自动切换到余额最高的可用凭据
    • 精细化速率限制系统(每日请求限制、请求间隔控制、指数退避)
    • 独立冷却管理模块(7 种冷却原因、差异化冷却时长、递增冷却机制)
    • 单凭据最多重试 2 次,单请求最多重试 5 次
    • 402 配额耗尽自动禁用并故障转移
    • MODEL_TEMPORARILY_UNAVAILABLE 全局禁用与自动恢复
    • 429 限流不禁用凭据,502 高负载继续重试
    • 启动时自动禁用余额不足的凭据

    🧠 Thinking 支持

    • 完整的 Thinking 内容回传
    • 支持 adaptive 模式与 budget_tokens 限制
    • 模型 "-thinking" 后缀自动覆写 thinking 配置
    • <thinking> 标签解析与过滤(跳过引用字符包裹的标签)

    📦 输入压缩管道

    • 多层输入压缩管道,规避上游请求体大小限制
    • 5 层策略:空白压缩、thinking 块处理、tool_result 截断、工具描述截断、历史截断
    • 10 个可配置参数

    🔍 WebSearch 支持

    • 自动检测纯搜索请求并路由到专用处理器
    • 自动过滤不支持的 web_search / websearch 工具类型

    🖥️ Web 管理界面

    • React 18 + TypeScript + Tailwind CSS 前端
    • 凭据 CRUD、批量操作、批量导入(支持拖放上传、预览、自动去重)
    • 余额查询(缓存 + 手动刷新)、动态余额缓存 TTL 策略
    • Bonus 用量包支持
    • Kiro Web Portal API 集成(套餐/用量/邮箱等账号信息聚合)
    • 凭据统计展示、验活功能、分页
    • 负载均衡模式切换
    • Admin API 密钥认证(常量时间比较防时序攻击)

    🔒 安全

    • sensitive-logs feature flag,默认关闭敏感日志输出
    • 日志中 user_id 自动掩码处理
    • API Key 日志泄露防护
    • 请求体 debug 日志截断(头尾各 1200 字符)
    • subtle 库常量时间比较防止时序攻击
    • admin_api_key 空值检查防止认证绕过

    🐛 关键修复

    • 修复上下文超限时返回 502 而非 400 的问题
    • 修复 Opus 4.6 模型 ID 包含日期导致不匹配的问题
    • 修复 IDC 凭据返回 403 的问题(Token 和 profile_arn 不匹配)
    • 修复凭据文件写入非原子操作可能导致损坏的问题
    • 修复 assistant prefill 消息导致 400 错误的问题
    • 修复孤立 tool_use(无对应 tool_result)导致 400 的问题
    • 修复 assistant 消息仅含 tool_use 时 content 为空导致报错的问题
    • 修复 UTF-8 字符串截断在多字节字符中间切割导致 panic 的问题
    • 修复 thinking 后紧跟工具调用时 </thinking> 未被过滤的问题
    • 修复 tool_use 导致的吞字问题
    • 修复所有凭据均已禁用后的死锁问题
    • 修复 NaN 余额导致凭据选择异常的问题

    🏗️ 构建与部署

    • Dockerfile 支持容器化部署
    • GitHub Actions 多平台构建(macOS / Linux amd64 & arm64 / Windows)
    • GitHub Actions Docker 双架构构建工作流
    • Docker 构建引入 cargo-chef 依赖层缓存
    • TLS 库从 native-tls 切换至 rustls,避免交叉编译依赖 OpenSSL
    • docker-compose 配置文件
    • rust-embed 静态文件嵌入(前端打包进二进制)
    • Cargo.toml 优化:thin LTO、tokio features 精简

    Full Changelog: https://github.com/BenedictKing/kiro.rs/commits/v1.0.4

    Downloads