• v1.0.13 28f1ab663b

    v1.0.13 Stable

    kerem released this 2026-02-14 18:26:51 +03:00 | 144 commits to master since this release

    📅 Originally published on GitHub: Sat, 14 Feb 2026 15:52:43 GMT
    🏷️ Git tag created: Sat, 14 Feb 2026 15:26:51 GMT

    新功能

    • 5 层输入压缩管道:自动压缩超大请求,规避上游 ~400KB 请求体限制(空白压缩、thinking 块处理、tool_result 截断、历史截断等)
    • 自适应二次压缩:请求体超阈值时自动迭代压缩,逐步降低截断阈值直至满足限制
    • 图片 Token 估算与自动压缩:大图自动缩放,支持多图模式下的差异化像素限制
    • WebSearch 工具支持:自动检测纯搜索请求并路由到本地处理,支持流式和非流式响应
    • 模型 -thinking 后缀支持:模型名含 -thinking 后缀时自动覆写 thinking 配置
    • 批量导入 token.json:支持拖放上传或粘贴 JSON,自动去重和格式映射
    • 缓存余额查询接口:列表页直接显示缓存余额,30 秒自动轮询
    • 用户亲和性绑定:连续对话优先使用同一凭据,保持会话连续性
    • 负载均衡模式:新增 Balanced(Least-Used)模式,支持前端切换
    • 多维度设备指纹系统:每个凭据生成独立的确定性指纹
    • 精细化速率限制:每日请求限制、请求间隔控制、指数退避策略
    • 凭据级代理和 Region 配置:支持每个凭据独立设置 HTTP 代理和 API Region
    • Bonus 用量包支持:合并基础额度、免费试用和激活的 bonuses
    • Kiro Web Portal API:支持查询账号套餐、用量、邮箱等信息
    • 前端批量操作:批量导入、验活、选择、删除、恢复功能
    • sensitive-logs feature flag:显式启用才允许打印敏感信息
    • 请求体大小预检:可配置阈值,序列化后拦截超大请求

    🐛 修复

    • 请求体大小预检现在会扣除图片 base64 字节,避免含图片的请求被误拒
    • WebSearch 混合工具场景不再误路由:仅纯搜索请求走本地处理,混合工具剔除 web_search 后转发上游
    • 压缩后自动修复孤立的 tool_use/tool_result 配对,避免上游返回 400
    • 配额耗尽时正确返回 429 而非 502
    • 亲和性检查不再消耗速率配额
    • 修复多字节字符(中文等)切片导致的 panic 风险
    • 修复 SSE 流 ping 保活首次立即触发的问题
    • 修复 assistant prefill 消息导致的 400 错误,改为静默丢弃
    • 修复凭据文件并发写入可能损坏的问题(原子写入)
    • 修复 IDC 凭据返回 403 的问题(Token 和 profile_arn 不匹配)
    • 修复 NaN 余额导致凭据选择异常的问题
    • API Key 日志泄露修复:默认仅显示末 4 位
    • system 字段兼容字符串和数组两种格式
    • 工具描述截断 max_description_chars=0 现在正确表示"不截断"

    🔧 改进

    • 凭据选择算法升级为三级排序:使用次数最少 → 余额最多 → 轮询
    • stop_reason 基于优先级覆盖,高优先级原因不会被低优先级覆盖
    • 动态余额缓存 TTL:高频凭据更短刷新间隔
    • 后台 Token 自动刷新:定期检查即将过期的 Token 并批量刷新
    • 独立冷却管理:7 种冷却原因,差异化冷却时长
    • 压缩统计日志改用字节单位,更准确
    • 日志中 user_id 自动掩码处理
    • 重试策略优化:单凭据最多重试 2 次,单请求最多重试 5 次
    • 移除 current_id 概念,凭据选择完全动态化

    Full Changelog: https://github.com/BenedictKing/kiro.rs/compare/v1.0.4...v1.0.13

    Downloads