[GH-ISSUE #762] [bug] 语音服务几乎不可用 #564

Open
opened 2026-03-02 03:40:34 +03:00 by kerem · 0 comments
Owner

Originally created by @4965898 on GitHub (Nov 6, 2025).
Original GitHub issue: https://github.com/codexu/note-gen/issues/762

详细描述这个 Bug

最新版本中虽然有了语音功能,但几乎不可用。
我试过调用百炼、硅基流动、智谱等平台的语音模型,均不可用
原因如下:
语音模型与对话模型地址不一样,而BaseURL会自动补全地址且不能强制使用自定义,这样反而使得调用语音模型的专有地址不可用,如硅基流动使用https://api.siliconflow.cn/v1/audio/transcriptions才能调用语音模型;百炼则是:dashscope.aliyuncs.com/api-ws/v1/realtime
因此无论是TTS还是STT均无法使用。

NoteGen 版本

v0.22.3

操作系统

Windows

报错日志

No response

Originally created by @4965898 on GitHub (Nov 6, 2025). Original GitHub issue: https://github.com/codexu/note-gen/issues/762 ### 详细描述这个 Bug 最新版本中虽然有了语音功能,但几乎不可用。 我试过调用百炼、硅基流动、智谱等平台的语音模型,均不可用 原因如下: 语音模型与对话模型地址不一样,而BaseURL会自动补全地址且不能强制使用自定义,这样反而使得调用语音模型的专有地址不可用,如硅基流动使用https://api.siliconflow.cn/v1/audio/transcriptions才能调用语音模型;百炼则是:dashscope.aliyuncs.com/api-ws/v1/realtime 因此无论是TTS还是STT均无法使用。 ### NoteGen 版本 v0.22.3 ### 操作系统 Windows ### 报错日志 _No response_
Sign in to join this conversation.
No milestone
No project
No assignees
1 participant
Notifications
Due date
The due date is invalid or out of range. Please use the format "yyyy-mm-dd".

No due date set.

Dependencies

No dependencies set.

Reference
starred/note-gen#564
No description provided.