[GH-ISSUE #98] [Question]: 思考链 的智商是否会影响 输出的智商?(如何不让队友变猪?) #67

Open
opened 2026-02-27 01:56:04 +03:00 by kerem · 4 comments
Owner

Originally created by @KingPollux on GitHub (Mar 16, 2025).
Original GitHub issue: https://github.com/ErlichLiu/DeepClaude/issues/98

提问前确认

  • 我已经查看了项目文档并没有找到答案
  • 我已经搜索了现有的 issues,确认没有类似的问题

问题类别

概念理解

您的问题

最近在对比测试中,发现,Deepseek在思考某些问题的时候,会在思考链中得出他自以为是的答案,这条思考链还会特别长。然后他自己会“觉得”(在思考链)这样告诉 用户才对(偶尔还附带:不对就是他的问题)。

那问题来了,他这自我感觉优良的思考,会不会对后方友军造成严重误导?

如何限制他给出的只是一个方向,框架。而不是一个错误的答案,然后还以为一定是对的,不对就让用户改他的东西。😅

我的测试还不够大量,只是提出一点点疑问。期待大家讨论。

背景信息

他的思考:
Image

他得到的结果:

Image

但是同一个问题,claude 自己做可能第一次就能基本答对了,稍微纠正就能完美运行。(我这只是一个很小很小的问题。而已啦)

代码示例(如适用)


其他信息

No response

Originally created by @KingPollux on GitHub (Mar 16, 2025). Original GitHub issue: https://github.com/ErlichLiu/DeepClaude/issues/98 ### 提问前确认 - [x] 我已经查看了项目文档并没有找到答案 - [x] 我已经搜索了现有的 issues,确认没有类似的问题 ### 问题类别 概念理解 ### 您的问题 最近在对比测试中,发现,Deepseek在思考某些问题的时候,会在思考链中得出他自以为是的答案,这条思考链还会特别长。然后他自己会“觉得”(在思考链)这样告诉 用户才对(偶尔还附带:不对就是他的问题)。 那问题来了,他这自我感觉优良的思考,会不会对后方友军造成严重误导? 如何限制他给出的只是一个方向,框架。而不是一个错误的答案,然后还以为一定是对的,不对就让用户改他的东西。😅 我的测试还不够大量,只是提出一点点疑问。期待大家讨论。 ### 背景信息 他的思考: ![Image](https://github.com/user-attachments/assets/b681e114-7d4a-4d8d-affc-18bcaa5632cb) 他得到的结果: ![Image](https://github.com/user-attachments/assets/40922d9a-d338-497d-96a5-981dcd472d32) 但是同一个问题,claude 自己做可能第一次就能基本答对了,稍微纠正就能完美运行。(我这只是一个很小很小的问题。而已啦) ### 代码示例(如适用) ```shell ``` ### 其他信息 _No response_
Author
Owner

@KingPollux commented on GitHub (Mar 16, 2025):

不懂代码,所以我就瞎说一下。说错请谅解。

有没有一种可能,就是对思考链和回答的两个模型分别设置 Temperature?也不知道会不会对最终引用的API造成影响。

这样,可以限制住某个LLM的发散度。

  • 比如我希望思考只是个框架,因为有了局限性和纠偏性,后者可以在这个框架里爱咋说咋说,Temperature 给到2. 写小说。
  • 也可能我希望思考链给出给各种思路各种角度的思考,最后回答者再从中提取最合适的回答。避免后者过于发散的使用情景。
<!-- gh-comment-id:2727096542 --> @KingPollux commented on GitHub (Mar 16, 2025): 不懂代码,所以我就瞎说一下。说错请谅解。 有没有一种可能,就是对思考链和回答的两个模型分别设置 Temperature?也不知道会不会对最终引用的API造成影响。 这样,可以限制住某个LLM的发散度。 - 比如我希望思考只是个框架,因为有了局限性和纠偏性,后者可以在这个框架里爱咋说咋说,Temperature 给到2. 写小说。 - 也可能我希望思考链给出给各种思路各种角度的思考,最后回答者再从中提取最合适的回答。避免后者过于发散的使用情景。
Author
Owner

@GowayLee commented on GitHub (Mar 16, 2025):

这个问题确实存在, 我的发现是有时候deepseek会对着一个问题陷入递归推理, 导致思维链特别长而且对回答的claude来说都是无意义的干扰内容.

  • 更改模型调用逻辑, 直接让deepseek回答推理逻辑与任务规划(将ds的回答发给claude而不是思维链)可能有效, 避免了极长思维链造成的claude输入token浪费, 并可以在一定程度上规避ds的递归推理对claude造成影响.

但是递归推理的问题仍然无法从源头解决, deepclaude作为应用层, 比较难以优雅地解决这种模型层的问题.

  • 比如我希望思考只是个框架,因为有了局限性和纠偏性,后者可以在这个框架里爱咋说咋说,Temperature 给到2. 写小说。
  • 也可能我希望思考链给出给各种思路各种角度的思考,最后回答者再从中提取最合适的回答。避免后者过于发散的使用情景。

思考框架 的概念也是我们后续更新的可能方向. 不仅需要设置不同的temperature, 还可以使用不同的prompt来使模型的回答效果更加可控.

<!-- gh-comment-id:2727112168 --> @GowayLee commented on GitHub (Mar 16, 2025): 这个问题确实存在, 我的发现是有时候deepseek会对着一个问题陷入递归推理, 导致思维链特别长而且对回答的claude来说都是无意义的干扰内容. - 更改模型调用逻辑, 直接让deepseek回答推理逻辑与任务规划(将ds的回答发给claude而不是思维链)可能有效, 避免了极长思维链造成的claude输入token浪费, 并可以在一定程度上规避ds的递归推理对claude造成影响. 但是递归推理的问题仍然无法从源头解决, deepclaude作为应用层, 比较难以优雅地解决这种模型层的问题. > * 比如我希望思考只是个框架,因为有了局限性和纠偏性,后者可以在这个框架里爱咋说咋说,Temperature 给到2. 写小说。 > * 也可能我希望思考链给出给各种思路各种角度的思考,最后回答者再从中提取最合适的回答。避免后者过于发散的使用情景。 _思考框架_ 的概念也是我们后续更新的可能方向. 不仅需要设置不同的temperature, 还可以使用不同的prompt来使模型的回答效果更加可控.
Author
Owner

@KingPollux commented on GitHub (Mar 16, 2025):

太好了,期待后续更新。
也许限制Deepseek的temperature,可以一定程度上避免他陷入递归推理。

另外,似乎也可以单独给Deepseek一个预提示词(抱歉,对一个代码外行,会有很多非标名词出现😋)。我的意思事,就比如“沉浸式翻译”这个浏览器插件里,它调用API的时候,是预选给LLM设置一个提示词,让他乖乖的只做翻译,而不要去胡思乱想,或“给出答案”。也许这样能让他“只给出解答用户问题的框架”,这样后方队友就能收到一个纯粹的解答框架。

顺便提一个小期待:

  • 在设置api的时候,希望有一个测试按钮,这样我们就能测到API到DeepClaude程序是不是通的,避免在前端出问题,纠结到底是程序问题还是网络问题,最后其实是API填错了导致的(复制粘贴也填错,真是服了我~🤣🤣🤣
<!-- gh-comment-id:2727554319 --> @KingPollux commented on GitHub (Mar 16, 2025): 太好了,期待后续更新。 也许限制Deepseek的temperature,可以一定程度上避免他陷入递归推理。 另外,似乎也可以单独给Deepseek一个预提示词(抱歉,对一个代码外行,会有很多非标名词出现😋)。我的意思事,就比如“沉浸式翻译”这个浏览器插件里,它调用API的时候,是预选给LLM设置一个提示词,让他乖乖的只做翻译,而不要去胡思乱想,或“给出答案”。也许这样能让他“只给出解答用户问题的框架”,这样后方队友就能收到一个纯粹的解答框架。 顺便提一个小期待: - 在设置api的时候,希望有一个测试按钮,这样我们就能测到API到DeepClaude程序是不是通的,避免在前端出问题,纠结到底是程序问题还是网络问题,最后其实是API填错了导致的(复制粘贴也填错,真是服了我~🤣🤣🤣)
Author
Owner

@GowayLee commented on GitHub (Mar 17, 2025):

#86

<!-- gh-comment-id:2727862164 --> @GowayLee commented on GitHub (Mar 17, 2025): #86
Sign in to join this conversation.
No milestone
No project
No assignees
1 participant
Notifications
Due date
The due date is invalid or out of range. Please use the format "yyyy-mm-dd".

No due date set.

Dependencies

No dependencies set.

Reference
starred/DeepClaude#67
No description provided.