論文の概要: DyCon: Dynamic Reasoning Control via Evolving Difficulty Modeling
- arxiv url: http://arxiv.org/abs/2606.07108v2
- Date: Mon, 08 Jun 2026 06:45:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:05.068287
- Title: DyCon: Dynamic Reasoning Control via Evolving Difficulty Modeling
- Title(参考訳): DyCon:進化困難モデリングによる動的推論制御
- Authors: Tengyao Tu, Yulin Li, Hui-Ling Zhen, Libo Qin, Zhoujun Wei, Jinghua Piao, Zhuotao Tian, Yong Li, Min Zhang,
- Abstract要約: 本稿では,問題の難易度は推論過程を通じて動的に進化し,Large Reasoning Modelsのステップレベルの埋め込みに線形に符号化されていることを示す。
我々は、遅延ステップレベルの表現を利用して、進化するタスクの難しさを明示的にモデル化する、トレーニング不要のフレームワークDyConを提案する。
DyConは、精度や一般化を犠牲にすることなく冗長なステップを減らし、推論効率を著しく向上させる。
- 参考スコア(独自算出の注目度): 37.503639139645166
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in Large Reasoning Models (LRMs) demonstrate remarkable performance improvements by iteratively reflecting, exploring, and executing complex tasks, yet suffer from inefficiencies due to redundant reasoning, known as "overthinking". Existing methods to mitigate this issue either rely on static difficulty estimates or require task-specific training, and thus fail to adapt to the dynamic complexity during reasoning. In this work, we empirically show that the problem difficulty evolves dynamically throughout the reasoning process and is linearly encoded in the LRM's step-level embeddings. Building on this insight, we propose DyCon, a training-free framework that leverages latent step-level representations to explicitly model the evolving task difficulty, enabling the dynamic control of reasoning depth to mitigate the overthinking issue. Extensive experiments conducted on four models ranging from 4B to 32B, and across twelve benchmarks in math reasoning, general question answering, and coding tasks demonstrate that DyCon significantly enhances reasoning efficiency by reducing redundant steps without sacrificing accuracy or generalization. Code is available at https://github.com/yu-lin-li/DyCon.
- Abstract(参考訳): 近年のLRM(Large Reasoning Models)の進歩は、複雑なタスクを反復的に反映し、探索し、実行することによって、顕著なパフォーマンス向上を示すが、冗長な推論("overthinking")によって非効率に悩まされている。
この問題を緩和するための既存の手法は、静的な難易度推定に依存するか、タスク固有のトレーニングを必要とするかのいずれかであり、従って推論中に動的な複雑さに適応できない。
本研究では,問題の難易度が推論過程を通して動的に進化し,LRMのステップレベルの埋め込みに線形に符号化されることを実証的に示す。
この知見に基づいて、我々は遅延ステップレベルの表現を活用して、進化するタスクの難しさを明示的にモデル化し、推論深度を動的に制御することで、過大な問題を緩和する、トレーニング不要のフレームワークDyConを提案する。
4Bから32Bの4つのモデル、12ベンチマークの数学推論、一般質問応答、コーディングタスクで実施された大規模な実験は、DyConが精度や一般化を犠牲にすることなく冗長なステップを減らし、推論効率を著しく向上することを示した。
コードはhttps://github.com/yu-lin-li/DyConで入手できる。
関連論文リスト
- MixReasoning: Switching Modes to Think [79.70845484191543]
推論モデルは、ステップバイステップで問題に取り組むことでパフォーマンスを向上させる。
あらゆるステップに拡張推論を適用することは、かなりの冗長性をもたらす。
一つの応答内で推論の深さを動的に調整するフレームワークであるMixReasoningを提案する。
論文 参考訳(メタデータ) (2025-10-07T15:46:34Z) - Less is More Tokens: Efficient Math Reasoning via Difficulty-Aware Chain-of-Thought Distillation [82.2288581878096]
本稿では,問題複雑性に基づいてモデルに推論深度を動的に調整する難易度推論の枠組みを提案する。
モデルにそのような動的推論経路を与えることができ、アーキテクチャ上の変更を加えることなく実現可能であることを示す。
論文 参考訳(メタデータ) (2025-09-05T16:40:13Z) - The Illusion of Thinking: Understanding the Strengths and Limitations of Reasoning Models via the Lens of Problem Complexity [16.266145641151375]
大規模な推論モデルは、回答を提供する前に詳細な思考プロセスを生成する。
我々は, LRM がある種の複雑さを超えて完全に精度の低下に直面していることを示す。
また、より深く推論の痕跡を調べ、探索された解のパターンを研究する。
論文 参考訳(メタデータ) (2025-06-07T22:42:29Z) - PATS: Process-Level Adaptive Thinking Mode Switching [53.53401063490537]
現在の大言語モデル(LLM)は、通常、難易度に関わらず、すべての質問に対して、単純または複雑に固定された推論戦略を採用する。
このようなタスクと推論プロセスの複雑さの変化の無視は、パフォーマンスと効率のバランスを損なう。
既存の手法では, 難易度が異なる問題に対処するために, 学習不要な高速スロー思考システムを導入しようとするが, 厳密な解レベルの戦略調整によって制限される。
プロセスレベル適応思考モードスイッチング(PATS)という新しい推論パラダイムを提案し,各ステップの難易度に基づいてLLMが推論戦略を動的に調整し,そのバランスを最適化する。
論文 参考訳(メタデータ) (2025-05-25T17:58:50Z) - Sketch-of-Thought: Efficient LLM Reasoning with Adaptive Cognitive-Inspired Sketching [64.74765550805024]
Chain-of-Thoughtはステップバイステップの問題解決を促すが、中間出力の過剰な冗長性を犠牲にすることが多い。
我々は,認知にインスパイアされた推論パラダイムを言語制約と統合する促進フレームワークであるSketch-of-Thought(SoT)を提案する。
SoTはトークンを最大84%削減し、18の推論データセットで最小限の精度ロスを達成している。
論文 参考訳(メタデータ) (2025-03-07T06:57:17Z) - SRA-MCTS: Self-driven Reasoning Augmentation with Monte Carlo Tree Search for Code Generation [14.786100203787194]
大規模な言語モデルは、単純なコード生成タスクでは例外的なパフォーマンスを示しますが、複雑な問題に対処する上での課題に直面します。
本稿では,高品質な中間推論経路を自律的に生成するモデルであるSRA-MCTSを提案する。
我々の手法は、追加の監督を必要とせず、モデル自体を通して完全に機能する。
論文 参考訳(メタデータ) (2024-11-17T12:31:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。