論文の概要: Thinking with Reasoning Skills: Fewer Tokens, More Accuracy
- arxiv url: http://arxiv.org/abs/2604.21764v2
- Date: Sat, 25 Apr 2026 16:45:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 13:03:00.565578
- Title: Thinking with Reasoning Skills: Fewer Tokens, More Accuracy
- Title(参考訳): 推論スキルを考える - トークンの不足と正確性
- Authors: Guangxiang Zhao, Qilong Shi, Xusen Xiao, Xiangzheng Zhang, Tong Yang, Lin Sun,
- Abstract要約: 推論 LLM は、しばしば新しい問題を解決する際に、長い中間的推論トレースにかなりのトークンを使う。
本稿では,広範囲な検討と試行錯誤から抽出した再利用可能な推論スキルを要約し,保存することを提案する。
- 参考スコア(独自算出の注目度): 10.06085033727538
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reasoning LLMs often spend substantial tokens on long intermediate reasoning traces (e.g., chain-of-thought) when solving new problems. We propose to summarize and store reusable reasoning skills distilled from extensive deliberation and trial-and-error exploration, and to retrieve these skills at inference time to guide future reasoning. Unlike the prevailing \emph{reasoning from scratch} paradigm, our approach first recalls relevant skills for each query, helping the model avoid redundant detours and focus on effective solution paths. We evaluate our method on coding and mathematical reasoning tasks, and find that it significantly reduces reasoning tokens while improving overall performance. The resulting lower per-request cost indicates strong practical and economic potential for real-world deployment.
- Abstract(参考訳): 推論 LLM は、しばしば、新しい問題を解決する際に、長い中間的推論トレース(例えば、チェーン・オブ・シント)に実質的なトークンを使う。
本研究では,広範囲な検討と試行錯誤から抽出した再利用可能な推論スキルを要約・保存し,これらのスキルを推論時に回収し,今後の推論を導くことを提案する。
一般的な‘emph{reasoning from scratch}パラダイムとは異なり、私たちのアプローチはまずクエリ毎に関連するスキルをリコールし、冗長なデタウトを避け、効果的なソリューションパスに集中するのに役立つ。
提案手法のコーディングおよび数理推論タスクの評価を行い,解析トークンを大幅に削減し,全体的な性能を向上することを確認した。
その結果、要求毎のコストの低減は、実世界の展開に強い実用的および経済的な可能性を示唆している。
関連論文リスト
- In-Token Rationality Optimization: Towards Accurate and Concise LLM Reasoning via Self-Feedback [38.915062716409686]
InTROはトークンレベルの探索と,正確かつ簡潔な推論のための自己フィードバックを可能にする,新たなフレームワークである。
InTROは他のベースラインを一貫して上回り、ベースモデルと比較して解の精度を最大20%向上させる。
その思考の連鎖は明らかに簡潔であり、冗長性が低下している。
論文 参考訳(メタデータ) (2025-11-13T01:47:06Z) - Learning to Reason Efficiently with Discounted Reinforcement Learning [57.28725125116862]
大きな推論モデル(LRM)は、しばしば過剰なトークンを消費し、計算コストと遅延を膨らませる。
より長い応答によって精度が向上するという仮定に挑戦する。
割引強化学習装置(小額のトークンコストと解釈できる)を用いた推論トークンのペナルティ化と、制限された政策クラスにおけるブラックウェル最適性の分析により、簡潔で正確な推論を奨励する。
論文 参考訳(メタデータ) (2025-10-27T16:17:45Z) - Do Thinking Tokens Help or Trap? Towards More Efficient Large Reasoning Model [7.8354921036790275]
大きな推論モデル(LRM)は複雑な問題を解決するのに優れているが、過度なジレンマに直面している。
単純なタスクを扱う場合、思考トークンがオーバーロードされた冗長なレスポンスを生成することが多い。
これらのトークンは、リフレクションやバックトラックのような不要な高レベルの推論動作を引き起こし、効率を低下させる。
論文 参考訳(メタデータ) (2025-06-30T13:30:33Z) - Think Clearly: Improving Reasoning via Redundant Token Pruning [57.01254508252785]
推論過程における冗長性を意図的に除去することで、性能が大幅に向上することを示す。
本手法は, 推論集約型ベンチマークにおいて, トレーニングを伴わずに, 全体的な精度を著しく向上することを示した。
論文 参考訳(メタデータ) (2025-06-17T06:04:01Z) - Harnessing the Reasoning Economy: A Survey of Efficient Reasoning for Large Language Models [51.85792055455284]
大規模言語モデル(LLM)の最近の進歩は、複雑な推論タスクを実行する能力を大幅に強化している。
システム1推論は計算効率が良いが、最適以下の性能をもたらす。
システム2推論(System 2 reasoning)は、思考の遅さや非効率性、不必要な推論の振る舞いにより、かなりの計算コストを発生させることが多い。
論文 参考訳(メタデータ) (2025-03-31T17:58:07Z) - Efficient Inference for Large Reasoning Models: A Survey [74.17203483365171]
LRM(Large Reasoning Models)は、Large Language Models(LLM)の推論能力を大幅に向上させる。
しかし、それらの熟考的推論プロセスはトークンの使用、メモリ消費、推論時間に非効率をもたらす。
本調査では, LRMに特化して設計された効率的な推論手法を概説し, 推論品質を維持しつつトークンの非効率を緩和することに着目した。
論文 参考訳(メタデータ) (2025-03-29T13:27:46Z) - FINEREASON: Evaluating and Improving LLMs' Deliberate Reasoning through Reflective Puzzle Solving [90.88021670297664]
FINEREASONは、大規模言語モデルの推論能力を評価するための論理パズルベンチマークである。
状態チェックと状態遷移という2つのタスクを導入し、モデルが現在の状況をどのように評価するかを総合的に評価し、次の動きを計画する。
状態チェックと遷移データに基づいてトレーニングされたモデルでは、GSM8Kで最大5.1%の精度で数学推論が向上することを示す。
論文 参考訳(メタデータ) (2025-02-27T16:23:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。