論文の概要: CIRF: Tokenizing Chain-of-Thoughts into Reusable Functional Units for Efficient Latent Reasoning in Large Language Models
- arxiv url: http://arxiv.org/abs/2605.28292v1
- Date: Wed, 27 May 2026 10:40:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.982261
- Title: CIRF: Tokenizing Chain-of-Thoughts into Reusable Functional Units for Efficient Latent Reasoning in Large Language Models
- Title(参考訳): CIRF:大規模言語モデルにおける効率的な潜在推論のための再利用可能な機能単位への階層化
- Authors: Yukyung Lee, Yumeng Shen, Jinhyeong Park, Hyein Yang, Jun-Hyung Park,
- Abstract要約: Implicit Chain-of-Thought (CoT) は、明示的な論理を内部化することによって、大きな言語モデルの推論コストを削減する。
機能トークンの動的シーケンスとして推論を行う暗黙のCoTフレームワークであるCIRF(textitunderlineChain-of- Thoughts underlineInto underlineReusable underlineFunctional units)を提案する。
- 参考スコア(独自算出の注目度): 9.195294663061397
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Implicit Chain-of-Thought (CoT) reduces the inference cost of large language models by internalizing the explicit rationales. However, existing approaches typically lack alignment with explicit rationales and adaptivity to example complexity. In this work, we propose CIRF (\textit{\underline{C}hain-of-thoughts \underline{I}nto \underline{R}eusable \underline{F}unctional units}), an implicit CoT framework that performs reasoning as a dynamic sequence of discrete functional tokens. CIRF assigns a functional token to each semantically coherent reasoning unit in explicit CoT traces. The model is then fine-tuned to autoregressively generate functional tokens and their optional results, followed by the final answer. This design aligns latent reasoning with a sequence of functional units, facilitating parallel training, explicit rationale alignment, and adaptive reasoning. Extensive experiments on mathematical, symbolic, and commonsense reasoning benchmarks show that CIRF provides a favorable accuracy-latency trade-off compared with state-of-the-art implicit CoT methods. Further analyses demonstrate that CIRF constructs distinct, interpretable functional tokens, leading to consistent performance improvements.
- Abstract(参考訳): Implicit Chain-of-Thought (CoT) は、明示的な論理を内部化することによって、大きな言語モデルの推論コストを削減する。
しかし、既存のアプローチは典型的には、例えば複雑性に対する明確な論理と適応性を欠いている。
本研究では、離散関数トークンの動的シーケンスとして推論を行う暗黙のCoTフレームワークであるCIRF(\textit{\underline{C}hain-of- Thoughts \underline{I}nto \underline{R}eusable \underline{F}unctional units})を提案する。
CIRFは、明示的なCoTトレースで各セマンティックコヒーレント推論ユニットに関数トークンを割り当てる。
その後、モデルが微調整され、関数トークンとそのオプション結果が自動回帰的に生成される。
この設計は、潜在推論を一連の機能単位と整合させ、並列トレーニング、明示的論理的アライメント、適応的推論を容易にする。
数学、記号、コモンセンス推論のベンチマークに関する広範な実験は、CIRFが最先端の暗黙のCoT法と比較して、良好な精度-遅延トレードオフを提供することを示している。
さらなる分析により、CIRFは異なる、解釈可能な機能トークンを構成し、一貫した性能改善をもたらすことが示されている。
関連論文リスト
- TDA-RC: Task-Driven Alignment for Knowledge-Based Reasoning Chains in Large Language Models [54.20787536978013]
CoT(Chain-of-Thought)パラダイムはシングルラウンド効率の実践的応用を支配しているが、その推論チェーンは論理的ギャップをしばしば示している。
本稿では,推論連鎖を最適化するトポロジに基づく手法を提案する。
「本手法は推論精度と効率のバランスが良好であることを示し、多ラウンドインテリジェンスによる単ラウンド生成の実践的解決策を示す。」
論文 参考訳(メタデータ) (2026-03-13T13:01:01Z) - CoLT: Reasoning with Chain of Latent Tool Calls [31.228763375347608]
CoT(Chain-of-Thought)は、大規模言語モデル(LLM)の推論能力を高める重要な手法である。
ツールコールとして潜伏推論を実装する新しいフレームワークである「CoLT」を提案する。
論文 参考訳(メタデータ) (2026-02-04T06:12:53Z) - EntroCoT: Enhancing Chain-of-Thought via Adaptive Entropy-Guided Segmentation [18.606842425858]
CoT(Chain-of-Thought)の促進により、大規模言語モデルの数学的推論能力が大幅に向上した。
既存の微調整データセットは、しばしば"答えは正しいが間違った理由"プローブに悩まされる。
本稿では,高品質なCoT監視トレースを自動的に識別し,精錬するための統合フレームワークであるEntroCoTを提案する。
論文 参考訳(メタデータ) (2026-01-07T10:02:27Z) - SIM-CoT: Supervised Implicit Chain-of-Thought [108.30049193668083]
Implicit Chain-of-Thought(CoT)メソッドは、大規模言語モデルにおける明示的なCoT推論に代わるトークン効率の代替手段を提供する。
暗黙的なCoTの計算予算をスケールする際の中核的な不安定性問題を特定する。
そこで我々はSIM-CoTを提案する。SIM-CoTは,遅延推論空間を安定化・拡張するためのステップレベルの監視を実現するモジュールである。
論文 参考訳(メタデータ) (2025-09-24T17:01:32Z) - ConciseHint: Boosting Efficient Reasoning via Continuous Concise Hints during Generation [74.37307916314407]
提案するフレームワークはConciseHintと呼ばれ,推論モデルが簡潔に話すことを継続的に奨励する。
DeepSeek-R1 および Qwen-3 シリーズを含む最先端の LRM 実験により,本手法が簡潔な推論を効果的に生成できることが実証された。
論文 参考訳(メタデータ) (2025-06-23T16:20:44Z) - Sketch-of-Thought: Efficient LLM Reasoning with Adaptive Cognitive-Inspired Sketching [64.74765550805024]
Chain-of-Thoughtはステップバイステップの問題解決を促すが、中間出力の過剰な冗長性を犠牲にすることが多い。
我々は,認知にインスパイアされた推論パラダイムを言語制約と統合する促進フレームワークであるSketch-of-Thought(SoT)を提案する。
SoTはトークンを最大84%削減し、18の推論データセットで最小限の精度ロスを達成している。
論文 参考訳(メタデータ) (2025-03-07T06:57:17Z) - Improving Chain-of-Thought Reasoning via Quasi-Symbolic Abstractions [25.337811496479265]
CoT(Chain-of-Though)は、大規模言語モデルにおける推論のための一般的な戦略である。
準シンボリックな説明を通じて,LLMを高レベルの抽象化で動作させる,CoTのバリエーションであるQuaSARを提案する。
実験の結果,準記号的抽象化はCoT法を最大8%精度で改善できることがわかった。
論文 参考訳(メタデータ) (2025-02-18T07:58:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。