論文の概要: Think Anywhere in Code Generation
- arxiv url: http://arxiv.org/abs/2603.29957v1
- Date: Tue, 31 Mar 2026 16:24:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-01 15:25:03.854417
- Title: Think Anywhere in Code Generation
- Title(参考訳): コード生成のどこにでも考える
- Authors: Xue Jiang, Tianyu Zhang, Ge Li, Mengyang Liu, Taozhi Chen, Zhenhua Xu, Binhua Li, Wenpin Jiao, Zhi Jin, Yongbin Li, Yihong Dong,
- Abstract要約: Think-Anywhereは、LLMがコード生成中にオンデマンドで思考を実行することを可能にする、新しい推論メカニズムである。
我々は,Think-Anywhereが既存の推論手法と最近のポストトレーニング手法の両方に対して最先端の性能を達成することを示す。
分析の結果,Think-Anywhereは高エントロピー位置での推論を適応的に実行し,解釈可能性を高めることができることがわかった。
- 参考スコア(独自算出の注目度): 89.9273351013764
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in reasoning Large Language Models (LLMs) have primarily relied on upfront thinking, where reasoning occurs before final answer. However, this approach suffers from critical limitations in code generation, where upfront thinking is often insufficient as problems' full complexity only reveals itself during code implementation. Moreover, it cannot adaptively allocate reasoning effort throughout the code generation process where difficulty varies significantly. In this paper, we propose Think-Anywhere, a novel reasoning mechanism that enables LLMs to invoke thinking on-demand at any token position during code generation. We achieve Think-Anywhere by first teaching LLMs to imitate the reasoning patterns through cold-start training, then leveraging outcome-based RL rewards to drive the model's autonomous exploration of when and where to invoke reasoning. Extensive experiments on four mainstream code generation benchmarks (i.e., LeetCode, LiveCodeBench, HumanEval, and MBPP) show that Think-Anywhere achieves state-of-the-art performance over both existing reasoning methods and recent post-training approaches, while demonstrating consistent generalization across diverse LLMs. Our analysis further reveals that Think-Anywhere enables the model to adaptively invoke reasoning at high-entropy positions, providing enhanced interpretability.
- Abstract(参考訳): 大規模言語モデル(LLM)の推論の最近の進歩は、最終回答の前に推論が行われる事前思考に大きく依存している。
しかし、このアプローチはコード生成の限界に悩まされており、前もって考えることはしばしば不十分である。
さらに、難易度が著しく異なるコード生成プロセス全体で推論の労力を適応的に割り当てることができない。
本稿では,LLMがコード生成中の任意のトークン位置において,オンデマンドで思考を実行することができる新しい推論機構であるThink-Anywhereを提案する。
我々はまず、コールドスタートトレーニングを通じて推論パターンを模倣するようにLSMに教え、次に結果に基づくRL報酬を活用して、モデルがいつどこで推論を実行すべきかを自律的に探究することで、Think-Anywhereを実現する。
4つの主要なコード生成ベンチマーク(LeetCode、LiveCodeBench、HumanEval、MBPP)の広範な実験は、Think-Anywhereが既存の推論方法と最近のトレーニング後のアプローチの両方に対して最先端のパフォーマンスを実現し、多様なLCMをまたいだ一貫した一般化を実証していることを示している。
分析の結果,Think-Anywhereは高エントロピー位置での推論を適応的に実行し,解釈可能性を高めることができることがわかった。
関連論文リスト
- Diffuse Thinking: Exploring Diffusion Language Models as Efficient Thought Proposers for Reasoning [11.437063355666593]
そこで我々は,DLMを有効活用した効率的な協調推論フレームワークを提案し,その品質を評価するために,候補思考とLLMを生成する。
我々のフレームワークは複雑な推論タスクにおいて高いパフォーマンスを達成し、将来の研究に有望な方向性を提供する。
論文 参考訳(メタデータ) (2025-10-31T13:41:30Z) - SmartSwitch: Advancing LLM Reasoning by Overcoming Underthinking via Promoting Deeper Thought Exploration [49.290631188365786]
ロングチェーン・オブ・シークレット(LongCoT)は、複雑な推論タスクにおいて、大規模言語モデルによって達成された最近のブレークスルーの中心である。
本稿では,SmartSwitch推論フレームワークという,シンプルで効果的な推論手法を提案する。
このフレームワークは、プラグイン・アンド・プレイソリューションとして、どんな大きな言語モデルにも簡単に統合できる。
論文 参考訳(メタデータ) (2025-10-22T16:56:01Z) - PixelThink: Towards Efficient Chain-of-Pixel Reasoning [70.32510083790069]
PixelThinkは、外部から推定されるタスクの難しさと内部で測定されたモデルの不確実性を統合する、シンプルで効果的なスキームである。
シーンの複雑さと予測信頼度に応じて推論の長さを圧縮することを学ぶ。
実験により,提案手法は推論効率と全体セグメンテーション性能の両方を改善した。
論文 参考訳(メタデータ) (2025-05-29T17:55:49Z) - "Well, Keep Thinking": Enhancing LLM Reasoning with Adaptive Injection Decoding [4.008780119020479]
大規模言語モデル(LLM)は強力な推論能力を示しており、多くの場合、ほとんどショットやゼロショットの連鎖(CoT)のプロンプトによるものである。
本稿では,LLMを体系的に推論を継続し,未熟な推論を防止できる新しい復号法を提案する。
論文 参考訳(メタデータ) (2025-03-13T08:46:32Z) - SoftCoT: Soft Chain-of-Thought for Efficient Reasoning with LLMs [48.28847964704554]
CoT(Chain-of-Thought)推論により、LLM(Large Language Models)は複雑な推論タスクを解くことができる。
LLMの変更を必要としない連続空間推論のための新しい手法を提案する。
論文 参考訳(メタデータ) (2025-02-17T18:52:29Z) - Unveiling the Magic of Code Reasoning through Hypothesis Decomposition and Amendment [54.62926010621013]
我々は,大規模言語モデルの推論能力に対する新たな視点を提供するために,新しいタスクであるコード推論を導入する。
論理的推論の確立した形式に基づいて3つのメタベンチマークを要約し、8つの特定のベンチマークタスクにインスタンス化する。
本稿では,人間の複雑な問題解決手法に触発された新たな経路探索パイプラインを提案する。
論文 参考訳(メタデータ) (2025-02-17T10:39:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。