論文の概要: The $\mathbf{Y}$-Combinator for LLMs: Solving Long-Context Rot with $λ$-Calculus
- arxiv url: http://arxiv.org/abs/2603.20105v1
- Date: Fri, 20 Mar 2026 16:29:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 19:48:39.233852
- Title: The $\mathbf{Y}$-Combinator for LLMs: Solving Long-Context Rot with $λ$-Calculus
- Title(参考訳): LLM用$\mathbf{Y}$-コンビネータ:$λ$-Calculusを用いた長期回転の解法
- Authors: Amartya Roy, Rasul Tutunov, Xiaotong Ji, Matthieu Zimmer, Haitham Bou-Ammar,
- Abstract要約: $$-RLMは、$$-calculusの型付き関数型ランタイムを持つ、長期コンテキスト推論のためのフレームワークである。
モデルタスク比較を36のモデルタスク比較のうち29の標準RLMよりも高い性能を示し、モデル階層間の平均精度を+21.9ポイント改善し、レイテンシを最大4.1倍改善した。
- 参考スコア(独自算出の注目度): 13.924906970455302
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: LLMs are increasingly used as general-purpose reasoners, but long inputs remain bottlenecked by a fixed context window. Recursive Language Models (RLMs) address this by externalising the prompt and recursively solving subproblems. Yet existing RLMs depend on an open-ended read-eval-print loop (REPL) in which the model generates arbitrary control code, making execution difficult to verify, predict, and analyse. We introduce $λ$-RLM, a framework for long-context reasoning that replaces free-form recursive code generation with a typed functional runtime grounded in $λ$-calculus. It executes a compact library of pre-verified combinators and uses neural inference only on bounded leaf subproblems, turning recursive reasoning into a structured functional program with explicit control flow. We show that $λ$-RLM admits formal guarantees absent from standard RLMs, including termination, closed-form cost bounds, controlled accuracy scaling with recursion depth, and an optimal partition rule under a simple cost model. Empirically, across four long-context reasoning tasks and nine base models, $λ$-RLM outperforms standard RLM in 29 of 36 model-task comparisons, improves average accuracy by up to +21.9 points across model tiers, and reduces latency by up to 4.1x. These results show that typed symbolic control yields a more reliable and efficient foundation for long-context reasoning than open-ended recursive code generation. The complete implementation of $λ$-RLM, is open-sourced for the community at: https://github.com/lambda-calculus-LLM/lambda-RLM.
- Abstract(参考訳): LLMは汎用推論器としてますます使われているが、長い入力は固定されたコンテキストウィンドウによってボトルネックとなる。
RLM(Recursive Language Models)は、プロンプトを外部化し、サブプロブレムを再帰的に解決することでこの問題に対処する。
しかし、既存の RLM は、任意の制御コードを生成するオープンエンドのread-eval-print loop (REPL) に依存しており、実行の検証、予測、解析が困難である。
λ$-RLMは、自由形式の再帰的コード生成を$λ$-calculusの型付き関数型ランタイムに置き換える、長期コンテキスト推論のためのフレームワークです。
事前に検証されたコンビネータのコンパクトライブラリを実行し、有界な葉のサブプロブレムにのみ神経推論を使用し、再帰的推論を明示的な制御フローを持つ構造化機能プログラムに変換する。
λ$-RLMは, 終端, 閉形式コスト境界, 再帰深度による精度スケーリングの制御, 単純なコストモデルによる最適分割規則など, 標準RLMの形式的保証を欠いていることを示す。
経験的に、4つの長文推論タスクと9つのベースモデルにおいて、$λ$-RLMは36のモデルタスク比較のうち29の標準RTMよりも優れ、平均精度はモデル階層で+21.9ポイント向上し、レイテンシは4.1倍に低下する。
これらの結果から、型付き記号制御は、オープンな再帰的コード生成よりも、より信頼性が高く効率的な長文推論の基礎となることが示唆された。
https://github.com/lambda-calculus-LLM/lambda-RLM。
関連論文リスト
- $\nabla$-Reasoner: LLM Reasoning via Test-Time Gradient Descent in Latent Space [71.23672814629448]
$nabla$-Reasonerは、トークンログに対する差別化可能な最適化をデコードループに統合する反復生成フレームワークである。
$nabla$-Reasonerは、挑戦的な数学的推論ベンチマークで20%以上の精度の向上を実現している。
論文 参考訳(メタデータ) (2026-03-05T08:42:54Z) - Recursive Language Models [14.17788048231183]
本稿では,長いプロンプトを外部環境として扱う一般的な推論手法であるRecursive Language Models (RLMs)を提案する。
RLMはモデルウィンドウを超える2桁の処理に成功し、たとえ短いプロンプトであっても、ベースLLMの品質を劇的に上回っていることがわかった。
論文 参考訳(メタデータ) (2025-12-31T03:43:41Z) - LLMSR@XLLM25: An Empirical Study of LLM for Structural Reasoning [6.700515856842664]
We present Team asdfo123's submit to the LLMSR@XLLM25 shared task。
我々は、粒度、制御性、解釈可能な推論プロセスを生成する上で、大きな言語モデルを評価する。
提案手法は, マクロF1スコアを, より複雑で資源消費の少ないパイプラインと同等に達成し, 総合5位にランク付けする。
論文 参考訳(メタデータ) (2025-05-18T09:46:30Z) - Putting the Value Back in RL: Better Test-Time Scaling by Unifying LLM Reasoners With Verifiers [57.95157497749428]
RL$V$は、LLMを推論器と生成検証器の両方として共同で訓練することにより、任意の値自由なRL法を増強する。
RL$V$は、並列サンプリングでMATHの精度を20%以上向上し、効率的なテスト時間計算のスケーリングを可能にする。
論文 参考訳(メタデータ) (2025-05-07T22:41:26Z) - $Q\sharp$: Provably Optimal Distributional RL for LLM Post-Training [63.602824642605775]
$Qsharp$ は KL 正規化 RL の値に基づくアルゴリズムで、最適な正規化 $Q$ 関数を使用して参照ポリシーを導出する。
この結果から,LLMのポストトレーニングに有効なアプローチとして$Qsharp$が注目され,性能と理論的保証が向上した。
論文 参考訳(メタデータ) (2025-02-27T21:43:00Z) - FLARE: Faithful Logic-Aided Reasoning and Exploration [47.46564769245296]
タスク分解を用いて問題空間をトラバースする新しい手法を提案する。
我々はLarge Language Modelsを使ってソリューションを計画し、クエリを事実に軟式化し、論理プログラミングコードを使って述語する。
提案手法は,生成したコードに対する推論プロセスの忠実度を計算し,外部の解法に頼らずにマルチホップ探索のステップを解析する。
論文 参考訳(メタデータ) (2024-10-14T19:39:11Z) - Recursive Speculative Decoding: Accelerating LLM Inference via Sampling
Without Replacement [11.91629418177851]
投機的復号法(英: Speculative decoding)は、大規模言語モデルの推論・加速度法である。
近年の作業では、草稿の伐採によってこの方法が進歩している。
再帰的投機的復号法(Recursive Speculative Decoding:RSD)を提案する。
論文 参考訳(メタデータ) (2024-02-21T22:57:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。