Fugu-MT 論文翻訳(概要): To CoT or To Loop? A Formal Comparison Between Chain-of-Thought and Looped Transformers

論文の概要: To CoT or To Loop? A Formal Comparison Between Chain-of-Thought and Looped Transformers

arxiv url: http://arxiv.org/abs/2505.19245v1
Date: Sun, 25 May 2025 17:49:37 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-27 16:58:43.001698
Title: To CoT or To Loop? A Formal Comparison Between Chain-of-Thought and Looped Transformers
Title（参考訳）: CoTかループか? チェーン・オブ・ソートとループ変換器の形式的比較
Authors: Kevin Xu, Issei Sato,
Abstract要約: CoT(Chain-of-Thought)とLooped Transformerは、推論タスクのパフォーマンスを実証的に改善することが示されている。それぞれの強みと限界を形式的に分析する。
参考スコア（独自算出の注目度）: 32.01426831450348
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Chain-of-Thought (CoT) and Looped Transformers have been shown to empirically improve performance on reasoning tasks and to theoretically enhance expressivity by recursively increasing the number of computational steps. However, their comparative capabilities are still not well understood. In this paper, we provide a formal analysis of their respective strengths and limitations. We show that Looped Transformers can efficiently simulate parallel computations for deterministic tasks, which we formalize as evaluation over directed acyclic graphs. In contrast, CoT with stochastic decoding excels at approximate inference for compositional structures, namely self-reducible problems. These separations suggest the tasks for which depth-driven recursion is more suitable, thereby offering practical cues for choosing between reasoning paradigms.
Abstract（参考訳）: CoT(Chain-of-Thought)とLooped Transformers(Looped Transformers)は、推論タスクの性能を実証的に改善し、計算ステップ数を反復的に増加させることで、表現率を理論的に向上することが示されている。しかし、それらの比較能力はまだよく理解されていない。本稿では,それぞれの長所と短所を形式的に分析する。ループ変換器は決定論的タスクの並列計算を効率的にシミュレートできることを示し, 有向非巡回グラフに対する評価として定式化する。対照的に、確率的復号法を持つ CoT は、構成構造、すなわち自己可逆問題に対する近似推論において排他的である。これらの分離は、深さ駆動再帰がより適したタスクを示唆し、推論パラダイムの選択に実用的な手段を提供する。

関連論文リスト

Fractured Chain-of-Thought Reasoning [61.647243580650446]
完全CoTと解のみのサンプリングを補間する統合推論時間戦略であるフラクチャードサンプリングを導入する。フラクチャードサンプリングは、Pass@kとトークンの予算に対して、急激なログ線形スケーリングゲインをもたらすため、優れた精度とコストのトレードオフを一貫して達成できることを示す。
論文参考訳（メタデータ） (2025-05-19T11:30:41Z)
Reasoning by Superposition: A Theoretical Perspective on Chain of Continuous Thought [56.71873693264532]
連続CoTのD$ステップを持つ2層トランスが有向グラフ到達可能性問題を解くことができることを証明した。我々の構成では、各連続思考ベクトルは複数の探索フロンティアを同時に符号化する重ね合わせ状態である。
論文参考訳（メタデータ） (2025-05-18T18:36:53Z)
Dynamic Parallel Tree Search for Efficient LLM Reasoning [102.16694475391665]
Tree of Thoughts (ToT) は大規模言語モデル(LLM)推論を強化し、分散木としての問題解決を構造化する。推論における推論経路を動的に最適化することを目的とした,新しい並列化フレームワークであるDynamic Parallel Tree Search (DPTS)を提案する。 Qwen-2.5とLlama-3のMath500とGSM8Kデータセットによる実験では、DPTSは平均で2-4倍効率が向上した。
論文参考訳（メタデータ） (2025-02-22T14:13:37Z)
Enhancing Auto-regressive Chain-of-Thought through Loop-Aligned Reasoning [47.06427150903487]
CoT(Chain-of-Thought)プロンプトは、言語モデルの推論能力を高めるための強力なテクニックとして登場した。ループ変換器は目覚ましい長さの一般化能力を有するが、その限定的な一般化と適応性により、自己回帰解の代替として機能することができない。ループ変換器の強度をよりよく活用するためのRELAYを提案する。
論文参考訳（メタデータ） (2025-02-12T15:17:04Z)
Adaptive Graph of Thoughts: Test-Time Adaptive Reasoning Unifying Chain, Tree, and Graph Structures [0.0]
本稿では,動的グラフベースの推論フレームワークであるAdaptive Graph of Thoughts (AGoT)を紹介する。 AGoTはテスト時間のみでのLarge Language Models (LLM)推論を強化する。マルチホップ検索,科学的推論,数学的問題解決にまたがる多様なベンチマークに対するアプローチを検証する。
論文参考訳（メタデータ） (2025-02-07T16:54:19Z)
Pattern Tree: Enhancing Efficiency in Quantum Circuit Optimization Based on Pattern-matching [3.2801774304960447]
パターンマッチングに基づく量子回路最適化のための新しいフレームワークを提案する。パターンツリーに基づくパターンマッチングは、よく受け入れられたベンチマークセットで平均20%実行時間を短縮できることを示す。
論文参考訳（メタデータ） (2024-12-09T07:21:11Z)
Transformers Provably Solve Parity Efficiently with Chain of Thought [40.78854925996]
この研究は、複雑な問題を解決するためのトレーニングトランスの最初の理論的解析を提供する。我々は、基本的な$k$-parity問題を解くために、1層トランスを訓練することを検討する。
論文参考訳（メタデータ） (2024-10-11T08:55:17Z)
On Expressive Power of Looped Transformers: Theoretical Analysis and Enhancement via Timestep Encoding [32.01426831450348]
シーケンス・ツー・シーケンス関数の連続性のモジュラリティを定義することにより、ループ変換器の近似率を確立する。実験によって理論結果が検証され、ループ数が増加すると性能が向上することが示された。
論文参考訳（メタデータ） (2024-10-02T10:31:17Z)
Strengthening Structural Inductive Biases by Pre-training to Perform Syntactic Transformations [75.14793516745374]
中間学習によりトランスフォーマーの構造的帰納バイアスを強化することを提案する。実験の結果,チャンキングなどの構文的タスクのわずかな学習に有効であることが確認された。分析の結果,中間的事前学習は,どのトークンにシナティクス変換を適用する必要があるかを追尾する注意を喚起することが明らかとなった。
論文参考訳（メタデータ） (2024-07-05T14:29:44Z)
Tractable Bounding of Counterfactual Queries by Knowledge Compilation [51.47174989680976]
本稿では, パール構造因果モデルにおいて, 因果関係などの部分的特定可能なクエリのバウンダリングの問題について議論する。最近提案された反復EMスキームは初期化パラメータをサンプリングしてそれらの境界を内部近似する。シンボルパラメータを実際の値に置き換えた回路構造を,単一のシンボル知識コンパイルによって得られることを示す。
論文参考訳（メタデータ） (2023-10-05T07:10:40Z)
Multi-task Learning of Order-Consistent Causal Graphs [59.9575145128345]
我々は、$K関連ガウス非巡回グラフ(DAG)の発見問題を考える。マルチタスク学習環境下では, 線形構造方程式モデルを学習するためのMLE ($l_1/l$-regularized maximum chance estimator) を提案する。理論的には、関係するタスクにまたがるデータを活用することで、因果順序を復元する際のサンプルの複雑さをより高めることができることを示す。
論文参考訳（メタデータ） (2021-11-03T22:10:18Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。