論文の概要: STATe-of-Thoughts: Structured Action Templates for Tree-of-Thoughts
- arxiv url: http://arxiv.org/abs/2602.14265v1
- Date: Sun, 15 Feb 2026 18:29:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-17 16:22:49.851345
- Title: STATe-of-Thoughts: Structured Action Templates for Tree-of-Thoughts
- Title(参考訳): STATe-of-Thoughts:Structured Action Templates for Tree-of-Thoughts
- Authors: Zachary Bamberger, Till R. Saenger, Gilad Morad, Ofra Amir, Brandon M. Stewart, Amir Feder,
- Abstract要約: STATeは高レベルの推論パターンを検索する解釈可能なITC手法である。
コントローラは、ハイレベルな推論選択を符号化する動作を選択し、ジェネレータは、それらの選択に条件付けられた推論ステップを生成し、評価器は、検索を誘導する候補をスコアする。
- 参考スコア(独自算出の注目度): 11.160709079880986
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Inference-Time-Compute (ITC) methods like Best-of-N and Tree-of-Thoughts are meant to produce output candidates that are both high-quality and diverse, but their use of high-temperature sampling often fails to achieve meaningful output diversity. Moreover, existing ITC methods offer limited control over how to perform reasoning, which in turn limits their explainability. We present STATe-of-Thoughts (STATe), an interpretable ITC method that searches over high-level reasoning patterns. STATe replaces stochastic sampling with discrete and interpretable textual interventions: a controller selects actions encoding high-level reasoning choices, a generator produces reasoning steps conditioned on those choices, and an evaluator scores candidates to guide search. This structured approach yields three main advantages. First, action-guided textual interventions produce greater response diversity than temperature-based sampling. Second, in a case study on argument generation, STATe's explicit action sequences capture interpretable features that are highly predictive of output quality. Third, estimating the association between performance and action choices allows us to identify promising yet unexplored regions of the action space and steer generation directly toward them. Together, these results establish STATe as a practical framework for generating high-quality, diverse, and interpretable text. Our framework is available at https://github.com/zbambergerNLP/state-of-thoughts.
- Abstract(参考訳): Best-of-NやTree-of-ThoughtsのようなITC(Inference-Time-Compute)メソッドは、高品質で多様な出力候補を生成するが、高温サンプリングは、しばしば有意義な出力の多様性を達成するのに失敗する。
さらに、既存のITCメソッドは、推論の実行方法の限定的な制御を提供し、結果的に説明可能性を制限する。
我々は,高レベルの推論パターンを探索する解釈可能なITC手法STATe-of-Thoughts(STATe)を提案する。
STATeは確率的サンプリングを個別かつ解釈可能なテキスト介入に置き換える: コントローラは高いレベルの推論選択を符号化するアクションを選択し、ジェネレータはそれらの選択を条件に推論ステップを生成し、評価器は検索を誘導する候補をスコアする。
この構造的アプローチは3つの大きな利点をもたらす。
第一に、行動誘導型テキスト介入は温度に基づくサンプリングよりも応答の多様性が高い。
第2に、引数生成のケーススタディにおいて、STATeの明示的なアクションシーケンスは、出力品質を非常に予測可能な解釈可能な特徴をキャプチャする。
第3に、パフォーマンス選択とアクション選択の関連性を推定することにより、アクション空間の有望かつ未探索な領域と、それらに向けてのステアジェネレーションを直接特定できる。
これらの結果は,高品質で多様で解釈可能なテキストを生成するための実践的なフレームワークとしてSTATeを確立している。
私たちのフレームワークはhttps://github.com/zbambergerNLP/state-of- Thoughtsで利用可能です。
関連論文リスト
- Fractional Reasoning via Latent Steering Vectors Improves Inference Time Compute [60.151643048803145]
本稿では,推論時の推論強度を連続的に制御するフレームワークであるフラクショナル推論を提案する。
提案手法は, より深い推論を伴う潜在ステアリングベクトルを抽出し, 調整可能なスケーリング係数で再適用することによって機能する。
GSM8K、MATH500、GPQAの実験により、フラクショナル推論は様々な推論タスクやモデルのパフォーマンスを一貫して改善することを示した。
論文 参考訳(メタデータ) (2025-06-18T21:15:59Z) - Quantifying Logical Consistency in Transformers via Query-Key Alignment [20.636818928993684]
本稿では,論理的推論のための新しい軽量評価手法を提案する。
提案手法は,1つのフォワードパスを計算し,慎重に選択されたヘッドから「QKスコア」を抽出することにより,無効な推論から確実に分離した潜在表現を明らかにする。
論文 参考訳(メタデータ) (2025-02-24T10:02:50Z) - Large Language Models Meet Symbolic Provers for Logical Reasoning Evaluation [24.081573908824353]
一階述語論理(FOL)推論はインテリジェントシステムにおいて重要である。
既存のベンチマークは、広範囲の人間のアノテーションや手作りテンプレートに依存していることが多い。
本稿では,大言語モデルの生成強度を記号型プローサの厳密性と精度で相乗化するProverGenという新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-10T15:31:54Z) - BRiTE: Bootstrapping Reinforced Thinking Process to Enhance Language Model Reasoning [78.63421517563056]
大規模言語モデル(LLM)は複雑な推論タスクにおいて顕著な機能を示した。
本稿では,新しいグラフィカルモデルを用いてLLM推論を定式化する統一確率的フレームワークを提案する。
本稿では,Bootstrapping Reinforced Thinking Process (BRiTE)アルゴリズムについて述べる。
論文 参考訳(メタデータ) (2025-01-31T02:39:07Z) - Bidirectional Decoding: Improving Action Chunking via Guided Test-Time Sampling [51.38330727868982]
動作チャンキングが学習者と実証者の間の分岐にどのように影響するかを示す。
動作チャンキングをクローズドループ適応でブリッジするテスト時間推論アルゴリズムである双方向デコーディング(BID)を提案する。
提案手法は、7つのシミュレーションベンチマークと2つの実世界のタスクにまたがって、最先端の2つの生成ポリシーの性能を向上させる。
論文 参考訳(メタデータ) (2024-08-30T15:39:34Z) - Enhancing Chain of Thought Prompting in Large Language Models via Reasoning Patterns [26.641713417293538]
Chain of Thought (CoT) は言語モデルに論理的推論を奨励する。
我々は,CoTの促進効果を高めるために推論パターンを活用することを提案する。
論文 参考訳(メタデータ) (2024-04-23T07:50:00Z) - Coherent Entity Disambiguation via Modeling Topic and Categorical
Dependency [87.16283281290053]
従来のエンティティ曖昧化(ED)メソッドは、参照コンテキストと候補エンティティの一致するスコアに基づいて予測を行う、識別パラダイムを採用している。
本稿では,エンティティ予測のコヒーレンス向上を目的とした新しいデザインを備えたEDシステムであるCoherentedを提案する。
我々は、人気EDベンチマークにおいて、平均1.3F1ポイントの改善により、最先端の新たな結果を得る。
論文 参考訳(メタデータ) (2023-11-06T16:40:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。