論文の概要: Domain-Specialized Tree of Thought through Plug-and-Play Predictors
- arxiv url: http://arxiv.org/abs/2603.20267v1
- Date: Sat, 14 Mar 2026 10:22:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:38.784396
- Title: Domain-Specialized Tree of Thought through Plug-and-Play Predictors
- Title(参考訳): プラグアンドプレイ予測器による思考のドメイン特化木
- Authors: Xuanqi Gao, Haoyu Wang, Jun Sun, Shiqing Ma, Chao Shen,
- Abstract要約: 本稿では,ToT検索プロセスのガイドとして,軽量かつ教師付きで適応可能なプラグアンドプレイ予測器であるDSTを紹介する。
我々の予測器は動的でコンテキスト対応のプルーニングを可能にし、より単純な推論ステップで探索をほぼ効率よく進めることができる。
我々の研究は、木に基づく推論における精度-効率のトレードオフを効果的に解決し、ToTをLLMにおける複雑な問題解決のためのスケーラブルで実践的なパラダイムに変換する。
- 参考スコア(独自算出の注目度): 32.191360225502386
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: While Large Language Models (LLMs) have advanced complex reasoning, prominent methods like the Tree of Thoughts (ToT) framework face a critical trade-off between exploration depth and computational efficiency. Existing ToT implementations often rely on heavyweight LLM-based self-evaluation or rigid heuristics for branch pruning, making them prohibitively expensive and inflexible for broad application. To address this, we introduce DST, an adaptable, plug-and-play predictor that serves as a lightweight, supervised heuristic to guide the ToT search process. Our predictor enables dynamic, context-aware pruning, allowing the search to proceed with near-greedy efficiency on simpler reasoning steps while adaptively expanding the search beam only when encountering uncertainty or task complexity. We evaluate our approach on a diverse suite of benchmarks spanning mathematical reasoning, general reasoning, and complex logical reasoning. Experimental results demonstrate that our method achieves accuracy competitive with or superior to strong baselines, including standard ToT, while reducing computational overhead by 26-75%. Our work effectively resolves the accuracy-efficiency trade-off in tree-based reasoning, transforming ToT from a resource-intensive technique into a scalable and practical paradigm for complex problem-solving in LLMs.
- Abstract(参考訳): 大きな言語モデル(LLM)には高度な複雑な推論があるが、Tree of Thoughts(ToT)フレームワークのような顕著な手法は、探索深度と計算効率の間に重要なトレードオフに直面している。
既存のToTの実装は、しばしばヘビー級のLSMベースの自己評価や枝刈りの厳密なヒューリスティックに頼っている。
そこで本研究では,ToT検索プロセスのガイドを行う軽量な教師付きヒューリスティックとして機能する,適応可能なプラグアンドプレイ予測器であるDSTを紹介する。
我々の予測器は動的でコンテキスト対応のプルーニングを可能にし、不確実性やタスクの複雑さに遭遇した場合にのみ、検索ビームを適応的に拡張しながら、より単純な推論ステップでほぼグレードの効率で探索を進めることができる。
我々は、数学的推論、一般的な推論、複雑な論理的推論にまたがる様々なベンチマークについて、我々のアプローチを評価した。
実験により,提案手法は標準のToTを含む強力なベースラインに比較して精度を向上し,計算オーバーヘッドを26~75%削減することを示した。
本研究は,ToTを資源集約的手法から,LLMにおける複雑な問題解決のためのスケーラブルで実用的なパラダイムに変換することで,ツリーベースの推論における精度・効率のトレードオフを効果的に解決する。
関連論文リスト
- CoT-Seg: Rethinking Segmentation with Chain-of-Thought Reasoning and Self-Correction [50.67483317563736]
本稿では,段階的に考察し,必要な情報を検索し,結果を生成し,自己評価を行い,結果を洗練するシステムを提案する。
CoT-Segは、思考の連鎖推論と自己補正を組み合わせることで、推論セグメンテーションを再考する、トレーニング不要のフレームワークである。
論文 参考訳(メタデータ) (2026-01-24T11:41:54Z) - Reinforced Efficient Reasoning via Semantically Diverse Exploration [73.41112984160992]
検証可能な報酬(RLVR)による強化学習は,大規模言語モデル(LLM)の推論の強化に有効であることが証明された。
本研究では,LLMのための意味的多様性探索,すなわちROSEによる効率的な推論手法を提案する。
本手法は,意味エントロピーに基づく分岐戦略と$varepsilon$-exploration機構を組み込んだものである。
論文 参考訳(メタデータ) (2026-01-08T15:56:44Z) - Adaptive Test-Time Reasoning via Reward-Guided Dual-Phase Search [62.1546099504045]
本稿では、推論を計画と実行に分離する二相テストタイムスケーリングフレームワークを提案する。
具体的には、推論軌跡を分解し、各フェーズの報酬モデルを構築し、探索者が個別に計画と実行を探索、実行できるようにする。
数学的推論とコード生成ベンチマークの両方の実験により、我々の手法は計算の冗長性を低減しつつ、常に精度を向上することを示した。
論文 参考訳(メタデータ) (2025-09-29T19:27:23Z) - PixelThink: Towards Efficient Chain-of-Pixel Reasoning [70.32510083790069]
PixelThinkは、外部から推定されるタスクの難しさと内部で測定されたモデルの不確実性を統合する、シンプルで効果的なスキームである。
シーンの複雑さと予測信頼度に応じて推論の長さを圧縮することを学ぶ。
実験により,提案手法は推論効率と全体セグメンテーション性能の両方を改善した。
論文 参考訳(メタデータ) (2025-05-29T17:55:49Z) - ToTRL: Unlock LLM Tree-of-Thoughts Reasoning Potential through Puzzles Solving [4.987786842464663]
Tree-of-Thoughts (ToT) は、ツリー構造内の探索として推論をモデル化することによって、概念的により高度なアプローチを提供する。
ToTRLは、逐次CoT戦略に基づく並列ToT戦略の開発においてLLMを導くように設計されている。
ToTQwen3-8Bモデルは,複雑な推論タスクの性能向上と推論効率の向上を実現している。
論文 参考訳(メタデータ) (2025-05-19T05:18:58Z) - Dynamic Parallel Tree Search for Efficient LLM Reasoning [102.16694475391665]
Tree of Thoughts (ToT) は大規模言語モデル(LLM)推論を強化し、分散木としての問題解決を構造化する。
推論における推論経路を動的に最適化することを目的とした,新しい並列化フレームワークであるDynamic Parallel Tree Search (DPTS)を提案する。
Qwen-2.5とLlama-3のMath500とGSM8Kデータセットによる実験では、DPTSは平均で2-4倍効率が向上した。
論文 参考訳(メタデータ) (2025-02-22T14:13:37Z) - Policy Guided Tree Search for Enhanced LLM Reasoning [3.090041654375235]
Policy-Guided Tree Search (PGTS)は、強化学習と構造化木探索を組み合わせて推論経路を効率的にナビゲートするフレームワークである。
私たちの重要なイノベーションは、手作業や徹底的な検索の必要性をなくし、拡大、分岐、追跡、探索の終了を動的に決定する、学習されたポリシーです。
論文 参考訳(メタデータ) (2025-02-04T22:08:20Z) - Forest-of-Thought: Scaling Test-Time Compute for Enhancing LLM Reasoning [40.069109287947875]
我々はフォレスト・オブ・サート(FoT)と呼ばれる新しい推論フレームワークを提案する。
FoTは複数の推論木を統合し、複雑な論理問題を解くために集合的な意思決定を活用する。
FoTは、最も関連性の高い推論パスを選択するためにスパースアクティベーション戦略を採用し、効率と精度の両方を改善している。
論文 参考訳(メタデータ) (2024-12-12T09:01:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。