論文の概要: DiG-Plan: Mitigating Early Commitment for Tool-Graph Planning via Diffusion Guidance
- arxiv url: http://arxiv.org/abs/2606.05728v1
- Date: Thu, 04 Jun 2026 05:37:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 22:39:44.577121
- Title: DiG-Plan: Mitigating Early Commitment for Tool-Graph Planning via Diffusion Guidance
- Title(参考訳): DiG-Plan:拡散誘導によるツールグラフ計画の早期コミットの緩和
- Authors: Yansi Li, Zhuosheng Zhang,
- Abstract要約: DiG-Planは、実行可能な改善を通じて多様なツールセットを生成するフレームワークであり、続いて依存性予測用のARリファインダーがある。
TaskBenchでは、DEG-PlanがARベースラインを10%の相対的マージンで改善し、複雑なコンポジションタスクのAPI-Bankの結果が最大の利益を示している。
- 参考スコア(独自算出の注目度): 9.164732215651538
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generating executable tool plans requires selecting appropriate subsets from tool libraries, a combinatorial search problem with an exponentially large solution space. However, we identify a critical misalignment in predominant approaches: standard autoregressive (AR) decoding suffers from early commitment, where initial token choices rigidly constrain the search trajectory. A controlled study shows that masked denoising raises Pass@10 solution coverage from 0.320 to 0.943 over AR sampling under matched compute. Motivated by this, we propose DiG-Plan, a framework that decouples combinatorial exploration from structural refinement. DiG-Plan employs a diffusion-based proposer to generate diverse tool sets via iterative refinement, followed by an AR refiner for dependency prediction. On TaskBench, DiG-Plan improves over AR baselines by a 10% relative margin, with the largest gains on complex compositional tasks; API-Bank results show that the propose-refine-select design remains effective across domains. Code is available at https://github.com/puddingyeah/DiG-Plan.
- Abstract(参考訳): 実行可能なツールプランを生成するには、ツールライブラリから適切なサブセットを選択する必要がある。
標準自己回帰(AR)復号法は、初期トークン選択が探索軌道を厳格に制限する早期のコミットメントに苦しむ。
制御された研究によると、マスクされたデノイングは、一致した計算の下でARサンプリングでPass@10ソリューションカバレッジを0.320から0.943に引き上げる。
そこで本研究では,構造改良から組合せ探索を分離するフレームワークであるDiG-Planを提案する。
DiG-Planは拡散ベースのプロジェクタを使用して反復的な改善を通じて多様なツールセットを生成し、続いて依存性予測のためのARリファインダを生成する。
TaskBenchでは、DEG-PlanがARベースラインを10%の相対マージンで改善し、複雑な構成タスクで最大の利益を上げている。
コードはhttps://github.com/puddingyeah/DiG-Plan.comで入手できる。
関連論文リスト
- TIER: Trajectory-Invariant Execution Rewards for Multi-Step Tool Composition [62.56752617853322]
アウトカムベースの報酬はスパースフィードバックのみを提供するが、トラジェクトリによる報酬は注釈付き参照ソリューションに依存している。
本稿では,関数スキーマと実行時実行を直接管理する報奨フレームワークであるtrajectory-Invariant Execution Rewardsを提案する。
論文 参考訳(メタデータ) (2026-05-16T03:47:26Z) - A Learning Method with Gap-Aware Generation for Heterogeneous DAG Scheduling [6.655206888698601]
異種有向非巡回グラフ(DAG)のためのエンドツーエンド強化学習フレームワークを提案する。
WeCANはタスクプール互換性係数と生成誘起最適性ギャップに対処する。
グラフと実世界のTPC-H DAGの実験は、古典に匹敵する推論時間で、強いベースラインよりも改善されたメイスパンを示す。
論文 参考訳(メタデータ) (2026-03-24T14:16:08Z) - An Analysis of Constraint-Based Multi-Agent Pathfinding Algorithms [1.4853650545663049]
本研究では,将来のマルチエージェントパスフィンディング(MAPF)およびマルチロボットモーションプランニング(MRMP)アルゴリズムの設計について報告する。
我々は制約を保守的あるいは攻撃的と分類し、彼らの検索行動に関する洞察を提供する。
検索は決定フローチャートで合成され、適切な制約を選択するのに役立つ。
論文 参考訳(メタデータ) (2025-11-23T20:11:47Z) - Beyond ReAct: A Planner-Centric Framework for Complex Tool-Augmented LLM Reasoning [31.679428422518082]
そこで我々は,局所最適化ボトルネックを解決するために,プランナー中心のPlan-Executeパラダイムを提案する。
新しいプランナーモデルでは、複雑なクエリのためのグローバル指向非巡回グラフ(DAG)計画を実行する。
複雑なクエリを特徴とする大規模ベンチマークデータセットである ComplexTool-Plan も紹介する。
有能なエグゼキュータと統合すると、我々のフレームワークは複雑なユーザクエリのためのStableToolBenchベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-11-13T07:22:27Z) - GAP: Graph-Based Agent Planning with Parallel Tool Use and Reinforcement Learning [20.75113227786218]
グラフベースのエージェント計画(GAP)は、グラフベースの計画を通じてタスク間の依存関係を明示的にモデル化する新しいフレームワークである。
我々のアプローチは、複雑なタスクを依存性を意識したサブタスクグラフに分解する基礎モデルを訓練する。
この依存性を意識したオーケストレーションは、実行効率とタスクの正確性の両方で大幅に改善される。
論文 参考訳(メタデータ) (2025-10-29T09:35:55Z) - PlanGEN: A Multi-Agent Framework for Generating Planning and Reasoning Trajectories for Complex Problem Solving [89.60370366013142]
制約,検証,選択という3つの重要な要素を持つモデルに依存しない,スケーラブルなエージェントフレームワークであるPlanGENを提案する。
具体的には、推論時間アルゴリズムの性能を向上させるために、制約誘導反復検証を提案する。
論文 参考訳(メタデータ) (2025-02-22T06:21:56Z) - Random Aggregate Beamforming for Over-the-Air Federated Learning in Large-Scale Networks [66.18765335695414]
本稿では,アグリゲーションエラーを最小限に抑え,選択したデバイス数を最大化する目的で,共同装置の選択とアグリゲーションビームフォーミング設計について検討する。
コスト効率のよい方法でこの問題に取り組むために,ランダムな集合ビームフォーミング方式を提案する。
また, 得られた集計誤差と, デバイス数が大きい場合に選択したデバイス数についても解析を行った。
論文 参考訳(メタデータ) (2024-02-20T23:59:45Z) - Experiment Planning with Function Approximation [49.50254688629728]
本研究では,文脈的帯域幅問題における関数近似を用いた実験計画の問題点について検討する。
本稿では,関数近似に適合する2つの実験計画戦略を提案する。
そこで, 均一サンプリング器は, 動作数が少ない設定において, 競合最適性を達成できることを示す。
論文 参考訳(メタデータ) (2024-01-10T14:40:23Z) - Planning as In-Painting: A Diffusion-Based Embodied Task Planning
Framework for Environments under Uncertainty [56.30846158280031]
具体的AIのためのタスクプランニングは、最も難しい問題の1つだ。
In-paintingとしての計画」というタスク非依存の手法を提案する。
提案するフレームワークは,様々な具体的AIタスクにおいて,有望なパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-12-02T10:07:17Z) - Divide-and-Conquer Monte Carlo Tree Search For Goal-Directed Planning [78.65083326918351]
暗黙的な逐次計画の仮定に代わるものを検討する。
本稿では,最適計画の近似を行うため,Divide-and-Conquer Monte Carlo Tree Search (DC-MCTS)を提案する。
計画順序に対するこのアルゴリズム的柔軟性は,グリッドワールドにおけるナビゲーションタスクの改善に繋がることを示す。
論文 参考訳(メタデータ) (2020-04-23T18:08:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。