論文の概要: OrchDAG: Complex Tool Orchestration in Multi-Turn Interactions with Plan DAGs
- arxiv url: http://arxiv.org/abs/2510.24663v1
- Date: Tue, 28 Oct 2025 17:28:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-29 15:35:37.306224
- Title: OrchDAG: Complex Tool Orchestration in Multi-Turn Interactions with Plan DAGs
- Title(参考訳): OrchDAG: プランDAGとのマルチTurnインタラクションにおける複雑なツールオーケストレーション
- Authors: Yifu Lu, Shengjie Liu, Li Dong,
- Abstract要約: ツールの実行をDAG(directed acyclic graphs)としてモデル化し,複雑性を制御可能な合成データ生成パイプラインであるOrchDAGを紹介する。
モデル性能をベンチマークし、RLVRトレーニングを強化するためのグラフベースの報酬を提案する。
- 参考スコア(独自算出の注目度): 16.411431010733065
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Agentic tool use has gained traction with the rise of agentic tool calling, yet most existing work overlooks the complexity of multi-turn tool interactions. We introduce OrchDAG, a synthetic data generation pipeline that models tool execution as directed acyclic graphs (DAGs) with controllable complexity. Using this dataset, we benchmark model performance and propose a graph-based reward to enhance RLVR training. Experiments show that the dataset presents a challenging but solvable benchmark, and the proposed reward is effective when combined with GRPO-style algorithms, highlighting the importance of leveraging topological structure and data complexity in multi-turn tool use.
- Abstract(参考訳): エージェントツールの使用はエージェントツール呼び出しの興隆とともに勢いを増しているが、既存の作業のほとんどは、マルチターンツールインタラクションの複雑さを見落としている。
ツールの実行をDAG(directed acyclic graphs)としてモデル化し,複雑性を制御可能な合成データ生成パイプラインであるOrchDAGを紹介する。
このデータセットを用いて、モデル性能をベンチマークし、RLVRトレーニングを強化するためのグラフベースの報酬を提案する。
実験により、データセットは困難だが解決可能なベンチマークを示し、提案された報酬はGRPOスタイルのアルゴリズムと組み合わせることで有効であることが示され、マルチターンツールの使用において、トポロジカルな構造とデータ複雑さを活用することの重要性が強調された。
関連論文リスト
- Jupiter: Enhancing LLM Data Analysis Capabilities via Notebook and Inference-Time Value-Guided Search [37.53003959273494]
実世界のJupyterノートブックから高品質なツールベースのデータ解析タスクと実行可能なマルチステップソリューションを抽出するスケーラブルパイプラインを提案する。
このパイプラインを用いて、標準化されたタスク-解決ペアの大規模データセットであるNbQAを導入する。
また,データ解析を探索問題として定式化し,モンテカルロ木探索を適用した。
論文 参考訳(メタデータ) (2025-09-11T08:27:54Z) - Planning Agents on an Ego-Trip: Leveraging Hybrid Ego-Graph Ensembles for Improved Tool Retrieval in Enterprise Task Planning [0.0]
本稿では,ツール間のセマンティックな関係と機能的依存関係をキャプチャする,知識グラフに基づくツール検索フレームワークを提案する。
検索アルゴリズムは1-hop egoツールグラフのアンサンブルを利用して,ツール間の直接的および間接的な接続をモデル化する。
その結果,ツールグラフに基づく手法は,マイクロアベレージ・コンプリート・リコール・メトリックにおいて91.85%のツールカバレッジを実現していることがわかった。
論文 参考訳(メタデータ) (2025-08-07T22:41:12Z) - Procedural Environment Generation for Tool-Use Agents [55.10427063893754]
我々はRandomWorldを紹介した。これは対話型ツールと合成ツール利用データの手続き的生成のためのパイプラインである。
我々は,SFTとRLによるRandomWorldの合成データによるモデル調整により,様々なツール使用ベンチマークが改良されたことを示す。
論文 参考訳(メタデータ) (2025-05-21T14:10:06Z) - RGL: A Graph-Centric, Modular Framework for Efficient Retrieval-Augmented Generation on Graphs [58.10503898336799]
完全なRAGパイプラインをシームレスに統合するモジュラーフレームワークであるRAG-on-Graphs Library(RGL)を紹介した。
RGLは、さまざまなグラフフォーマットをサポートし、必須コンポーネントの最適化実装を統合することで、重要な課題に対処する。
評価の結果,RGLはプロトタイピングプロセスの高速化だけでなく,グラフベースRAGシステムの性能や適用性の向上も図っている。
論文 参考訳(メタデータ) (2025-03-25T03:21:48Z) - ROGRAG: A Robustly Optimized GraphRAG Framework [45.947928801693266]
グラフベースの検索強化生成(GraphRAG)は、動的検索のためのグラフとしてドメイン知識を構造化することによってこの問題に対処する。
既存のパイプラインには複雑なエンジニアリングが含まれており、個々のコンポーネントの影響を分離することは困難である。
本稿では,ロバストに最適化されたGraphRAGフレームワークであるROGRAGを紹介する。
論文 参考訳(メタデータ) (2025-03-09T06:20:24Z) - FlashRAG: A Modular Toolkit for Efficient Retrieval-Augmented Generation Research [70.6584488911715]
検索増強世代(RAG)は、かなりの研究関心を集めている。
既存のRAGツールキットは、しばしば重くて柔軟であり、研究者のカスタマイズのニーズを満たすことができない。
我々のツールキットは16の高度なRAGメソッドを実装し、38のベンチマークデータセットを収集し、整理した。
論文 参考訳(メタデータ) (2024-05-22T12:12:40Z) - Zero-shot Composed Text-Image Retrieval [72.43790281036584]
合成画像検索(CIR)の問題点を考察する。
テキストや画像などのマルチモーダル情報を融合し、クエリにマッチする画像を正確に検索し、ユーザの表現能力を拡張できるモデルをトレーニングすることを目的としている。
論文 参考訳(メタデータ) (2023-06-12T17:56:01Z) - GUESR: A Global Unsupervised Data-Enhancement with Bucket-Cluster
Sampling for Sequential Recommendation [58.6450834556133]
本研究では,グローバルな視点から複雑な関連性を持つ項目表現を強化するために,グラフコントラスト学習を提案する。
本稿では,CapsNetモジュールを拡張したターゲットアテンション機構により,ユーザの動的嗜好を導出する。
提案したGUESRは,大幅な改善を達成できただけでなく,汎用的な拡張戦略ともみなすことができた。
論文 参考訳(メタデータ) (2023-03-01T05:46:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。