論文の概要: SceneOrchestra: Efficient Agentic 3D Scene Synthesis via Full Tool-Call Trajectory Generation
- arxiv url: http://arxiv.org/abs/2604.19907v1
- Date: Tue, 21 Apr 2026 18:33:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-23 15:36:10.748279
- Title: SceneOrchestra: Efficient Agentic 3D Scene Synthesis via Full Tool-Call Trajectory Generation
- Title(参考訳): SceneOrchestra: フルツールコール軌道生成による効率的なエージェント3次元シーン合成
- Authors: Yun He, Kelin Yu, Matthias Zwicker,
- Abstract要約: 3Dシーン作成のためのトレーニング可能なオーケストレーションフレームワークであるSceneOrchestraを提案する。
SceneOrchestraはオーケストレータと識別器で構成されており、2段階のトレーニング戦略で微調整します。
本手法は,従来の作業に比べて実行時間を短縮しつつ,最先端のシーン品質を実現する。
- 参考スコア(独自算出の注目度): 13.62882510697547
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent agentic frameworks for 3D scene synthesis have advanced realism and diversity by integrating heterogeneous generation and editing tools. These tools are organized into workflows orchestrated by an off-the-shelf LLM. Current approaches typically adopt an execute-review-reflect loop: at each step, the orchestrator executes a tool, renders intermediate results for review, and then decides on the tool and its parameters for the next step. However, this design has two key limitations. First, next-step tool selection and parameter configuration are driven by heuristic rules, which can lead to suboptimal execution flows, unnecessary tool invocations, degraded output quality, and increased runtime. Second, rendering and reviewing intermediate results after each step introduces additional latency. To address these issues, we propose SceneOrchestra, a trainable orchestration framework that optimizes the tool-call execution flow and eliminates the step-by-step review loop, improving both efficiency and output quality. SceneOrchestra consists of an orchestrator and a discriminator, which we fine-tune with a two-phase training strategy. In the first phase, the orchestrator learns context-aware tool selection and complete tool-call trajectory generation, while the discriminator is trained to assess the quality of full trajectories, enabling it to select the best trajectory from multiple candidates. In the second phase, we perform interleaved training, where the discriminator adapts to the orchestrator's evolving trajectory distribution and distills its discriminative capability back into the orchestrator. At inference, we only use the orchestrator to generate and execute full tool-call trajectories from instructions, without requiring the discriminator. Extensive experiments show that our method achieves state-of-the-art scene quality while reducing runtime compared to previous work.
- Abstract(参考訳): 最近の3次元シーン合成のためのエージェントフレームワークは、異種生成と編集ツールを統合することで、高度なリアリズムと多様性を実現している。
これらのツールは、既製のLLMによってオーケストレーションされたワークフローに編成される。
それぞれのステップでオーケストレータがツールを実行し、レビューの中間結果をレンダリングし、次に次のステップでツールとそのパラメータを決定する。
しかし、この設計には2つの重要な制限がある。
まず、次のステップのツール選択とパラメータ設定はヒューリスティックなルールによって駆動されるため、最適化された実行フロー、不要なツール呼び出し、出力品質の低下、ランタイムの増大につながる可能性がある。
第2に、各ステップの後に中間結果のレンダリングとレビューが追加のレイテンシを導入している。
これらの問題に対処するために、ツールコール実行フローを最適化し、ステップバイステップのレビューループを排除し、効率と出力品質の両方を改善したトレーニング可能なオーケストレーションフレームワークであるSceneOrchestraを提案する。
SceneOrchestraはオーケストレータと識別器で構成されており、2段階のトレーニング戦略で微調整します。
第1段階では、オーケストレータは、コンテキスト認識ツールの選択と完全なツールコールトラジェクトリ生成を学習し、一方、判別器は、完全なトラジェクトリの品質を評価するために訓練され、複数の候補から最適なトラジェクトリを選択することができる。
第2フェーズでは,識別器がオーケストレータの進行する軌道分布に適応し,その識別能力をオーケストレータに蒸留するインターリーブドトレーニングを行う。
推論では、オーケストレータのみを使用して命令から完全なツール呼び出しトラジェクトリを生成し、実行します。
大規模な実験により,本手法は過去の作業に比べて実行時間を短縮しつつ,最先端のシーン品質を実現することが示された。
関連論文リスト
- Small Model as Master Orchestrator: Learning Unified Agent-Tool Orchestration with Parallel Subtask Decomposition [61.291733522717415]
Agent-as-Toolは並列オーケストレーションのパラダイムであり、エージェントとツールの両方を標準化された学習可能なアクション空間に緩和する。
ParaManagerは、サブタスク解決から計画決定を分離し、ステート対応の並列サブタスク分解、デリゲート、非同期実行を可能にする。
実験により、ParaManagerは複数のベンチマークで高い性能を示し、目に見えないモデルプールの下で堅牢な一般化を示す。
論文 参考訳(メタデータ) (2026-04-18T14:41:27Z) - Training LLMs for Multi-Step Tool Orchestration with Constrained Data Synthesis and Graduated Rewards [76.49428173793386]
LLMは、中間出力を伝搬しながら、正しい順序で複数の依存APIを呼び出す必要がある。
既存の環境は、シミュレーションデータを使った単純なターン毎の関数呼び出しとバイナリ報酬に重点を置いている。
まず、実APIレスポンスの大規模キャッシュを背景とした強化学習環境を構築し、有効なマルチステップオーケストレーショントレースをサンプリングするデータ合成パイプラインを実現する。
第二に、正当性を原子の妥当性とオーケストレーションに分解する、段階的な報酬設計を提案する。
論文 参考訳(メタデータ) (2026-03-25T18:31:39Z) - SkillOrchestra: Learning to Route Agents via Skill Transfer [65.50924963973286]
スキルを意識したオーケストレーションのためのフレームワークであるSkillOrchestraを紹介します。
SkillOrchestraは、実行経験からきめ細かいスキルを学び、それらのスキルの下でエージェント固有の能力とコストをモデル化する。
デプロイメントでは、オーケストレータが現在のインタラクションのスキル要件を推測し、明示的なパフォーマンスコストトレードオフの下でそれらを最も満足するエージェントを選択する。
論文 参考訳(メタデータ) (2026-02-23T10:17:25Z) - Robust and Efficient Tool Orchestration via Layered Execution Structures with Reflective Correction [55.13278005189741]
私たちは、高レベルのツール依存関係をキャプチャする階層化された実行構造を学ぶために、ツールオーケストレーションをモデル化します。
本稿では,局所的にエラーを検出し,修正するスキーマ対応反射補正機構を提案する。
この設計では、エラーを個々のツールコールに限定し、実行軌跡全体の再計画を避ける。
論文 参考訳(メタデータ) (2026-02-21T22:20:01Z) - AOrchestra: Automating Sub-Agent Creation for Agentic Orchestration [36.04766562662082]
AOrchestraはフレームワークに依存しないエージェント抽象化で、任意のエージェントをインストラクション、コンテキストツール、モデルとしてモデル化する。
タスク関連コンテキスト、ツール、モデルをキュレートし、オンザフライで自動エージェント生成を通じて実行を委譲する。
AOrchestraはGeminiと組んで最強のベースラインに対して16.28%の相対的な改善を達成した。
論文 参考訳(メタデータ) (2026-02-03T17:46:16Z) - ToolOrchestra: Elevating Intelligence via Efficient Model and Tool Orchestration [110.24410841004777]
私たちは、他のモデルやさまざまなツールを管理する小さなオーケストレータが、どちらもインテリジェンスの上限を押し上げることができることを示しています。
インテリジェントなツールをコーディネートする,小さなオーケストレータのトレーニング方法であるToolOrchestraを紹介する。
ToolOrchestraを使うことで、従来のツール使用エージェントよりも低コストで精度の高い8BモデルであるOrchestratorを作成できる。
論文 参考訳(メタデータ) (2025-11-26T18:59:46Z) - SOCIA-Nabla: Textual Gradient Meets Multi-Agent Orchestration for Automated Simulator Generation [16.707429579441435]
SOCIA-Nablaは、テキストグラフ内のコードに対するシミュレータ構築の最適化を扱うエンドツーエンドのエージェントフレームワークである。
特殊な計算駆動エージェントをグラフノードとして組み込み、ワークフローマネージャが損失駆動ループを実行する:コード合成 ->実行 ->評価 ->コード修復。
論文 参考訳(メタデータ) (2025-10-21T12:00:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。