論文の概要: Differentiable Environment-Trajectory Co-Optimization for Safe Multi-Agent Navigation
- arxiv url: http://arxiv.org/abs/2604.06972v1
- Date: Wed, 08 Apr 2026 11:43:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.499207
- Title: Differentiable Environment-Trajectory Co-Optimization for Safe Multi-Agent Navigation
- Title(参考訳): 安全なマルチエージェントナビゲーションのための環境トラジェクトリ協調最適化
- Authors: Zhan Gao, Gabriele Fadini, Stelian Coros, Amanda Prorok,
- Abstract要約: 環境は、エージェントがナビゲートしなければならない空間的制約、ルール、制限を課すことによって、マルチエージェントナビゲーションにおいて重要な役割を果たす。
この作業は、安全なナビゲーションを共同で達成するために、環境構成をエージェントアクションとともに決定変数とみなす。
- 参考スコア(独自算出の注目度): 27.7147161884966
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The environment plays a critical role in multi-agent navigation by imposing spatial constraints, rules, and limitations that agents must navigate around. Traditional approaches treat the environment as fixed, without exploring its impact on agents' performance. This work considers environment configurations as decision variables, alongside agent actions, to jointly achieve safe navigation. We formulate a bi-level problem, where the lower-level sub-problem optimizes agent trajectories that minimize navigation cost and the upper-level sub-problem optimizes environment configurations that maximize navigation safety. We develop a differentiable optimization method that iteratively solves the lower-level sub-problem with interior point methods and the upper-level sub-problem with gradient ascent. A key challenge lies in analytically coupling these two levels. We address this by leveraging KKT conditions and the Implicit Function Theorem to compute gradients of agent trajectories w.r.t. environment parameters, enabling differentiation throughout the bi-level structure. Moreover, we propose a novel metric that quantifies navigation safety as a criterion for the upper-level environment optimization, and prove its validity through measure theory. Our experiments validate the effectiveness of the proposed framework in a variety of safety-critical navigation scenarios, inspired from warehouse logistics to urban transportation. The results demonstrate that optimized environments provide navigation guidance, improving both agents' safety and efficiency.
- Abstract(参考訳): 環境は、エージェントがナビゲートしなければならない空間的制約、ルール、制限を課すことによって、マルチエージェントナビゲーションにおいて重要な役割を果たす。
従来のアプローチでは、エージェントのパフォーマンスに影響を与えることなく、環境を固定として扱う。
この作業は、安全なナビゲーションを共同で達成するために、環境構成をエージェントアクションとともに決定変数とみなす。
下層サブプロブレムはナビゲーションコストを最小限に抑えるエージェントトラジェクトリを最適化し、上層サブプロブレムはナビゲーション安全性を最大化する環境構成を最適化する。
そこで本研究では,下層サブプロブレムを内点法で反復的に解き,上層サブプロブレムを勾配上昇で反復的に解き,微分可能最適化法を開発した。
重要な課題は、これらの2つのレベルを解析的に結合することである。
我々は、KKT条件とインプリシット関数定理を利用して、エージェントトラジェクトリw.r.t.環境パラメータの勾配を計算し、バイレベル構造全体の微分を可能にする。
さらに,上層環境最適化の基準としてナビゲーションの安全性を定量化し,その妥当性を測定理論で検証する手法を提案する。
本実験は, 倉庫物流から都市交通まで, 各種安全クリティカルナビゲーションシナリオにおいて, 提案手法の有効性を検証した。
その結果、最適化された環境はナビゲーションのガイダンスを提供し、双方のエージェントの安全性と効率を改善していることがわかった。
関連論文リスト
- STRIDER: Navigation via Instruction-Aligned Structural Decision Space Optimization [73.98141357780032]
VLN-CEタスクでは、エージェントはシーン固有のトレーニングなしで自然言語命令を使用して3D環境をナビゲートする必要がある。
既存の方法は、構造化された意思決定の欠如と、以前の行動からのフィードバックの不十分な統合のために、堅牢なナビゲーションを達成できないことが多い。
STRIDERは,空間配置先と動的タスクフィードバックを統合し,エージェントの決定空間を体系的に最適化する新しいフレームワークである。
提案手法では,1)空間構造を介して行動空間を制約する構造的ウェイポイントジェネレータ,2)タスクの進行に応じて行動を調整するタスク調整レギュレータ,そしてナビゲーション全体を通して意味的アライメントを確保する。
論文 参考訳(メタデータ) (2025-10-27T04:37:21Z) - DAgger Diffusion Navigation: DAgger Boosted Diffusion Policy for Vision-Language Navigation [73.80968452950854]
Vision-Language Navigation in Continuous Environments (VLN-CE) は、エージェントが自由形式の3D空間を通して自然言語の指示に従う必要がある。
既存のVLN-CEアプローチは通常、2段階のウェイポイント計画フレームワークを使用する。
本稿では,エンドツーエンド最適化VLN-CEポリシとしてDAgger Diffusion Navigation (DifNav)を提案する。
論文 参考訳(メタデータ) (2025-08-13T02:51:43Z) - An Optimisation Framework for Unsupervised Environment Design [88.29733214939544]
非教師なし環境設計(UED)は、エージェントの全般的な堅牢性を最大化することを目的としている。
ゼロサム設定において、証明可能な収束アルゴリズムを提供する。
提案手法の有効性を実証的に検証する。
論文 参考訳(メタデータ) (2025-05-27T03:07:26Z) - Safe Gradient Flow for Bilevel Optimization [6.3963012138521975]
階層的な意思決定において、バイレベル最適化は重要なフレームワークである。
本稿では,二段階最適化問題に対する制御理論的アプローチを提案する。
論文 参考訳(メタデータ) (2025-01-27T21:39:25Z) - Co-Optimizing Reconfigurable Environments and Policies for Decentralized Multi-Agent Navigation [14.533605727697775]
本研究は,マルチエージェントシステムとその周辺環境を,一方の行動が他方に影響を与える共進化システムとみなす。
マルチエージェントナビゲーションと環境最適化という2つのサブオブジェクトを導入することで,エージェントの協調最適化問題を提案する。
論文 参考訳(メタデータ) (2024-03-21T17:37:43Z) - TAS: A Transit-Aware Strategy for Embodied Navigation with Non-Stationary Targets [55.09248760290918]
非定常目標を持つ動的シナリオにおけるナビゲーションのための新しいアルゴリズムを提案する。
我々の新しいTAS(Transit-Aware Strategy)は、具体化されたナビゲーションポリシーをオブジェクトパス情報で強化する。
TASは、ターゲットルートとルートを同期させるエージェントを報酬することで、非定常環境での性能を改善する。
論文 参考訳(メタデータ) (2024-03-14T22:33:22Z) - Environment Optimization for Multi-Agent Navigation [11.473177123332281]
本研究の目的は,システムレベルの最適化問題において,環境を決定変数として考えることである。
完全性を確保しつつ環境が変化しうる条件を, 形式的証明を通じて示す。
幅広い実装シナリオに対応するため、オンラインとオフラインの両方の最適化と、離散環境と連続環境の両方の表現を含む。
論文 参考訳(メタデータ) (2022-09-22T19:22:16Z) - The multi-objective optimisation of breakwaters using evolutionary
approach [62.997667081978825]
工学的な実践では、港や海岸の既存の保護施設の有効性を高めることがしばしば必要である。
本稿では, ブレークウォーター最適化のための多目的進化的アプローチを提案する。
論文 参考訳(メタデータ) (2020-04-06T21:48:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。