論文の概要: Constrained Environment Optimization for Prioritized Multi-Agent
Navigation
- arxiv url: http://arxiv.org/abs/2305.11260v1
- Date: Thu, 18 May 2023 18:55:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-22 17:28:31.428499
- Title: Constrained Environment Optimization for Prioritized Multi-Agent
Navigation
- Title(参考訳): 優先型マルチエージェントナビゲーションのための制約付き環境最適化
- Authors: Zhan Gao and Amanda Prorok
- Abstract要約: 本稿では,システムレベルの最適化問題において,環境を決定変数として考えることを目的とする。
本稿では,非優先順位付け・優先度付けされた環境最適化の新たな問題を提案する。
完全性を確保しつつ環境が変化しうる条件を, 形式的証明を通じて示す。
- 参考スコア(独自算出の注目度): 11.473177123332281
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Traditional approaches to the design of multi-agent navigation algorithms
consider the environment as a fixed constraint, despite the influence of
spatial constraints on agents' performance. Yet hand-designing conducive
environment layouts is inefficient and potentially expensive. The goal of this
paper is to consider the environment as a decision variable in a system-level
optimization problem, where both agent performance and environment cost are
incorporated. Towards this end, we propose novel problems of unprioritized and
prioritized environment optimization, where the former considers agents
unbiasedly and the latter accounts for agent priorities. We show, through
formal proofs, under which conditions the environment can change while
guaranteeing completeness (i.e., all agents reach goals), and analyze the role
of agent priorities in the environment optimization. We proceed to impose
real-world constraints on the environment optimization and formulate it
mathematically as a constrained stochastic optimization problem. Since the
relation between agents, environment and performance is challenging to model,
we leverage reinforcement learning to develop a model-free solution and a
primal-dual mechanism to handle constraints. Distinct information processing
architectures are integrated for various implementation scenarios, including
online/offline optimization and discrete/continuous environment. Numerical
results corroborate the theory and demonstrate the validity and adaptability of
our approach.
- Abstract(参考訳): マルチエージェントナビゲーションアルゴリズムの設計への伝統的なアプローチは、空間的制約がエージェントの性能に与える影響にもかかわらず、環境を固定的な制約と考える。
しかし、手動設計による環境レイアウトは非効率であり、潜在的に高価である。
本研究の目的は,エージェント性能と環境コストの両方を組み込んだシステムレベルの最適化問題において,環境を決定変数として考えることである。
この目的に向けて,前者はエージェントを偏りなく考慮し,後者はエージェントの優先順位を考慮し,非優先的かつ優先順位付けされた環境最適化の新たな問題を提案する。
我々は,完全性(すなわち,すべてのエージェントが目標に達する)を保証しながら,環境が変化する条件下での形式的証明を行い,環境最適化におけるエージェント優先度の役割を分析する。
実世界の制約を環境最適化に課し,制約付き確率最適化問題として数学的に定式化する。
エージェント, 環境, 性能の関係はモデル化が難しいため, 強化学習を活用して, 制約に対処するモデルフリーソリューションと原始双対機構を開発する。
個別情報処理アーキテクチャは、オンライン/オフライン最適化や離散/連続環境など、様々な実装シナリオで統合されている。
数値的な結果は理論を裏付け、我々のアプローチの有効性と適応性を示す。
関連論文リスト
- Co-Optimization of Environment and Policies for Decentralized Multi-Agent Navigation [14.533605727697775]
本研究は,マルチエージェントシステムとその周辺環境を,一方の行動が他方に影響を与える共進化システムとみなす。
本研究では,環境中におけるエージェント動作と障害物構成の最適解を求めるために,サブオブジェクト間を置換するアルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-03-21T17:37:43Z) - End-to-End Learning for Fair Multiobjective Optimization Under
Uncertainty [55.04219793298687]
機械学習における予測-Then-Forecast(PtO)パラダイムは、下流の意思決定品質を最大化することを目的としている。
本稿では,PtO法を拡張して,OWA(Nondifferentiable Ordered Weighted Averaging)の目的を最適化する。
この結果から,不確実性の下でのOWA関数の最適化とパラメトリック予測を効果的に統合できることが示唆された。
論文 参考訳(メタデータ) (2024-02-12T16:33:35Z) - Solving Expensive Optimization Problems in Dynamic Environments with Meta-learning [32.41025515064283]
本稿では,高コストな動的最適化問題を解くための,シンプルなメタラーニングに基づく最適化フレームワークを提案する。
このフレームワークは柔軟性があり、任意の既製のサロゲートモデルをプラグイン形式で連続的に使用することができる。
いくつかの最先端アルゴリズムと比較して,提案手法の有効性を示す実験を行った。
論文 参考訳(メタデータ) (2023-10-19T07:42:51Z) - CAMEO: A Causal Transfer Learning Approach for Performance Optimization
of Configurable Computer Systems [16.75106122540052]
環境変化下での因果予測の不変性を同定する手法であるCAMEOを提案する。
MLperf深層学習システム,ビデオ分析パイプライン,データベースシステムにおいて,最先端の最適化手法に対する大幅な性能向上を示す。
論文 参考訳(メタデータ) (2023-06-13T16:28:37Z) - Environment Optimization for Multi-Agent Navigation [11.473177123332281]
本研究の目的は,システムレベルの最適化問題において,環境を決定変数として考えることである。
完全性を確保しつつ環境が変化しうる条件を, 形式的証明を通じて示す。
幅広い実装シナリオに対応するため、オンラインとオフラインの両方の最適化と、離散環境と連続環境の両方の表現を含む。
論文 参考訳(メタデータ) (2022-09-22T19:22:16Z) - Multi-Objective Constrained Optimization for Energy Applications via
Tree Ensembles [55.23285485923913]
エネルギーシステムの最適化問題は、強い非線形系の挙動と複数の競合する目的のために複雑である。
場合によっては、提案された最適解は、物理的性質や安全クリティカルな操作条件に関連する明示的な入力制約に従う必要がある。
本稿では,ブラックボックス問題に対する制約付き多目的最適化のためのツリーアンサンブルを用いた新しいデータ駆動戦略を提案する。
論文 参考訳(メタデータ) (2021-11-04T20:18:55Z) - Modeling the Second Player in Distributionally Robust Optimization [90.25995710696425]
我々は、最悪のケース分布を特徴付けるために神経生成モデルを使うことを議論する。
このアプローチは多くの実装と最適化の課題をもたらします。
提案されたアプローチは、同等のベースラインよりも堅牢なモデルを生み出す。
論文 参考訳(メタデータ) (2021-03-18T14:26:26Z) - Incremental Data-driven Optimization of Complex Systems in Nonstationary
Environments [26.93254582875251]
本稿では、動的環境がもたらす課題に対処するデータ駆動最適化アルゴリズムを提案する。
まず、サロゲートを訓練するためにデータストリームアンサンブル学習法を採用し、アンサンブルの各ベース学習者が前の環境における時間変化対象関数を学習する。
その後、マルチタスク進化アルゴリズムを用いて、アンサンブルサロゲートによって支援された過去の環境における問題を同時に最適化する。
論文 参考訳(メタデータ) (2020-12-14T02:55:42Z) - Emergent Complexity and Zero-shot Transfer via Unsupervised Environment
Design [121.73425076217471]
本研究では,未知のパラメータを持つ環境を提供するUnsupervised Environment Design (UED)を提案する。
プロタゴニスト・アンタゴニストによるレグレト環境デザイン(PAIRED)と呼ぶ。
実験により, PAIREDは複雑な環境の自然なカリキュラムを生産し, PAIREDエージェントは, 高度に新規な環境での試験において, 高いゼロショット転送性能が得られることを示した。
論文 参考訳(メタデータ) (2020-12-03T17:37:01Z) - Bilevel Optimization for Differentially Private Optimization in Energy
Systems [53.806512366696275]
本稿では,入力に敏感な制約付き最適化問題に対して,差分プライバシーを適用する方法について検討する。
本稿は, 自然仮定の下では, 大規模非線形最適化問題に対して, 双レベルモデルを効率的に解けることを示す。
論文 参考訳(メタデータ) (2020-01-26T20:15:28Z) - Optimizing Wireless Systems Using Unsupervised and
Reinforced-Unsupervised Deep Learning [96.01176486957226]
無線ネットワークにおけるリソース割り当てとトランシーバーは、通常最適化問題の解決によって設計される。
本稿では,変数最適化と関数最適化の両問題を解くための教師なし・教師なし学習フレームワークを紹介する。
論文 参考訳(メタデータ) (2020-01-03T11:01:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。