論文の概要: Environment Optimization for Multi-Agent Navigation
- arxiv url: http://arxiv.org/abs/2209.11279v1
- Date: Thu, 22 Sep 2022 19:22:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-26 17:32:52.784015
- Title: Environment Optimization for Multi-Agent Navigation
- Title(参考訳): マルチエージェントナビゲーションのための環境最適化
- Authors: Zhan Gao and Amanda Prorok
- Abstract要約: 本研究の目的は,システムレベルの最適化問題において,環境を決定変数として考えることである。
完全性を確保しつつ環境が変化しうる条件を, 形式的証明を通じて示す。
幅広い実装シナリオに対応するため、オンラインとオフラインの両方の最適化と、離散環境と連続環境の両方の表現を含む。
- 参考スコア(独自算出の注目度): 11.473177123332281
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Traditional approaches to the design of multi-agent navigation algorithms
consider the environment as a fixed constraint, despite the obvious influence
of spatial constraints on agents' performance. Yet hand-designing improved
environment layouts and structures is inefficient and potentially expensive.
The goal of this paper is to consider the environment as a decision variable in
a system-level optimization problem, where both agent performance and
environment cost can be accounted for. We begin by proposing a novel
environment optimization problem. We show, through formal proofs, under which
conditions the environment can change while guaranteeing completeness (i.e.,
all agents reach their navigation goals). Our solution leverages a model-free
reinforcement learning approach. In order to accommodate a broad range of
implementation scenarios, we include both online and offline optimization, and
both discrete and continuous environment representations. Numerical results
corroborate our theoretical findings and validate our approach.
- Abstract(参考訳): 従来のマルチエージェントナビゲーションアルゴリズムの設計手法は、エージェントの性能に空間的制約が明らかに影響しているにもかかわらず、環境を固定的な制約と見なしている。
しかし、改善された環境レイアウトと構造を手作業で設計することは非効率であり、潜在的に高価である。
本研究の目的は,エージェントの性能と環境コストを考慮に入れたシステムレベルの最適化問題において,環境を決定変数として考えることである。
まず,新しい環境最適化問題を提案する。
完全性を保証しながら環境が変化しうる条件(すなわち、すべてのエージェントが航法目標に達する)を形式的証明を通して示します。
我々のソリューションはモデルなし強化学習アプローチを活用する。
幅広い実装シナリオに対応するため、オンラインとオフラインの両方の最適化と、離散環境と連続環境の両方の表現を含む。
数値結果は我々の理論的知見と一致し、アプローチを検証する。
関連論文リスト
- Certifiably Robust Policies for Uncertain Parametric Environments [57.2416302384766]
本稿ではパラメータ上の未知分布を持つパラメトリックマルコフ決定プロセス(MDP)に基づくフレームワークを提案する。
パラメータによって誘導される未知のサンプル環境に対するIMDPの学習と解析を行う。
当社のアプローチは,信頼度の高い政策のパフォーマンスに厳密な拘束力をもたらすことを示す。
論文 参考訳(メタデータ) (2024-08-06T10:48:15Z) - Co-Optimization of Environment and Policies for Decentralized Multi-Agent Navigation [14.533605727697775]
本研究は,マルチエージェントシステムとその周辺環境を,一方の行動が他方に影響を与える共進化システムとみなす。
本研究では,環境中におけるエージェント動作と障害物構成の最適解を求めるために,サブオブジェクト間を置換するアルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-03-21T17:37:43Z) - Solving Expensive Optimization Problems in Dynamic Environments with Meta-learning [32.41025515064283]
本稿では,高コストな動的最適化問題を解くための,シンプルなメタラーニングに基づく最適化フレームワークを提案する。
このフレームワークは柔軟性があり、任意の既製のサロゲートモデルをプラグイン形式で連続的に使用することができる。
いくつかの最先端アルゴリズムと比較して,提案手法の有効性を示す実験を行った。
論文 参考訳(メタデータ) (2023-10-19T07:42:51Z) - CAMEO: A Causal Transfer Learning Approach for Performance Optimization
of Configurable Computer Systems [16.75106122540052]
環境変化下での因果予測の不変性を同定する手法であるCAMEOを提案する。
MLperf深層学習システム,ビデオ分析パイプライン,データベースシステムにおいて,最先端の最適化手法に対する大幅な性能向上を示す。
論文 参考訳(メタデータ) (2023-06-13T16:28:37Z) - Constrained Environment Optimization for Prioritized Multi-Agent
Navigation [11.473177123332281]
本稿では,システムレベルの最適化問題において,環境を決定変数として考えることを目的とする。
本稿では,非優先順位付け・優先度付けされた環境最適化の新たな問題を提案する。
完全性を確保しつつ環境が変化しうる条件を, 形式的証明を通じて示す。
論文 参考訳(メタデータ) (2023-05-18T18:55:06Z) - Diversity Induced Environment Design via Self-Play [9.172096093540357]
本研究では,与えられたレベルを表す観測・隠蔽状態を特定するタスク非依存の手法を提案する。
この手法の結果は, 2つのレベル間の多様性を特徴付けるために利用され, 有効性能に欠かせないことが示されている。
さらに, サンプリング効率を向上させるために, 環境生成装置がトレーニングエージェントに有利な環境を自動的に生成する自己再生技術を導入する。
論文 参考訳(メタデータ) (2023-02-04T07:31:36Z) - Multi-Objective Constrained Optimization for Energy Applications via
Tree Ensembles [55.23285485923913]
エネルギーシステムの最適化問題は、強い非線形系の挙動と複数の競合する目的のために複雑である。
場合によっては、提案された最適解は、物理的性質や安全クリティカルな操作条件に関連する明示的な入力制約に従う必要がある。
本稿では,ブラックボックス問題に対する制約付き多目的最適化のためのツリーアンサンブルを用いた新しいデータ駆動戦略を提案する。
論文 参考訳(メタデータ) (2021-11-04T20:18:55Z) - Emergent Complexity and Zero-shot Transfer via Unsupervised Environment
Design [121.73425076217471]
本研究では,未知のパラメータを持つ環境を提供するUnsupervised Environment Design (UED)を提案する。
プロタゴニスト・アンタゴニストによるレグレト環境デザイン(PAIRED)と呼ぶ。
実験により, PAIREDは複雑な環境の自然なカリキュラムを生産し, PAIREDエージェントは, 高度に新規な環境での試験において, 高いゼロショット転送性能が得られることを示した。
論文 参考訳(メタデータ) (2020-12-03T17:37:01Z) - The multi-objective optimisation of breakwaters using evolutionary
approach [62.997667081978825]
工学的な実践では、港や海岸の既存の保護施設の有効性を高めることがしばしば必要である。
本稿では, ブレークウォーター最適化のための多目的進化的アプローチを提案する。
論文 参考訳(メタデータ) (2020-04-06T21:48:01Z) - Bilevel Optimization for Differentially Private Optimization in Energy
Systems [53.806512366696275]
本稿では,入力に敏感な制約付き最適化問題に対して,差分プライバシーを適用する方法について検討する。
本稿は, 自然仮定の下では, 大規模非線形最適化問題に対して, 双レベルモデルを効率的に解けることを示す。
論文 参考訳(メタデータ) (2020-01-26T20:15:28Z) - Optimizing Wireless Systems Using Unsupervised and
Reinforced-Unsupervised Deep Learning [96.01176486957226]
無線ネットワークにおけるリソース割り当てとトランシーバーは、通常最適化問題の解決によって設計される。
本稿では,変数最適化と関数最適化の両問題を解くための教師なし・教師なし学習フレームワークを紹介する。
論文 参考訳(メタデータ) (2020-01-03T11:01:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。