Fugu-MT 論文翻訳(概要): Co-Optimizing Reconfigurable Environments and Policies for Decentralized Multi-Agent Navigation

論文の概要: Co-Optimizing Reconfigurable Environments and Policies for Decentralized Multi-Agent Navigation

arxiv url: http://arxiv.org/abs/2403.14583v2
Date: Wed, 02 Jul 2025 12:37:15 GMT
ステータス: 翻訳完了
システム内更新日: 2025-07-03 14:22:55.846764
Title: Co-Optimizing Reconfigurable Environments and Policies for Decentralized Multi-Agent Navigation
Title（参考訳）: 分散マルチエージェントナビゲーションのための再構成環境とポリシーの協調最適化
Authors: Zhan Gao, Guang Yang, Amanda Prorok,
Abstract要約: 本研究は,マルチエージェントシステムとその周辺環境を,一方の行動が他方に影響を与える共進化システムとみなす。マルチエージェントナビゲーションと環境最適化という2つのサブオブジェクトを導入することで,エージェントの協調最適化問題を提案する。
参考スコア（独自算出の注目度）: 14.533605727697775
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This work views the multi-agent system and its surrounding environment as a co-evolving system, where the behavior of one affects the other. The goal is to take both agent actions and environment configurations as decision variables, and optimize these two components in a coordinated manner to improve some measure of interest. Towards this end, we consider the problem of decentralized multi-agent navigation in a cluttered environment, where we assume that the layout of the environment is reconfigurable. By introducing two sub-objectives -- multi-agent navigation and environment optimization -- we propose an agent-environment co-optimization problem and develop a coordinated algorithm that alternates between these sub-objectives to search for an optimal synthesis of agent actions and environment configurations; ultimately, improving the navigation performance. Due to the challenge of explicitly modeling the relation between the agents, the environment and their performance therein, we leverage policy gradient to formulate a model-free learning mechanism within the coordinated framework. A formal convergence analysis shows that our coordinated algorithm tracks the local minimum solution of an associated time-varying non-convex optimization problem. Experiments corroborate theoretical findings and show the benefits of co-optimization. Interestingly, the results also indicate that optimized environments can offer structural guidance to de-conflict agents in motion.
Abstract（参考訳）: 本研究は,マルチエージェントシステムとその周辺環境を,一方の行動が他方に影響を与える共進化システムとみなす。目標は、エージェントアクションと環境設定の両方を決定変数として、これら2つのコンポーネントを協調的に最適化して、いくつかの関心度を改善することです。この目的のために,環境のレイアウトが再構成可能であると仮定し,分散化されたマルチエージェントナビゲーションの問題を考える。 2つのサブオブジェクト(マルチエージェントナビゲーションと環境最適化)を導入することで、エージェント環境の協調最適化問題を提案し、これらのサブオブジェクトを交互に組み合わせてエージェントアクションと環境構成の最適な合成を探すアルゴリズムを開発し、最終的にはナビゲーション性能を向上させる。エージェント,環境,その性能の関係を明示的にモデル化することの難しさから,協調フレームワーク内でのモデルフリー学習機構の定式化に政策勾配を利用する。正規収束解析により, 座標アルゴリズムは, 関連する時間変化非凸最適化問題の局所最小解を追跡する。実験は理論的な発見を裏付け、共最適化の利点を示す。興味深いことに、最適化された環境は、動作中のエージェントを非衝突的にするための構造的ガイダンスを提供する可能性があることも示している。

関連論文リスト

AdaEvolve: Adaptive LLM Driven Zeroth-Order Optimization [61.535567824938205]
本稿では,LLMによる進化を階層的適応最適化問題として再構成するフレームワークであるAdaEvolveを紹介する。 AdaEvolveは185の異なるオープンエンド最適化問題において、オープンエンドベースラインを一貫して上回っている。
論文参考訳（メタデータ） (2026-02-23T18:45:31Z)
Grounded Test-Time Adaptation for LLM Agents [75.62784644919803]
大規模言語モデル(LLM)ベースのエージェントは、新規で複雑な環境への一般化に苦慮している。環境特化情報を活用することで, LLMエージェントを適応するための2つの戦略を提案する。
論文参考訳（メタデータ） (2025-11-06T22:24:35Z)
Scaling Multi-Agent Environment Co-Design with Diffusion Models [15.05916455401006]
エージェント環境共同設計は, エージェントポリシーと環境設定を協調的に最適化し, システム性能の向上を図ることを目的としている。現在の共同設計手法は, 高次元環境設計空間下でのスケール, 崩壊に苦慮し, サンプル不効率に悩まされている。我々は,大規模でサンプル効率のよい共同設計フレームワークを開発し,共同設計を実用的に関係のある環境に向けて進める。提案手法は, 常に最先端の手法を超え, 66%のシミュレーションサンプルで, 倉庫環境において39%の報奨を達成している。
論文参考訳（メタデータ） (2025-11-05T01:09:40Z)
Joint Optimization of Cooperation Efficiency and Communication Covertness for Target Detection with AUVs [105.81167650318054]
本稿では,自律型水中車両(AUV)を用いた水中協調目標検出について検討する。まず,共同軌道と電力制御の最適化問題を定式化し,それを解決するための革新的な階層的行動管理フレームワークを提案する。集中学習と分散実行のパラダイムの下で,我々の目標検出フレームワークは,エネルギーとモビリティの制約を満たすとともに,適応的なカバート協調を可能にする。
論文参考訳（メタデータ） (2025-10-21T02:14:11Z)
Efficient Adaptation in Mixed-Motive Environments via Hierarchical Opponent Modeling and Planning [51.52387511006586]
本稿では,HOP(Hierarchical Opponent Modeling and Planning)を提案する。 HOPは階層的に2つのモジュールから構成される: 相手の目標を推論し、対応する目標条件のポリシーを学ぶ、反対モデリングモジュール。 HOPは、さまざまな未確認エージェントと相互作用する際、優れた少数ショット適応能力を示し、セルフプレイのシナリオで優れている。
論文参考訳（メタデータ） (2024-06-12T08:48:06Z)
Evolutionary Algorithms for Optimizing Emergency Exit Placement in Indoor Environments [0.0]
セルラーオートマトンモデルを用いて歩行者の挙動をシミュレートする。避難がどの程度成功したか、満足できるかを決定するための計量が提案されている。 2つのメタヒューリスティックアルゴリズム、すなわち反復グリーディと進化的アルゴリズム(EA)がこの問題を解決するために提案されている。
論文参考訳（メタデータ） (2024-05-28T16:50:42Z)
Solving Expensive Optimization Problems in Dynamic Environments with Meta-learning [32.41025515064283]
本稿では,高コストな動的最適化問題を解くための,シンプルなメタラーニングに基づく最適化フレームワークを提案する。このフレームワークは柔軟性があり、任意の既製のサロゲートモデルをプラグイン形式で連続的に使用することができる。いくつかの最先端アルゴリズムと比較して,提案手法の有効性を示す実験を行った。
論文参考訳（メタデータ） (2023-10-19T07:42:51Z)
Federated Multi-Level Optimization over Decentralized Networks [55.776919718214224]
エージェントが隣人としか通信できないネットワーク上での分散マルチレベル最適化の問題について検討する。ネットワーク化されたエージェントが1つの時間スケールで異なるレベルの最適化問題を解くことができる新しいゴシップに基づく分散マルチレベル最適化アルゴリズムを提案する。提案アルゴリズムは, ネットワークサイズと線形にスケーリングし, 各種アプリケーション上での最先端性能を示す。
論文参考訳（メタデータ） (2023-10-10T00:21:10Z)
AbCD: A Component-wise Adjustable Framework for Dynamic Optimization Problems [49.1574468325115]
動的最適化問題 (DOP) は、常に発生し、現実の応用に共通するフィットネス環境の変化によって特徴づけられる。我々は、動的問題のための調整可能なコンポーネント(AbCD)と呼ばれるDOPのためのコンポーネント指向フレームワークを開発する。この結果から,アルゴリズムやコンポーネントの今後の発展に対処する必要があるDOP分野の既存の課題が浮き彫りになる。
論文参考訳（メタデータ） (2023-10-09T08:11:31Z)
Constrained Environment Optimization for Prioritized Multi-Agent Navigation [11.473177123332281]
本稿では,システムレベルの最適化問題において,環境を決定変数として考えることを目的とする。本稿では,非優先順位付け・優先度付けされた環境最適化の新たな問題を提案する。完全性を確保しつつ環境が変化しうる条件を, 形式的証明を通じて示す。
論文参考訳（メタデータ） (2023-05-18T18:55:06Z)
Environment Optimization for Multi-Agent Navigation [11.473177123332281]
本研究の目的は,システムレベルの最適化問題において,環境を決定変数として考えることである。完全性を確保しつつ環境が変化しうる条件を, 形式的証明を通じて示す。幅広い実装シナリオに対応するため、オンラインとオフラインの両方の最適化と、離散環境と連続環境の両方の表現を含む。
論文参考訳（メタデータ） (2022-09-22T19:22:16Z)
Optimizing Indoor Navigation Policies For Spatial Distancing [8.635212273689273]
本稿では,住民の移動パターンや方向指示に繋がる政策の変更に焦点をあてる。本フレームワークでは,エージェント間の空間的距離の分散を改善するために,シミュレーション最適化プロセスが有効であることを示す。
論文参考訳（メタデータ） (2022-06-04T21:57:22Z)
Harnessing Heterogeneity: Learning from Decomposed Feedback in Bayesian Modeling [68.69431580852535]
サブグループフィードバックを取り入れた新しいGPレグレッションを導入する。我々の修正された回帰は、以前のアプローチと比べて、明らかにばらつきを減らし、したがってより正確な後続を減らした。我々は2つの異なる社会問題に対してアルゴリズムを実行する。
論文参考訳（メタデータ） (2021-07-07T03:57:22Z)
MetaAlign: Coordinating Domain Alignment and Classification for Unsupervised Domain Adaptation [84.90801699807426]
本稿ではMetaAlignと呼ばれるメタ最適化に基づく効果的な戦略を提案する。ドメインアライメントの目的と分類の目的をメタ学習計画におけるメタトレーニングとメタテストのタスクとして扱う。実験結果は,アライメントに基づくベースラインアプローチを用いた提案手法の有効性を実証した。
論文参考訳（メタデータ） (2021-03-25T03:16:05Z)
Distributed Multi-agent Meta Learning for Trajectory Design in Wireless Drone Networks [151.27147513363502]
本稿では,動的無線ネットワーク環境で動作するエネルギー制約型ドローン群に対する軌道設計の問題点について検討する。値ベース強化学習(VDRL)ソリューションとメタトレイン機構を提案する。
論文参考訳（メタデータ） (2020-12-06T01:30:12Z)
The multi-objective optimisation of breakwaters using evolutionary approach [62.997667081978825]
工学的な実践では、港や海岸の既存の保護施設の有効性を高めることがしばしば必要である。本稿では, ブレークウォーター最適化のための多目的進化的アプローチを提案する。
論文参考訳（メタデータ） (2020-04-06T21:48:01Z)
Decentralized MCTS via Learned Teammate Models [89.24858306636816]
本稿では,モンテカルロ木探索に基づくトレーニング可能なオンライン分散計画アルゴリズムを提案する。深層学習と畳み込みニューラルネットワークを用いて正確なポリシー近似を作成可能であることを示す。
論文参考訳（メタデータ） (2020-03-19T13:10:20Z)
Dynamic Federated Learning [57.14673504239551]
フェデレートラーニング(Federated Learning)は、マルチエージェント環境における集中的なコーディネーション戦略の包括的用語として登場した。我々は、各イテレーションにおいて、利用可能なエージェントのランダムなサブセットがそのデータに基づいてローカル更新を実行する、フェデレートされた学習モデルを考える。集約最適化問題に対する真の最小化器上の非定常ランダムウォークモデルの下で、アーキテクチャの性能は、各エージェントにおけるデータ変動率、各エージェントにおけるモデル変動率、アルゴリズムの学習率に逆比例する追跡項の3つの要因によって決定されることを示す。
論文参考訳（メタデータ） (2020-02-20T15:00:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。