論文の概要: Distributed Embodied Evolution over Networks
- arxiv url: http://arxiv.org/abs/2003.12848v4
- Date: Mon, 21 Dec 2020 01:58:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-18 23:38:04.629821
- Title: Distributed Embodied Evolution over Networks
- Title(参考訳): ネットワーク上の分散エンボディード進化
- Authors: Anil Yaman, Giovanni Iacca
- Abstract要約: 我々は,空間分布の局所的相互作用エージェントを最適化するために,分散Embodied Evolutionアプローチを用いる。
この結果から,行動パラメータの相互オーバーによる局所的な情報交換により,ネットワークの最適化処理をより効率的に行うことが可能であることが示唆された。
- 参考スコア(独自算出の注目度): 5.457150493905063
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In several network problems the optimum behavior of the agents (i.e., the
nodes of the network) is not known before deployment. Furthermore, the agents
might be required to adapt, i.e. change their behavior based on the environment
conditions. In these scenarios, offline optimization is usually costly and
inefficient, while online methods might be more suitable. In this work, we use
a distributed Embodied Evolution approach to optimize spatially distributed,
locally interacting agents by allowing them to exchange their behavior
parameters and learn from each other to adapt to a certain task within a given
environment. Our results on several test scenarios show that the local exchange
of information, performed by means of crossover of behavior parameters with
neighbors, allows the network to conduct the optimization process more
efficiently than the cases where local interactions are not allowed, even when
there are large differences on the optimal behavior parameters within each
agent's neighborhood.
- Abstract(参考訳): いくつかのネットワーク問題では、エージェントの最適な動作(すなわちネットワークのノード)はデプロイ前には知られていない。
さらに、エージェントは適応し、すなわち、環境条件に基づいて行動を変える必要があるかもしれない。
これらのシナリオでは、オフラインの最適化は通常コストがかかり非効率である。
本研究では,空間的に分散し,局所的に相互作用するエージェントを最適化するために,分散Embodied Evolutionアプローチを用いて行動パラメータを交換し,与えられた環境内で特定のタスクに適応するように学習する。
実験結果から,各エージェントの近傍における最適行動パラメータの差が大きい場合であっても,各エージェントの近傍との行動パラメータのクロスオーバーによる局所的な情報交換により,局所的な相互作用が許容されない場合よりも効率的に最適化処理が行えることが分かった。
関連論文リスト
- Online Parallel Multi-Task Relationship Learning via Alternating Direction Method of Multipliers [37.859185005986056]
オンラインマルチタスク学習(OMTL)は、複数のタスク間の固有の関係を活用することで、ストリーミングデータ処理を強化する。
本研究では、分散コンピューティング環境に適した最近の最適化である交互方向乗算器法(ADMM)に基づく新しいOMTLフレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-09T10:20:13Z) - Co-Optimization of Environment and Policies for Decentralized Multi-Agent Navigation [14.533605727697775]
本研究は,マルチエージェントシステムとその周辺環境を,一方の行動が他方に影響を与える共進化システムとみなす。
本研究では,環境中におけるエージェント動作と障害物構成の最適解を求めるために,サブオブジェクト間を置換するアルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-03-21T17:37:43Z) - Asynchronous Message-Passing and Zeroth-Order Optimization Based Distributed Learning with a Use-Case in Resource Allocation in Communication Networks [11.182443036683225]
分散学習と適応は大きな関心を集め、機械学習信号処理に広く応用されている。
本稿では、エージェントが共通のタスクに向けて協調するシナリオに焦点を当てる。
送信者として働くエージェントは、グローバルな報酬を最大化するために、それぞれのポリシーを共同で訓練する。
論文 参考訳(メタデータ) (2023-11-08T11:12:27Z) - Federated Multi-Level Optimization over Decentralized Networks [55.776919718214224]
エージェントが隣人としか通信できないネットワーク上での分散マルチレベル最適化の問題について検討する。
ネットワーク化されたエージェントが1つの時間スケールで異なるレベルの最適化問題を解くことができる新しいゴシップに基づく分散マルチレベル最適化アルゴリズムを提案する。
提案アルゴリズムは, ネットワークサイズと線形にスケーリングし, 各種アプリケーション上での最先端性能を示す。
論文 参考訳(メタデータ) (2023-10-10T00:21:10Z) - Constrained Environment Optimization for Prioritized Multi-Agent
Navigation [11.473177123332281]
本稿では,システムレベルの最適化問題において,環境を決定変数として考えることを目的とする。
本稿では,非優先順位付け・優先度付けされた環境最適化の新たな問題を提案する。
完全性を確保しつつ環境が変化しうる条件を, 形式的証明を通じて示す。
論文 参考訳(メタデータ) (2023-05-18T18:55:06Z) - Compressed Regression over Adaptive Networks [58.79251288443156]
分散エージェントのネットワークによって達成可能な性能を導出し,通信制約や回帰問題を解消し,適応的に解決する。
エージェントによって最適化に必要なパラメータをオンラインで学習できる最適化アロケーション戦略を考案する。
論文 参考訳(メタデータ) (2023-04-07T13:41:08Z) - Environment Optimization for Multi-Agent Navigation [11.473177123332281]
本研究の目的は,システムレベルの最適化問題において,環境を決定変数として考えることである。
完全性を確保しつつ環境が変化しうる条件を, 形式的証明を通じて示す。
幅広い実装シナリオに対応するため、オンラインとオフラインの両方の最適化と、離散環境と連続環境の両方の表現を含む。
論文 参考訳(メタデータ) (2022-09-22T19:22:16Z) - Provably Efficient Reinforcement Learning for Online Adaptive Influence
Maximization [53.11458949694947]
本稿では,リアルタイムフィードバックに基づいてシードノードを逐次活性化する,コンテンツ依存型オンライン影響問題の適応バージョンについて検討する。
提案アルゴリズムは,最適政策を楽観的に改善しつつ,ネットワークモデルの推定を保守し,適応的にシードを選択する。
論文 参考訳(メタデータ) (2022-06-29T18:17:28Z) - Multi-Agent MDP Homomorphic Networks [100.74260120972863]
協調型マルチエージェントシステムでは、エージェントの異なる構成とそれらの局所的な観察の間に複雑な対称性が生じる。
単エージェント強化学習における既存の対称性の研究は、完全に集中した環境にのみ一般化できる。
本稿では,ローカル情報のみを用いた分散実行が可能なネットワークのクラスであるマルチエージェントMDPホモモルフィックネットワークを提案する。
論文 参考訳(メタデータ) (2021-10-09T07:46:25Z) - Decentralized MCTS via Learned Teammate Models [89.24858306636816]
本稿では,モンテカルロ木探索に基づくトレーニング可能なオンライン分散計画アルゴリズムを提案する。
深層学習と畳み込みニューラルネットワークを用いて正確なポリシー近似を作成可能であることを示す。
論文 参考訳(メタデータ) (2020-03-19T13:10:20Z) - Dynamic Federated Learning [57.14673504239551]
フェデレートラーニング(Federated Learning)は、マルチエージェント環境における集中的なコーディネーション戦略の包括的用語として登場した。
我々は、各イテレーションにおいて、利用可能なエージェントのランダムなサブセットがそのデータに基づいてローカル更新を実行する、フェデレートされた学習モデルを考える。
集約最適化問題に対する真の最小化器上の非定常ランダムウォークモデルの下で、アーキテクチャの性能は、各エージェントにおけるデータ変動率、各エージェントにおけるモデル変動率、アルゴリズムの学習率に逆比例する追跡項の3つの要因によって決定されることを示す。
論文 参考訳(メタデータ) (2020-02-20T15:00:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。