Fugu-MT 論文翻訳(概要): Priority-Driven Control and Communication in Decentralized Multi-Agent Systems via Reinforcement Learning

論文の概要: Priority-Driven Control and Communication in Decentralized Multi-Agent Systems via Reinforcement Learning

arxiv url: http://arxiv.org/abs/2605.10482v2
Date: Tue, 12 May 2026 07:11:47 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-13 15:25:41.419826
Title: Priority-Driven Control and Communication in Decentralized Multi-Agent Systems via Reinforcement Learning
Title（参考訳）: 強化学習による分散マルチエージェントシステムにおける優先度駆動制御とコミュニケーション
Authors: Qingyun Guo, Junyi Shi, Tomasz Piotr Kucner, Dominik Baumann,
Abstract要約: イベントトリガー制御は、ネットワーク化されたマルチエージェントシステムにおける制約付き通信帯域の過剰使用を回避するメカニズムを提供する。本研究では,データから通信優先度と制御ポリシーを協調的に学習するモデルフリーで優先度駆動型強化学習アルゴリズムを提案する。
参考スコア（独自算出の注目度）: 2.182474734552575
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Event-triggered control provides a mechanism for avoiding excessive use of constrained communication bandwidth in networked multi-agent systems. However, most existing methods rely on accurate system models, which may be unavailable in practice. In this work, we propose a model-free, priority-driven reinforcement learning algorithm that learns communication priorities and control policies jointly from data in decentralized multi-agent systems. By learning communication priorities, we circumvent the hybrid action space typical in event-triggered control with binary communication decisions. We evaluate our algorithm on benchmark tasks and demonstrate that it outperforms the baseline method.
Abstract（参考訳）: イベントトリガー制御は、ネットワーク化されたマルチエージェントシステムにおける制約付き通信帯域の過剰使用を回避するメカニズムを提供する。しかし、既存のほとんどの手法は正確なシステムモデルに依存しており、実際には利用できないかもしれない。本研究では,分散マルチエージェントシステムにおけるデータから通信優先度と制御ポリシーを協調的に学習するモデルフリーで優先度駆動型強化学習アルゴリズムを提案する。コミュニケーションの優先順位を学習することで、イベントトリガー制御に典型的なハイブリッドアクション空間を回避し、バイナリ通信決定を行う。本稿では,ベンチマークタスクにおけるアルゴリズムの評価を行い,ベースライン法よりも優れていることを示す。

関連論文リスト

Decentralized Learning Strategies for Estimation Error Minimization with Graph Neural Networks [86.99017195607077]
統計的に同一性を持つ無線ネットワークにおける自己回帰的マルコフ過程のサンプリングとリモート推定の課題に対処する。我々のゴールは、分散化されたスケーラブルサンプリングおよび送信ポリシーを用いて、時間平均推定誤差と/または情報の年齢を最小化することである。
論文参考訳（メタデータ） (2024-04-04T06:24:11Z)
Networked Communication for Decentralised Agents in Mean-Field Games [59.01527054553122]
平均フィールドゲームフレームワークにネットワーク通信を導入する。当社のアーキテクチャは、中央集権型と独立した学習ケースの双方で保証されていることを証明しています。ネットワーク化されたアプローチは、障害の更新や人口規模の変化に対する堅牢性という点において、両方の選択肢に対して大きなメリットがあることが示されています。
論文参考訳（メタデータ） (2023-06-05T10:45:39Z)
Safe Multi-agent Learning via Trapping Regions [89.24858306636816]
我々は、動的システムの定性理論から知られているトラップ領域の概念を適用し、分散学習のための共同戦略空間に安全セットを作成する。本稿では,既知の学習力学を持つシステムにおいて,候補がトラップ領域を形成することを検証するための二分分割アルゴリズムと,学習力学が未知のシナリオに対するサンプリングアルゴリズムを提案する。
論文参考訳（メタデータ） (2023-02-27T14:47:52Z)
Efficient Domain Coverage for Vehicles with Second-Order Dynamics via Multi-Agent Reinforcement Learning [9.939081691797858]
本稿では,2次動的エージェントを含む多エージェント効率ドメインカバレッジ問題に対する強化学習(RL)手法を提案する。提案するネットワークアーキテクチャには,LSTMと自己注意が組み込まれている。
論文参考訳（メタデータ） (2022-11-11T01:59:12Z)
Deep Learning for Wireless Networked Systems: a joint Estimation-Control-Scheduling Approach [47.29474858956844]
ワイヤレスネットワーク制御システム(Wireless Networked Control System, WNCS)は、無線通信を介してセンサ、コントローラ、アクチュエータを接続する技術であり、産業用 4.0 時代において、高度にスケーラブルで低コストな制御システムの展開を可能にする技術である。 WNCSにおける制御と通信の密接な相互作用にもかかわらず、既存のほとんどの研究は分離設計アプローチを採用している。モデルフリーデータとモデルベースデータの両方を利用する制御と最適化のための,DRLに基づく新しいアルゴリズムを提案する。
論文参考訳（メタデータ） (2022-10-03T01:29:40Z)
Multi-Agent Path Finding with Prioritized Communication Learning [44.89255851944412]
通信トポロジにテキスト単純計画の優先順位を組み込んだPrIoritized Communication Learning(PICO)を提案する。 PICOは、最先端の学習ベースプランナよりも、成功率や衝突率において、大規模なMAPFタスクにおいて、大幅に改善されている。
論文参考訳（メタデータ） (2022-02-08T04:04:19Z)
Deep reinforcement learning of event-triggered communication and control for multi-agent cooperative transport [9.891241465396098]
協調輸送のためのコミュニケーション・制御戦略の設計問題に対処する多エージェント強化学習手法を検討する。我々のフレームワークはイベントトリガーアーキテクチャ、すなわち通信入力を演算するフィードバックコントローラと、入力を再更新する必要があるタイミングを決定するトリガー機構を利用する。
論文参考訳（メタデータ） (2021-03-29T01:16:12Z)
Lyapunov-Based Reinforcement Learning for Decentralized Multi-Agent Control [3.3788926259119645]
分散マルチエージェント制御では、システムは未知あるいは非常に不確実なダイナミクスで複雑である。深層強化学習(DRL)は、システムダイナミクスを知らずに、データからコントローラや政治を学ぶことを約束している。既存のマルチエージェント強化学習(MARL)アルゴリズムは、マルチエージェントシステムの閉ループ安定性を保証することができない。安定保証付き分散マルチエージェント制御のための新しいMARLアルゴリズムを提案する。
論文参考訳（メタデータ） (2020-09-20T06:11:42Z)
Learning Event-triggered Control from Data through Joint Optimization [7.391641422048646]
イベントトリガー制御戦略のモデルフリー学習のためのフレームワークを提案する。階層的強化学習に基づく新しいアルゴリズムを提案する。得られたアルゴリズムは, 資源の節約や非線形・高次元システムへのシームレスなスケールで, 高性能な制御を実現する。
論文参考訳（メタデータ） (2020-08-11T14:15:38Z)
Decentralized MCTS via Learned Teammate Models [89.24858306636816]
本稿では,モンテカルロ木探索に基づくトレーニング可能なオンライン分散計画アルゴリズムを提案する。深層学習と畳み込みニューラルネットワークを用いて正確なポリシー近似を作成可能であることを示す。
論文参考訳（メタデータ） (2020-03-19T13:10:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。