論文の概要: Decentralized Coordination in Partially Observable Queueing Networks
- arxiv url: http://arxiv.org/abs/2208.13621v1
- Date: Mon, 29 Aug 2022 14:12:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-30 14:53:46.390306
- Title: Decentralized Coordination in Partially Observable Queueing Networks
- Title(参考訳): 部分可観測待ち行列ネットワークにおける分散コーディネーション
- Authors: Jiekai Jia, Anam Tahir, Heinz Koeppl
- Abstract要約: 我々は,エージェントが環境を部分的に観察し,全体の報酬を最大化するために協調して行動する必要がある,完全協調型マルチエージェントシステムにおけるコミュニケーションを考える。
エージェントは、現在のキューの長さの部分的な情報のみに基づいて、パケットをキューにルーティングする。
我々は,パケットドロップレートを低減するために,エージェントが情報を共有するための通信チャネルを実装した。
- 参考スコア(独自算出の注目度): 22.215852332444904
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider communication in a fully cooperative multi-agent system, where
the agents have partial observation of the environment and must act jointly to
maximize the overall reward. We have a discrete-time queueing network where
agents route packets to queues based only on the partial information of the
current queue lengths. The queues have limited buffer capacity, so packet drops
happen when they are sent to a full queue. In this work, we implemented a
communication channel for the agents to share their information in order to
reduce the packet drop rate. For efficient information sharing we use an
attention-based communication model, called ATVC, to select informative
messages from other agents. The agents then infer the state of queues using a
combination of the variational auto-encoder, VAE, and product-of-experts, PoE,
model. Ultimately, the agents learn what they need to communicate and with
whom, instead of communicating all the time with everyone. We also show
empirically that ATVC is able to infer the true state of the queues and leads
to a policy which outperforms existing baselines.
- Abstract(参考訳): 我々は,エージェントが環境を部分的に観察し,全体の報酬を最大化するために協調して行動する必要がある,完全協調型マルチエージェントシステムにおけるコミュニケーションを考える。
エージェントが現在のキュー長の部分情報のみに基づいてパケットをキューにルーティングする、離散時間キューネットワークがある。
キューはバッファ容量が限られているので、完全なキューに送信されるとパケットのドロップが発生する。
本研究では,パケットドロップ率を低減するために,エージェントが情報を共有するための通信チャネルを実装した。
効率的な情報共有には、他のエージェントからの通知メッセージを選択するために、ATVCと呼ばれる注意ベースのコミュニケーションモデルを使用します。
次にエージェントは、可変オートエンコーダ、VAE、およびProduct-of-experts、PoE、モデルを組み合わせてキューの状態を予測する。
究極的には、エージェントは全員と常にコミュニケーションする代わりに、何と誰と通信する必要があるかを学ぶ。
また、ATVCがキューの真の状態を推測し、既存のベースラインを上回るポリシーを導出できることを実証的に示す。
関連論文リスト
- AI Flow at the Network Edge [58.31090055138711]
AI Flowは、デバイス、エッジノード、クラウドサーバ間で利用可能な異種リソースを共同で活用することで、推論プロセスを合理化するフレームワークである。
この記事では、AI Flowのモチベーション、課題、原則を特定するためのポジションペーパーとして機能する。
論文 参考訳(メタデータ) (2024-11-19T12:51:17Z) - Communication-Efficient Collaborative Perception via Information Filling with Codebook [48.087934650038044]
協調的知覚は、他のエージェントと知覚的メッセージの交換を通じて、各エージェントに知覚能力を向上させる権限を与える。
このボトルネック問題に対処するため、私たちの中核となる考え方は、協調メッセージを2つの重要な側面、すなわち表現と選択から最適化することにあります。
これら2つの設計を統合することで,新しいコミュニケーション効率の協調認識システムであるCodeFillingを提案する。
論文 参考訳(メタデータ) (2024-05-08T11:12:37Z) - Context-aware Communication for Multi-agent Reinforcement Learning [6.109127175562235]
マルチエージェント強化学習(MARL)のための文脈認識型コミュニケーション手法を開発した。
第1段階では、エージェントは放送方式で粗い表現を交換し、第2段階のコンテキストを提供する。
その後、エージェントは第2段階の注意機構を利用し、受信機用にパーソナライズされたメッセージを選択的に生成する。
CACOMの有効性を評価するため,アクタ批判型と値に基づくMARLアルゴリズムを併用する。
論文 参考訳(メタデータ) (2023-12-25T03:33:08Z) - Learning to Cooperate and Communicate Over Imperfect Channels [27.241873614561538]
本稿では,エージェントが限定的かつ信頼性の低いチャネルを用いて,情報を分散的に処理・交換する協調型マルチエージェントシステムについて考察する。
提案手法では,異なる大きさのメッセージを送信することで,共有する情報の量に動的に適応することができる。
本手法は,新しい協調型桁予測環境において適応性のない手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-11-24T12:15:48Z) - Efficient Communication via Self-supervised Information Aggregation for
Online and Offline Multi-agent Reinforcement Learning [12.334522644561591]
MARL(Multi-Agent Reinforcement Learning)の協調学習において,効率的なメッセージアグリゲーションは協調に不可欠である,と我々は主張する。
本稿では, エージェントが受信したメッセージをコンパクトな表現に集約し, ローカルポリシーの強化に高い関連性を持たせることができる, 自己教師型情報集約(MASIA)によるマルチエージェント通信を提案する。
私たちはマルチエージェント通信のためのオフラインベンチマークを構築しています。
論文 参考訳(メタデータ) (2023-02-19T16:02:16Z) - Scalable Communication for Multi-Agent Reinforcement Learning via
Transformer-Based Email Mechanism [9.607941773452925]
コミュニケーションはマルチエージェント強化学習(MARL)における協調性を著しく向上させる
本稿では,部分的に観測されたタスクに対するMARL通信のスケーラビリティ問題に対処するための新しいフレームワークである Transformer-based Email Mechanism (TEM) を提案する。
論文 参考訳(メタデータ) (2023-01-05T05:34:30Z) - Optimization of Image Transmission in a Cooperative Semantic
Communication Networks [68.2233384648671]
画像伝送のためのセマンティック通信フレームワークを開発した。
サーバは、セマンティックコミュニケーション技術を用いて、画像の集合を協調的にユーザへ送信する。
抽出した意味情報と原画像との相関関係を測定するために,マルチモーダル・メトリックを提案する。
論文 参考訳(メタデータ) (2023-01-01T15:59:13Z) - Cooperative Actor-Critic via TD Error Aggregation [12.211031907519827]
本稿では、プライバシー問題に違反しないTDエラーアグリゲーションを備えた分散型アクター批判アルゴリズムを提案する。
我々は,各エージェントが平均目標関数を最大化するために,ステップサイズを小さくして収束解析を行う。
論文 参考訳(メタデータ) (2022-07-25T21:10:39Z) - Multi-agent Communication with Graph Information Bottleneck under
Limited Bandwidth (a position paper) [92.11330289225981]
多くの実世界のシナリオでは、通信は高価であり、マルチエージェントシステムの帯域幅には一定の制約がある。
通信資源を占有する冗長なメッセージは、情報的メッセージの送信をブロックし、パフォーマンスを損なう。
本稿では,通信グラフ内の構造情報とノード情報を効果的に圧縮し,帯域幅に制約のある設定に対処する,新しいマルチエージェント通信モジュールCommGIBを提案する。
論文 参考訳(メタデータ) (2021-12-20T07:53:44Z) - Distributed Adaptive Learning Under Communication Constraints [54.22472738551687]
本研究では,コミュニケーション制約下での運用を目的とした適応型分散学習戦略について検討する。
我々は,ストリーミングデータの連続的な観察から,オンライン最適化問題を解決しなければならないエージェントのネットワークを考える。
論文 参考訳(メタデータ) (2021-12-03T19:23:48Z) - Learning Connectivity for Data Distribution in Robot Teams [96.39864514115136]
グラフニューラルネットワーク(GNN)を用いたアドホックネットワークにおけるデータ分散のためのタスク非依存,分散化,低レイテンシ手法を提案する。
当社のアプローチは、グローバル状態情報に基づいたマルチエージェントアルゴリズムを各ロボットで利用可能にすることで機能させます。
我々は,情報の平均年齢を報酬関数として強化学習を通じて分散gnn通信政策を訓練し,タスク固有の報酬関数と比較してトレーニング安定性が向上することを示す。
論文 参考訳(メタデータ) (2021-03-08T21:48:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。