論文の概要: Multi-Agent Reinforcement Learning for Traffic Signal Control through
Universal Communication Method
- arxiv url: http://arxiv.org/abs/2204.12190v1
- Date: Tue, 26 Apr 2022 09:48:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-27 13:34:35.194391
- Title: Multi-Agent Reinforcement Learning for Traffic Signal Control through
Universal Communication Method
- Title(参考訳): ユニバーサル通信による交通信号制御のためのマルチエージェント強化学習
- Authors: Qize Jiang, Minhao Qin, Shengmin Shi, Weiwei Sun and Baihua Zheng
- Abstract要約: 交差点間の共通通信形式UniCommを提案する。
UniCommは、あるエージェントで収集された大量の観測結果を、隣人への影響の重大な予測に埋め込む。
また,UniCommによる通信をフル活用するための簡潔ネットワークUniLightを提案する。
- 参考スコア(独自算出の注目度): 13.66480646740006
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: How to coordinate the communication among intersections effectively in real
complex traffic scenarios with multi-intersection is challenging. Existing
approaches only enable the communication in a heuristic manner without
considering the content/importance of information to be shared. In this paper,
we propose a universal communication form UniComm between intersections.
UniComm embeds massive observations collected at one agent into crucial
predictions of their impact on its neighbors, which improves the communication
efficiency and is universal across existing methods. We also propose a concise
network UniLight to make full use of communications enabled by UniComm.
Experimental results on real datasets demonstrate that UniComm universally
improves the performance of existing state-of-the-art methods, and UniLight
significantly outperforms existing methods on a wide range of traffic
situations.
- Abstract(参考訳): 実複雑な交通シナリオにおける交差点間の通信を多区間で効果的に協調する方法は困難である。
既存のアプローチは、共有する情報の内容や重要性を考慮せずに、ヒューリスティックな方法でのみ通信を可能にする。
本稿では,交差点間のユニコンムの普遍的な通信形式を提案する。
UniCommは、あるエージェントで収集された大量の観測結果を、隣人への影響の重大な予測に埋め込むことで、通信効率を向上し、既存の手法にまたがって普遍的である。
また,UniCommによる通信をフル活用するための簡潔ネットワークUniLightを提案する。
実データを用いた実験結果から、UniCommは既存の最先端手法の性能を普遍的に向上し、UniLightは幅広い交通状況において既存の手法よりも大幅に優れていた。
関連論文リスト
- Semantic Communication for Cooperative Perception using HARQ [51.148203799109304]
我々は重要セマンティック情報を抽出するために重要地図を活用し、協調的な知覚セマンティックコミュニケーションフレームワークを導入する。
周波数分割多重化(OFDM)とチャネル推定と等化戦略を併用して,時間変化によるマルチパスフェーディングによる課題に対処する。
我々は,ハイブリッド自動繰り返し要求(HARQ)の精神において,我々の意味コミュニケーションフレームワークと統合された新しい意味エラー検出手法を提案する。
論文 参考訳(メタデータ) (2024-08-29T08:53:26Z) - Learning Multi-Agent Communication with Contrastive Learning [3.816854668079928]
本稿では,コミュニケーション的メッセージが環境状態の異なる不完全なビューと見なされる,別の視点を紹介する。
送信したメッセージと受信したメッセージの関係を調べることで,コントラスト学習を用いてコミュニケーションを学ぶことを提案する。
通信環境において,本手法は性能と学習速度の両面で,従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-07-03T23:51:05Z) - Decentralized Learning over Wireless Networks: The Effect of Broadcast
with Random Access [56.91063444859008]
本稿では,D-SGDのコンバージェンス性能に及ぼす放送送信と確率的ランダムアクセスポリシーの影響について検討する。
この結果から,アクセス確率を最適化し,期待されるリンク数の最大化が,システム収束を加速するための極めて効果的な戦略であることが示唆された。
論文 参考訳(メタデータ) (2023-05-12T10:32:26Z) - From Explicit Communication to Tacit Cooperation:A Novel Paradigm for
Cooperative MARL [14.935456456463731]
本稿では,明示的なコミュニケーションから暗黙的な協調への段階的なシフトを促進する新しいパラダイムを提案する。
初期訓練段階では,エージェント間で関連情報を共有することで協力を促進する。
次に、明示的に伝達された情報と再構成された情報を組み合わせて混合情報を得る。
論文 参考訳(メタデータ) (2023-04-28T06:56:07Z) - Over-communicate no more: Situated RL agents learn concise communication
protocols [78.28898217947467]
互いに効果的に効率的にコミュニケーションできる人工エージェントをいかに設計するかは、不明である。
強化学習(RL)を用いたコミュニケーションの出現に関する研究
エージェントがコミュニケーションを行うための環境行為を強制しなければならない多段階タスクにおける位置的コミュニケーションについて検討する。
テストされたすべてのプレッシャーは過剰なコミュニケーションを阻害する可能性があるが、位置通信は最も効果的であり、努力のコストとは異なり、発生に悪影響を及ぼさない。
論文 参考訳(メタデータ) (2022-11-02T21:08:14Z) - Multi-Agent Adversarial Attacks for Multi-Channel Communications [24.576538640840976]
無線通信シナリオにおける敵をモデル化・解析するためのマルチエージェント・敵システム(MAAS)を提案する。
相手を学習エージェントとしてモデル化することにより,提案するMAASが,送信者戦略の事前知識を必要とせず,送信チャネルと割り当てされた各パワーを適切に選択可能であることを示す。
論文 参考訳(メタデータ) (2022-01-22T23:57:00Z) - Multi-agent Communication with Graph Information Bottleneck under
Limited Bandwidth (a position paper) [92.11330289225981]
多くの実世界のシナリオでは、通信は高価であり、マルチエージェントシステムの帯域幅には一定の制約がある。
通信資源を占有する冗長なメッセージは、情報的メッセージの送信をブロックし、パフォーマンスを損なう。
本稿では,通信グラフ内の構造情報とノード情報を効果的に圧縮し,帯域幅に制約のある設定に対処する,新しいマルチエージェント通信モジュールCommGIBを提案する。
論文 参考訳(メタデータ) (2021-12-20T07:53:44Z) - Federated Reinforcement Learning at the Edge [1.4271989597349055]
現代のサイバー物理アーキテクチャでは、異なる物理的位置にあるシステムから収集されたデータを使用して適切な振る舞いを学び、不確実な環境に適応する。
本稿では,複数のエージェントが分散的に収集された時系列データに対して,強化学習問題を共同で解決するために,効率的にコミュニケーションを行う必要がある設定について考察する。
通信効率向上のためのアルゴリズムが提案され、理論的保証、実践的実装、数値評価がサポートされている。
論文 参考訳(メタデータ) (2021-12-11T03:28:59Z) - Effective Communications: A Joint Learning and Communication Framework
for Multi-Agent Reinforcement Learning over Noisy Channels [0.0]
コミュニケーションにおける「有効性問題」の新しい定式化を提案する。
コーディネーションと協調性を向上するために,複数のエージェントがノイズの多いチャネル上で通信することを検討する。
提案した枠組みを用いて学習した共同方針が,コミュニケーションが別々に考慮される場合よりも優れていることを例に示します。
論文 参考訳(メタデータ) (2021-01-02T10:43:41Z) - Exploring Zero-Shot Emergent Communication in Embodied Multi-Agent
Populations [59.608216900601384]
本研究では,3次元環境下で関節を作動させることでコミュニケーションを学ぶエージェントについて検討する。
現実的な仮定、意図の非一様分布、共通知識エネルギーコストにおいて、これらのエージェントは新規パートナーに一般化するプロトコルを見つけることができることを示す。
論文 参考訳(メタデータ) (2020-10-29T19:23:10Z) - Learning Structured Communication for Multi-agent Reinforcement Learning [104.64584573546524]
本研究では,マルチエージェント強化学習(MARL)環境下での大規模マルチエージェント通信機構について検討する。
本稿では、より柔軟で効率的な通信トポロジを用いて、LSC(Learning Structured Communication)と呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-11T07:19:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。