論文の概要: Neurosymbolic Transformers for Multi-Agent Communication
- arxiv url: http://arxiv.org/abs/2101.03238v1
- Date: Tue, 5 Jan 2021 04:13:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-11 11:24:32.934948
- Title: Neurosymbolic Transformers for Multi-Agent Communication
- Title(参考訳): マルチエージェント通信のためのニューロシンボリックトランスフォーマー
- Authors: Jeevana Priya Inala, Yichen Yang, James Paulos, Yewen Pu, Osbert
Bastani, Vijay Kumar, Martin Rinard, Armando Solar-Lezama
- Abstract要約: 協調型マルチエージェント計画問題を解くためのコミュニケーション構造を推測する問題について検討する。
我々は通信グラフの最大度として通信量を定量化する。
- 参考スコア(独自算出の注目度): 40.19383403148471
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the problem of inferring communication structures that can solve
cooperative multi-agent planning problems while minimizing the amount of
communication. We quantify the amount of communication as the maximum degree of
the communication graph; this metric captures settings where agents have
limited bandwidth. Minimizing communication is challenging due to the
combinatorial nature of both the decision space and the objective; for
instance, we cannot solve this problem by training neural networks using
gradient descent. We propose a novel algorithm that synthesizes a control
policy that combines a programmatic communication policy used to generate the
communication graph with a transformer policy network used to choose actions.
Our algorithm first trains the transformer policy, which implicitly generates a
"soft" communication graph; then, it synthesizes a programmatic communication
policy that "hardens" this graph, forming a neurosymbolic transformer. Our
experiments demonstrate how our approach can synthesize policies that generate
low-degree communication graphs while maintaining near-optimal performance.
- Abstract(参考訳): コミュニケーションの量を最小限に抑えつつ,協調型マルチエージェント計画問題を解くためのコミュニケーション構造を推定する問題について検討する。
通信の量を通信グラフの最大度として定量化する。
コミュニケーションの最小化は、決定空間と目的の両方の組合せの性質のため困難であり、例えば、勾配勾配を用いたニューラルネットワークのトレーニングでは、この問題は解決できない。
本稿では,通信グラフ生成に使用するプログラム的通信ポリシーと,行動選択に使用されるトランスフォーマティブ・ポリシー・ネットワークを組み合わせた制御ポリシーを合成する新しいアルゴリズムを提案する。
提案手法は,まずトランスフォーマーポリシーを学習し,暗黙的に「ソフト」な通信グラフを生成し,その後,このグラフを「硬化」してニューロシンボリックトランスフォーマーを形成するプログラム的通信ポリシーを合成する。
実験では, ほぼ最適性能を維持しながら, 低次通信グラフを生成するポリシーをいかに合成できるかを示す。
関連論文リスト
- Communication Learning in Multi-Agent Systems from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
本稿では,各エージェントに対して時間的ゲーティング機構を導入し,ある時間に共有情報を受信するかどうかの動的決定を可能にする。
論文 参考訳(メタデータ) (2024-11-01T05:56:51Z) - Distributed Training of Large Graph Neural Networks with Variable Communication Rates [71.7293735221656]
大きなグラフ上でグラフニューラルネットワーク(GNN)をトレーニングすることは、大きなメモリとコンピューティング要件のために、ユニークな課題を提示する。
グラフを複数のマシンに分割する分散GNNトレーニングは、大きなグラフ上でGNNをトレーニングするための一般的なアプローチである。
本稿では,学習モデルの精度を損なうことなく,分散GNNトレーニングにおける通信量を削減するための可変圧縮方式を提案する。
論文 参考訳(メタデータ) (2024-06-25T14:57:38Z) - Learning Multi-Agent Communication from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
提案手法であるCommFormerは,通信グラフを効率よく最適化し,勾配降下によるアーキテクチャパラメータをエンドツーエンドで並列に洗練する。
論文 参考訳(メタデータ) (2024-05-14T12:40:25Z) - Emergent Quantized Communication [34.31732248872158]
本稿では,メッセージの量子化という,離散的なコミュニケーションを実現するための代替手法を提案する。
メッセージの量子化により、モデルのエンドツーエンドのトレーニングが可能になり、複数のセットアップで優れたパフォーマンスを実現します。
論文 参考訳(メタデータ) (2022-11-04T12:39:45Z) - Towards Human-Agent Communication via the Information Bottleneck
Principle [19.121541894577298]
これら3つの要因(実用性、情報性、複雑さ)のトレーディングが、いかに創発的なコミュニケーションを形作るかを研究する。
本稿では,連続空間に埋め込まれた離散信号に入力を圧縮するニューラルネットワークを訓練するVector-Quantized Variational Information Bottleneck (VQ-VIB)を提案する。
論文 参考訳(メタデータ) (2022-06-30T20:10:20Z) - Learning Resilient Radio Resource Management Policies with Graph Neural
Networks [124.89036526192268]
我々は、ユーザ当たりの最小容量制約でレジリエントな無線リソース管理問題を定式化する。
有限個のパラメータ集合を用いてユーザ選択と電力制御ポリシーをパラメータ化できることを示す。
このような適応により,提案手法は平均レートと5番目のパーセンタイルレートとの良好なトレードオフを実現する。
論文 参考訳(メタデータ) (2022-03-07T19:40:39Z) - Multi-agent Communication with Graph Information Bottleneck under
Limited Bandwidth (a position paper) [92.11330289225981]
多くの実世界のシナリオでは、通信は高価であり、マルチエージェントシステムの帯域幅には一定の制約がある。
通信資源を占有する冗長なメッセージは、情報的メッセージの送信をブロックし、パフォーマンスを損なう。
本稿では,通信グラフ内の構造情報とノード情報を効果的に圧縮し,帯域幅に制約のある設定に対処する,新しいマルチエージェント通信モジュールCommGIBを提案する。
論文 参考訳(メタデータ) (2021-12-20T07:53:44Z) - Deep reinforcement learning of event-triggered communication and control
for multi-agent cooperative transport [9.891241465396098]
協調輸送のためのコミュニケーション・制御戦略の設計問題に対処する多エージェント強化学習手法を検討する。
我々のフレームワークはイベントトリガーアーキテクチャ、すなわち通信入力を演算するフィードバックコントローラと、入力を再更新する必要があるタイミングを決定するトリガー機構を利用する。
論文 参考訳(メタデータ) (2021-03-29T01:16:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。