論文の概要: Learning to Communicate and Collaborate in a Competitive Multi-Agent Setup to Clean the Ocean from Macroplastics
- arxiv url: http://arxiv.org/abs/2304.05872v2
- Date: Wed, 06 Nov 2024 21:31:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-08 19:36:36.310277
- Title: Learning to Communicate and Collaborate in a Competitive Multi-Agent Setup to Clean the Ocean from Macroplastics
- Title(参考訳): マクロプラスチックから海洋を浄化する競争的マルチエージェント・セットアップにおけるコミュニケーションとコラボレートの学習
- Authors: Philipp Dominic Siedler,
- Abstract要約: エージェントの観測空間を増大させるグラフニューラルネットワーク(GNN)に基づく通信機構を提案する。
エージェント集合の目標は、可能な限りクリーンアップすることにあるが、収集されたマクロプラスチックの個々の量に対して、エージェントは報酬を受ける。
提案する通信機構を,通信能力のないマルチエージェントベースラインと比較する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Finding a balance between collaboration and competition is crucial for artificial agents in many real-world applications. We investigate this using a Multi-Agent Reinforcement Learning (MARL) setup on the back of a high-impact problem. The accumulation and yearly growth of plastic in the ocean cause irreparable damage to many aspects of oceanic health and the marina system. To prevent further damage, we need to find ways to reduce macroplastics from known plastic patches in the ocean. Here we propose a Graph Neural Network (GNN) based communication mechanism that increases the agents' observation space. In our custom environment, agents control a plastic collecting vessel. The communication mechanism enables agents to develop a communication protocol using a binary signal. While the goal of the agent collective is to clean up as much as possible, agents are rewarded for the individual amount of macroplastics collected. Hence agents have to learn to communicate effectively while maintaining high individual performance. We compare our proposed communication mechanism with a multi-agent baseline without the ability to communicate. Results show communication enables collaboration and increases collective performance significantly. This means agents have learned the importance of communication and found a balance between collaboration and competition.
- Abstract(参考訳): 多くの現実世界のアプリケーションにおいて、協調と競争のバランスを見つけることは、人工エージェントにとって不可欠である。
本稿では, マルチエージェント強化学習(MARL)を用いて, 高インパクト問題の裏側でこれを検討する。
海洋におけるプラスチックの蓄積と年間成長は、海洋の健康とマリーナ系の多くの側面に不可分に損傷を与える。
さらなる損傷を防ぐためには、海洋の既知のプラスチックパッチからマクロプラスチックを減らす方法を見つける必要がある。
本稿では,エージェントの観測空間を増大させるグラフニューラルネットワーク(GNN)に基づく通信機構を提案する。
私たちのカスタム環境では、エージェントがプラスチック収集容器を制御します。
この通信機構により、エージェントはバイナリ信号を用いて通信プロトコルを開発することができる。
エージェント集合の目標は、可能な限りクリーンアップすることにあるが、収集されたマクロプラスチックの個々の量に対して、エージェントは報酬を受ける。
したがってエージェントは、高い個人パフォーマンスを維持しながら、効果的にコミュニケーションを学ばなければならない。
提案する通信機構を,通信能力のないマルチエージェントベースラインと比較する。
その結果、コミュニケーションはコラボレーションを可能にし、全体的なパフォーマンスを著しく向上させる。
つまり、エージェントはコミュニケーションの重要性を学び、コラボレーションと競争のバランスを見つけました。
関連論文リスト
- Scaling Large-Language-Model-based Multi-Agent Collaboration [75.5241464256688]
大規模言語モデルによるエージェントのパイオニア化は、マルチエージェントコラボレーションの設計パターンを暗示している。
神経スケーリング法則に触発された本研究では,マルチエージェント協調におけるエージェントの増加に類似の原理が適用されるかを検討する。
論文 参考訳(メタデータ) (2024-06-11T11:02:04Z) - ProAgent: Building Proactive Cooperative Agents with Large Language
Models [89.53040828210945]
ProAgentは、大規模な言語モデルを利用してプロアクティブエージェントを生成する新しいフレームワークである。
ProAgentは現状を分析し、チームメイトの意図を観察から推測することができる。
ProAgentは高度なモジュール化と解釈可能性を示し、様々な調整シナリオに容易に統合できる。
論文 参考訳(メタデータ) (2023-08-22T10:36:56Z) - Building Cooperative Embodied Agents Modularly with Large Language
Models [104.57849816689559]
本研究では, 分散制御, 生の知覚観察, コストのかかるコミュニケーション, 様々な実施環境下でインスタンス化された多目的タスクといった課題に対処する。
我々は,LLMの常識知識,推論能力,言語理解,テキスト生成能力を活用し,認知に触発されたモジュラーフレームワークにシームレスに組み込む。
C-WAH と TDW-MAT を用いた実験により, GPT-4 で駆動される CoELA が, 強い計画に基づく手法を超越し, 創発的な効果的なコミュニケーションを示すことを示した。
論文 参考訳(メタデータ) (2023-07-05T17:59:27Z) - Dynamic Collaborative Multi-Agent Reinforcement Learning Communication
for Autonomous Drone Reforestation [0.0]
我々は,協調型マルチエージェント強化学習(MARL)による自律型ドローンによる森林再生にアプローチする。
エージェントは動的に変化するネットワークの一部として通信することができる。
その結果、コミュニケーションが協調し、集団的パフォーマンスを高め、正確さを植え付け、個々のエージェントのリスクテイク性を高めるかが示される。
論文 参考訳(メタデータ) (2022-11-14T13:25:22Z) - Certifiably Robust Policy Learning against Adversarial Communication in
Multi-agent Systems [51.6210785955659]
多くのマルチエージェント強化学習(MARL)では,エージェントが情報を共有し,適切な判断を下す上でコミュニケーションが重要である。
しかし、ノイズや潜在的な攻撃者が存在する現実世界のアプリケーションに訓練された通信エージェントを配置すると、通信ベースのポリシーの安全性は過小評価されている深刻な問題となる。
本研究では,攻撃者が任意の$CfracN-12$エージェントから被害者エージェントへの通信を任意に変更できる,$N$エージェントを備えた環境を検討する。
論文 参考訳(メタデータ) (2022-06-21T07:32:18Z) - PooL: Pheromone-inspired Communication Framework forLarge Scale
Multi-Agent Reinforcement Learning [0.0]
textbfPooLは、大規模マルチエージェント強化の textbfl に適用される間接通信フレームワークである。
PooLはフェロモンの放出と利用機構を利用して、大規模なエージェント調整を制御する。
PooLは効果的な情報を取り込み、通信コストの低い他の最先端手法よりも高い報酬を得ることができる。
論文 参考訳(メタデータ) (2022-02-20T03:09:53Z) - Interpretation of Emergent Communication in Heterogeneous Collaborative
Embodied Agents [83.52684405389445]
本稿では,コラボレーティブな多目的ナビゲーションタスクCoMONを紹介する。
この課題において、オラクルエージェントは、地図の形式で詳細な環境情報を有する。
視覚的に環境を知覚するナビゲーターエージェントと通信し、目標のシーケンスを見つけるのが任務である。
創発的コミュニケーションはエージェントの観察と3次元環境の空間構造に基礎を置くことができることを示す。
論文 参考訳(メタデータ) (2021-10-12T06:56:11Z) - Adversarial Attacks On Multi-Agent Communication [80.4392160849506]
現代の自律システムはすぐに大規模に展開され、協調型マルチエージェントシステムの可能性を広げる。
このような利点は、セキュリティ侵害に対して脆弱であることが示されている通信チャネルに大きく依存している。
本稿では,エージェントが学習した中間表現を共有してコミュニケーションする新しいマルチエージェント環境において,このような攻撃を探索する。
論文 参考訳(メタデータ) (2021-01-17T00:35:26Z) - The Emergence of Adversarial Communication in Multi-Agent Reinforcement
Learning [6.18778092044887]
多くの現実世界の問題は、複数の自律エージェントの調整を必要とする。
最近の研究は、複雑なマルチエージェント協調を可能にする明示的なコミュニケーション戦略を学ぶためのグラフニューラルネットワーク(GNN)の約束を示している。
一つの利己的なエージェントが高度に操作的なコミュニケーション戦略を学習し、協調的なエージェントチームを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2020-08-06T12:48:08Z) - Learning Individually Inferred Communication for Multi-Agent Cooperation [37.56115000150748]
我々はエージェントエージェントがエージェントエージェントコミュニケーションの事前学習を可能にするために、個別推論通信(I2C)を提案する。
先行知識は因果推論によって学習され、フィードフォワードニューラルネットワークによって実現される。
I2Cは通信オーバーヘッドを減らすだけでなく、様々なマルチエージェント協調シナリオのパフォーマンスを向上させることができる。
論文 参考訳(メタデータ) (2020-06-11T14:07:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。