論文の概要: Emergent cooperation through mutual information maximization
- arxiv url: http://arxiv.org/abs/2006.11769v1
- Date: Sun, 21 Jun 2020 11:15:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-18 12:44:07.662302
- Title: Emergent cooperation through mutual information maximization
- Title(参考訳): 相互情報最大化による創発的協力
- Authors: Santiago Cuervo and Marco Alzate
- Abstract要約: 協調型マルチエージェントシステムの設計のための分散型深層強化学習アルゴリズムを提案する。
このアルゴリズムは、高度に相関した行動が協調システムの特徴であるという仮説に基づいている。
エージェント間の相互情報の相互作用は、社会的ジレンマにおける協調の出現を促進すると結論付けている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With artificial intelligence systems becoming ubiquitous in our society, its
designers will soon have to start to consider its social dimension, as many of
these systems will have to interact among them to work efficiently. With this
in mind, we propose a decentralized deep reinforcement learning algorithm for
the design of cooperative multi-agent systems. The algorithm is based on the
hypothesis that highly correlated actions are a feature of cooperative systems,
and hence, we propose the insertion of an auxiliary objective of maximization
of the mutual information between the actions of agents in the learning
problem. Our system is applied to a social dilemma, a problem whose optimal
solution requires that agents cooperate to maximize a macroscopic performance
function despite the divergent individual objectives of each agent. By
comparing the performance of the proposed system to a system without the
auxiliary objective, we conclude that the maximization of mutual information
among agents promotes the emergence of cooperation in social dilemmas.
- Abstract(参考訳): 人工知能システムが私たちの社会でユビキタスになるにつれ、その設計者はすぐにその社会的側面を考え始めなければなりません。
そこで本研究では,協調型マルチエージェントシステムの設計のための分散強化学習アルゴリズムを提案する。
本アルゴリズムは,協調システムの特徴として高度に相関した行動が挙げられる仮説に基づいており,学習問題におけるエージェントの行動間の相互情報を最大化するための補助目的の挿入を提案する。
本システムは,各エージェントの個人的目的の相違にもかかわらず,エージェントが協調してマクロなパフォーマンス関数を最大化する必要がある問題である,社会ジレンマに適用する。
提案システムの性能を補助目的を伴わないシステムと比較することにより,エージェント間の相互情報の最大化が社会的ジレンマにおける協調の出現を促進すると結論づける。
関連論文リスト
- Communication Learning in Multi-Agent Systems from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
本稿では,各エージェントに対して時間的ゲーティング機構を導入し,ある時間に共有情報を受信するかどうかの動的決定を可能にする。
論文 参考訳(メタデータ) (2024-11-01T05:56:51Z) - Agent-Oriented Planning in Multi-Agent Systems [54.429028104022066]
本稿では,高速なタスク分解とアロケーションプロセスを活用するマルチエージェントシステムにおけるエージェント指向計画のための新しいフレームワークを提案する。
提案フレームワークにフィードバックループを組み込んで,そのような問題解決プロセスの有効性と堅牢性をさらに向上させる。
論文 参考訳(メタデータ) (2024-10-03T04:07:51Z) - Interactive Speculative Planning: Enhance Agent Efficiency through Co-design of System and User Interface [38.76937539085164]
本稿では,人間中心の効率的なエージェント計画手法である対話型投機計画を提案する。
我々は,システム設計と人間-AIインタラクションの両面からエージェント計画の効率化を目指す。
論文 参考訳(メタデータ) (2024-09-30T16:52:51Z) - Scaling Large-Language-Model-based Multi-Agent Collaboration [75.5241464256688]
大規模言語モデルによるエージェントのパイオニア化は、マルチエージェントコラボレーションの設計パターンを暗示している。
神経スケーリング法則に触発された本研究では,マルチエージェント協調におけるエージェントの増加に類似の原理が適用されるかを検討する。
論文 参考訳(メタデータ) (2024-06-11T11:02:04Z) - Learning Multi-Agent Communication from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
提案手法であるCommFormerは,通信グラフを効率よく最適化し,勾配降下によるアーキテクチャパラメータをエンドツーエンドで並列に洗練する。
論文 参考訳(メタデータ) (2024-05-14T12:40:25Z) - Decentralized and Lifelong-Adaptive Multi-Agent Collaborative Learning [57.652899266553035]
分散型および生涯適応型多エージェント協調学習は、中央サーバを使わずに複数のエージェント間のコラボレーションを強化することを目的としている。
動的協調グラフを用いた分散マルチエージェント生涯協調学習アルゴリズムであるDeLAMAを提案する。
論文 参考訳(メタデータ) (2024-03-11T09:21:11Z) - Learning Reward Machines in Cooperative Multi-Agent Tasks [75.79805204646428]
本稿では,MARL(Multi-Agent Reinforcement Learning)に対する新しいアプローチを提案する。
これは、協調的なタスク分解と、サブタスクの構造をコードする報酬機(RM)の学習を組み合わせる。
提案手法は、部分的に観測可能な環境下での報酬の非マルコフ的性質に対処するのに役立つ。
論文 参考訳(メタデータ) (2023-03-24T15:12:28Z) - Iterated Reasoning with Mutual Information in Cooperative and Byzantine
Decentralized Teaming [0.0]
我々は,政策グラディエント(PG)の下での最適化において,エージェントの方針がチームメイトの方針に準じることが,本質的に相互情報(MI)の下限を最大化することを示す。
我々の手法であるInfoPGは、創発的協調行動の学習におけるベースラインを上回り、分散協調型MARLタスクにおける最先端の課題を設定します。
論文 参考訳(メタデータ) (2022-01-20T22:54:32Z) - A Novel Multi-Agent System for Complex Scheduling Problems [2.294014185517203]
本稿では,様々な問題領域に適用可能なマルチエージェントシステムの概念と実装について述べる。
提案手法の有効性を示すため,NP-hardスケジューリング問題をシミュレートする。
本稿では,レイアウトの複雑さの低減,複雑なシステムの制御の改善,拡張性など,エージェントベースのアプローチの利点を強調した。
論文 参考訳(メタデータ) (2020-04-20T14:04:58Z) - Counterfactual Multi-Agent Reinforcement Learning with Graph Convolution
Communication [5.5438676149999075]
本稿では,エージェントが協調してシステムの有用性を最大化する,完全協調型マルチエージェントシステムについて考察する。
マルチエージェントシステムには,エージェント間の相互作用を伝達し,理解する能力が必要である。
エージェント間の通信を可能にするアーキテクチャを開発し,各エージェントに対するシステム報酬を調整する。
論文 参考訳(メタデータ) (2020-04-01T14:36:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。