論文の概要: Open Ad Hoc Teamwork with Cooperative Game Theory
- arxiv url: http://arxiv.org/abs/2402.15259v1
- Date: Fri, 23 Feb 2024 11:04:33 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-26 14:51:01.984037
- Title: Open Ad Hoc Teamwork with Cooperative Game Theory
- Title(参考訳): 協調ゲーム理論を用いたオープンアドホックチームワーク
- Authors: Jianhong Wang and Yang Li and Yuan Zhang and Wei Pan and Samuel Kaski
- Abstract要約: アドホックなチームワークは、事前の調整や共同トレーニングなしに、チームメイトと協力するエージェントの設計を必要とする、困難な問題を引き起こします。
オープンアドホックチームワークは、オープンチームと呼ばれるチームメイトの数が増える環境を考えることで、この課題をさらに複雑にします。
この問題の最先端のソリューションは、グラフベースのポリシー学習(GPL)であり、グラフニューラルネットワークの一般化性を活用して、制限のない数のエージェントを処理し、オープンなチームに効果的に対処する。
- 参考スコア(独自算出の注目度): 30.68927142471717
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Ad hoc teamwork poses a challenging problem, requiring the design of an agent
to collaborate with teammates without prior coordination or joint training.
Open ad hoc teamwork further complicates this challenge by considering
environments with a changing number of teammates, referred to as open teams.
The state-of-the-art solution to this problem is graph-based policy learning
(GPL), leveraging the generalizability of graph neural networks to handle an
unrestricted number of agents and effectively address open teams. GPL's
performance is superior to other methods, but its joint Q-value representation
presents challenges for interpretation, hindering further development of this
research line and applicability. In this paper, we establish a new theory to
give an interpretation for the joint Q-value representation employed in GPL,
from the perspective of cooperative game theory. Building on our theory, we
propose a novel algorithm based on GPL framework, to complement the critical
features that facilitate learning, but overlooked in GPL. Through experiments,
we demonstrate the correctness of our theory by comparing the performance of
the resulting algorithm with GPL in dynamic team compositions.
- Abstract(参考訳): アドホックなチームワークは、事前の調整や共同トレーニングなしに、チームメイトと協力するエージェントの設計を必要とする、困難な問題を引き起こします。
オープンアドホックチームワークは、オープンチームと呼ばれるチームメイトの数が増える環境を考えることで、この課題をさらに複雑にします。
この問題に対する最先端のソリューションは、グラフベースのポリシ学習(gpl)であり、グラフニューラルネットワークの汎用性を活用して、制限のないエージェント数を処理し、オープンチームに対処する。
GPLの性能は他の方法よりも優れているが、その共同のQ値表現は解釈の課題を示し、この研究のさらなる発展と適用性を妨げる。
本稿では,協調ゲーム理論の観点から,gpl で採用されている合同 q-値表現の解釈を行うための新しい理論を確立する。
本稿では,GPL フレームワークをベースとした新しいアルゴリズムを提案し,学習を容易にする重要な特徴を補完するが,GPL では見落とされてしまう。
実験により,結果のアルゴリズムの性能を動的チーム構成のGPLと比較することにより,理論の正しさを実証する。
関連論文リスト
- Ant Colony Sampling with GFlowNets for Combinatorial Optimization [72.95439522658647]
Generative Flow Ant Colony Sampler (GFACS) はニューラル誘導型メタヒューリスティックアルゴリズムである。
GFACSは生成フローネットワーク(GFlowNets)とアリコロニー最適化(ACO)手法を統合している。
論文 参考訳(メタデータ) (2024-03-11T16:26:06Z) - Tackling Cooperative Incompatibility for Zero-Shot Human-AI Coordination [36.33334853998621]
協調的オープンエンド・ラーニング(COLE)フレームワークを導入し,学習における協調的非互換性を解決する。
COLEは、グラフ理論の観点を用いて、2人のプレイヤーと協調ゲームにおけるオープンエンド目標を定式化し、各戦略の協調能力を評価し、特定する。
我々は,COLEが理論的および経験的分析から協調的不整合性を効果的に克服できることを示した。
論文 参考訳(メタデータ) (2023-06-05T16:51:38Z) - A Reinforcement Learning-assisted Genetic Programming Algorithm for Team
Formation Problem Considering Person-Job Matching [70.28786574064694]
解の質を高めるために強化学習支援遺伝的プログラミングアルゴリズム(RL-GP)を提案する。
効率的な学習を通じて得られる超ヒューリスティックなルールは、プロジェクトチームを形成する際の意思決定支援として利用することができる。
論文 参考訳(メタデータ) (2023-04-08T14:32:12Z) - Cooperative Open-ended Learning Framework for Zero-shot Coordination [35.330951448600594]
本研究では,2人のプレーヤーによる協調ゲームにおいて,オープンエンドの目標を構築するための枠組みを提案する。
また,ゲーム理論やグラフ理論からの知識を活用する実用的なアルゴリズムを提案する。
本手法は,異なるレベルのパートナーとコーディネートする場合に,最先端の手法よりも優れる。
論文 参考訳(メタデータ) (2023-02-09T18:37:04Z) - A General Learning Framework for Open Ad Hoc Teamwork Using Graph-based
Policy Learning [11.998708550268978]
完全かつ部分的な可観測性の下でオープンなアドホックチームワークのためのソリューションのクラスを開発する。
我々のソリューションは、オープンなアドホックチームワークにおいて、完全かつ部分的に観察可能なケースで効率的なポリシーを学習できることを示します。
論文 参考訳(メタデータ) (2022-10-11T13:44:44Z) - Stacked Hybrid-Attention and Group Collaborative Learning for Unbiased
Scene Graph Generation [62.96628432641806]
Scene Graph Generationは、まず与えられた画像内の視覚的コンテンツをエンコードし、次にそれらをコンパクトな要約グラフに解析することを目的としている。
まず,モーダル内改良とモーダル間相互作用を容易にする新しいスタック型ハイブリッド・アテンションネットワークを提案する。
次に、デコーダを最適化するための革新的なグループ協調学習戦略を考案する。
論文 参考訳(メタデータ) (2022-03-18T09:14:13Z) - CogDL: A Comprehensive Library for Graph Deep Learning [55.694091294633054]
研究者や実践者が実験を行い、メソッドを比較し、簡単かつ効率的にアプリケーションを構築することができるグラフ深層学習ライブラリであるCogDLを紹介します。
CogDLでは,様々なグラフタスクに対するGNNモデルのトレーニングと評価のための統一設計を提案し,既存のグラフ学習ライブラリに固有のものである。
我々はCogDLのための効率的なスパース演算子を開発し、効率性のための最も競争力のあるグラフライブラリとなる。
論文 参考訳(メタデータ) (2021-03-01T12:35:16Z) - Evaluating and Rewarding Teamwork Using Cooperative Game Abstractions [103.3630903577951]
我々は、協調ゲーム理論を用いて、プロスポーツから、人工RLエージェントのチームと現実世界のチームを研究する。
データからCFを推定するための協調ゲーム抽象化(CGA)と呼ばれるパラメトリックモデルを導入する。
CGAモデルに対する識別結果とサンプル境界の複雑さと、CGAを用いたShapley値の推定における誤差境界を提供する。
論文 参考訳(メタデータ) (2020-06-16T22:03:36Z) - A Stochastic Team Formation Approach for Collaborative Mobile
Crowdsourcing [1.4209473797379666]
我々は,SN隣人に関する労働者の知識を活用するアルゴリズムを開発し,特定のリーダーに適切なチームを募集するよう依頼する。
提案アルゴリズムは最適な停止戦略から着想を得て,オッズアルゴリズムを用いて出力を算出する。
実験結果から, ベンチマーク指数最適解と比較して, 提案手法は時間を短縮し, 妥当な性能が得られることがわかった。
論文 参考訳(メタデータ) (2020-04-28T22:44:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。