論文の概要: Few-Shot Teamwork
- arxiv url: http://arxiv.org/abs/2207.09300v1
- Date: Tue, 19 Jul 2022 14:34:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-20 14:19:48.181868
- Title: Few-Shot Teamwork
- Title(参考訳): Few-Shot チームワーク
- Authors: Elliot Fosong, Arrasy Rahman, Ignacio Carlucho, Stefano V. Albrecht
- Abstract要約: チームで訓練された熟練したエージェントが、異なるタスクの熟練したエージェントと組み合わさって、目に見えないが関連するタスクに適応しなくてはならないという、新しい数発チームワーク(FST)問題を提案する。
我々は、FSTの問題は、複雑なタスクを完了させるためにエージェントのチームを訓練するために必要な経験を減らすこと、新しいタスクを完了させるために馴染みのないチームメイトと協力することの2つの異なる問題にどのように対処するかを議論する。
- 参考スコア(独自算出の注目度): 6.940758395823777
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose the novel few-shot teamwork (FST) problem, where skilled agents
trained in a team to complete one task are combined with skilled agents from
different tasks, and together must learn to adapt to an unseen but related
task. We discuss how the FST problem can be seen as addressing two separate
problems: one of reducing the experience required to train a team of agents to
complete a complex task; and one of collaborating with unfamiliar teammates to
complete a new task. Progress towards solving FST could lead to progress in
both multi-agent reinforcement learning and ad hoc teamwork.
- Abstract(参考訳): チームで訓練された熟練したエージェントが、異なるタスクの熟練したエージェントと組み合わさって、目に見えないが関連するタスクに適応しなくてはならないという、新しい数発チームワーク(FST)問題を提案する。
我々は、FSTの問題は、複雑なタスクを完了させるためにエージェントのチームを訓練するために必要な経験を減らすこと、新しいタスクを完了させるために馴染みのないチームメイトと協力することの2つの異なる問題にどのように対処するかを議論する。
FSTの解決に向けた進歩は、マルチエージェント強化学習とアドホックチームワークの両方の進展につながる可能性がある。
関連論文リスト
- Adaptive In-conversation Team Building for Language Model Agents [33.03550687362213]
複数の大規模言語モデル(LLM)エージェントを活用することは、複雑なタスクに取り組む上で有望なアプローチであることが示されている。
私たちの新しい適応型チーム構築パラダイムは、Captain Agentという新しいエージェント設計を通じて実現された柔軟なソリューションを提供します。
6つの実世界のシナリオに対する包括的な評価は、Captain Agentが既存のマルチエージェントメソッドを大幅に上回っていることを示している。
論文 参考訳(メタデータ) (2024-05-29T18:08:37Z) - Musketeer: Joint Training for Multi-task Vision Language Model with Task Explanation Prompts [75.75548749888029]
本稿では,全てのタスクに対してパラメータを共同で訓練し,複数の異種タスク間で完全に共有する視覚言語モデルを提案する。
単一のモデルで、Musteteerは単一のタスクでトレーニングされた強いベースラインに匹敵する結果を得る。
論文 参考訳(メタデータ) (2023-05-11T17:57:49Z) - Learning Complex Teamwork Tasks Using a Given Sub-task Decomposition [11.998708550268978]
本稿では,タスクをよりシンプルなマルチエージェントサブタスクに分解する手法を提案する。
各サブタスクでは、チーム全体のサブセットが、サブタスク固有のポリシを取得するようにトレーニングされる。
サブチームはマージされ、ターゲットタスクに転送される。そこでは、そのポリシーは、より複雑なターゲットタスクを解決するために、まとめて微調整される。
論文 参考訳(メタデータ) (2023-02-09T21:24:56Z) - Learning Task Embeddings for Teamwork Adaptation in Multi-Agent
Reinforcement Learning [13.468555224407764]
エージェントのチームは,タスク埋め込みを備えた場合,新しいタスクに適応できることを示す。
我々は、独立MATE、集中MATE、混合MATEの3つのMATE訓練パラダイムを提案する。
MATEが学習した埋め込みはタスクを識別し、新しいタスクへの適応中にエージェントが活用する有用な情報を提供する。
論文 参考訳(メタデータ) (2022-07-05T18:23:20Z) - Learning to Transfer Role Assignment Across Team Sizes [48.43860606706273]
チーム規模で役割の割り当てと移譲を学ぶためのフレームワークを提案する。
ロールベースの信用割当構造を再利用することで、より大きな強化学習チームの学習プロセスが促進されることを示す。
論文 参考訳(メタデータ) (2022-04-17T11:22:01Z) - Multi-Agent Policy Transfer via Task Relationship Modeling [28.421365805638953]
我々は、タスク間の共通構造を発見し、活用し、より効率的な転送を試みる。
本稿では,タスクの共通空間として効果に基づくタスク表現を学習する。
その結果,提案手法は,学習した協調知識をいくつかのソースタスクの学習後に新しいタスクに伝達するのに役立つ。
論文 参考訳(メタデータ) (2022-03-09T01:49:21Z) - Towards Collaborative Question Answering: A Preliminary Study [63.91687114660126]
我々は、モデレーターによって調整された複数の専門家エージェントが協力して、単一のエージェントだけでは答えられない質問に答える新しいQAタスクCollabQAを提案する。
専門家に分散可能な,大規模な知識グラフの合成データセットを作成する。
専門家が完璧で均一でない限り,コラボレーション構造を導入することなく,この問題が解決可能であることを示す。
論文 参考訳(メタデータ) (2022-01-24T14:27:00Z) - Environment Generation for Zero-Shot Compositional Reinforcement
Learning [105.35258025210862]
環境構成設計(CoDE)は、ジェネレータエージェントを訓練し、エージェントの現在のスキルレベルに合わせて一連の構成タスクを自動的に構築する。
我々は,複数のページや部屋からなる環境を生成することを学び,それらの環境において複雑なタスクを広範囲にこなせるRLエージェントを訓練する。
CoDEは最強のベースラインよりも4倍高い成功率を示し、3500のプリミティブタスクで学んだ実際のWebサイトのパフォーマンスを示している。
論文 参考訳(メタデータ) (2022-01-21T21:35:01Z) - Efficiently Identifying Task Groupings for Multi-Task Learning [55.80489920205404]
マルチタスク学習は、あるタスクによって学習された情報を活用して、他のタスクのトレーニングに役立てることができる。
マルチタスク学習モデルにおいて、どのタスクを一緒にトレーニングすべきかを選択するアプローチを提案する。
本手法は,全タスクを協調学習し,タスクの勾配が他のタスクの損失に影響を及ぼす影響を定量化する。
論文 参考訳(メタデータ) (2021-09-10T02:01:43Z) - On the Critical Role of Conventions in Adaptive Human-AI Collaboration [73.21967490610142]
規則依存表現と規則依存表現を区別する学習フレームワークを提案する。
複雑性が異なる3つの共同作業に対するアプローチを実験的に検証します。
論文 参考訳(メタデータ) (2021-04-07T02:46:19Z) - Multi-Agent Reinforcement Learning for Problems with Combined Individual
and Team Reward [0.0]
本稿では,新しい多エージェント強化学習フレームワークであるDecomposed Multi-Agent Deep Deterministic Policy Gradient (DE-MADDPG)を提案する。
提案手法は,MADDPGアルゴリズムの直接適応よりもはるかに優れた,より安定した性能が得られることを示す。
論文 参考訳(メタデータ) (2020-03-24T00:55:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。