論文の概要: On the Critical Role of Conventions in Adaptive Human-AI Collaboration
- arxiv url: http://arxiv.org/abs/2104.02871v1
- Date: Wed, 7 Apr 2021 02:46:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-08 12:35:54.742608
- Title: On the Critical Role of Conventions in Adaptive Human-AI Collaboration
- Title(参考訳): 適応型人間-AIコラボレーションにおける条約の役割について
- Authors: Andy Shih and Arjun Sawhney and Jovana Kondic and Stefano Ermon and
Dorsa Sadigh
- Abstract要約: 規則依存表現と規則依存表現を区別する学習フレームワークを提案する。
複雑性が異なる3つの共同作業に対するアプローチを実験的に検証します。
- 参考スコア(独自算出の注目度): 73.21967490610142
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Humans can quickly adapt to new partners in collaborative tasks (e.g. playing
basketball), because they understand which fundamental skills of the task (e.g.
how to dribble, how to shoot) carry over across new partners. Humans can also
quickly adapt to similar tasks with the same partners by carrying over
conventions that they have developed (e.g. raising hand signals pass the ball),
without learning to coordinate from scratch. To collaborate seamlessly with
humans, AI agents should adapt quickly to new partners and new tasks as well.
However, current approaches have not attempted to distinguish between the
complexities intrinsic to a task and the conventions used by a partner, and
more generally there has been little focus on leveraging conventions for
adapting to new settings. In this work, we propose a learning framework that
teases apart rule-dependent representation from convention-dependent
representation in a principled way. We show that, under some assumptions, our
rule-dependent representation is a sufficient statistic of the distribution
over best-response strategies across partners. Using this separation of
representations, our agents are able to adapt quickly to new partners, and to
coordinate with old partners on new tasks in a zero-shot manner. We
experimentally validate our approach on three collaborative tasks varying in
complexity: a contextual multi-armed bandit, a block placing task, and the card
game Hanabi.
- Abstract(参考訳): 人間は共同作業(例えば、新しいパートナーに迅速に適応できる。
バスケットボールをする) タスクの根本的スキル(例えば)を理解しているからです
how to dribble, how to shoot) 新しいパートナーを乗り越える。
人間は、彼らが開発してきた慣習(例えば)を乗り越えることで、同じパートナーと同様のタスクに迅速に適応することができる。
手信号はボールを通り抜ける) ゼロから調整することを学ぶことなく
人間とシームレスに協力するためには、AIエージェントは新しいパートナーや新しいタスクにも迅速に対応する必要がある。
しかし、現在のアプローチでは、タスクに固有の複雑さとパートナーが使用する規約を区別しようとはしていません。
本研究では,ルール依存表現と規則依存表現を原則的に分離する学習フレームワークを提案する。
いくつかの仮定では、我々のルールに依存した表現は、パートナー間のベストレスポンス戦略に対する分布の十分な統計量である。
このような表現を分離することで、エージェントは新しいパートナーに迅速に適応し、ゼロショットで新しいタスクで古いパートナーと協調することが可能になります。
複雑度が異なる3つの協調作業(コンテキスト的マルチアームバンディット、ブロック配置タスク、カードゲーム「はなび」)に対するアプローチを実験的に検証した。
関連論文リスト
- ProAgent: Building Proactive Cooperative Agents with Large Language
Models [89.53040828210945]
ProAgentは、大規模な言語モデルを利用してプロアクティブエージェントを生成する新しいフレームワークである。
ProAgentは現状を分析し、チームメイトの意図を観察から推測することができる。
ProAgentは高度なモジュール化と解釈可能性を示し、様々な調整シナリオに容易に統合できる。
論文 参考訳(メタデータ) (2023-08-22T10:36:56Z) - Tackling Cooperative Incompatibility for Zero-Shot Human-AI Coordination [36.33334853998621]
協調的オープンエンド・ラーニング(COLE)フレームワークを導入し,学習における協調的非互換性を解決する。
COLEは、グラフ理論の観点を用いて、2人のプレイヤーと協調ゲームにおけるオープンエンド目標を定式化し、各戦略の協調能力を評価し、特定する。
我々は,COLEが理論的および経験的分析から協調的不整合性を効果的に克服できることを示した。
論文 参考訳(メタデータ) (2023-06-05T16:51:38Z) - Adaptive Coordination in Social Embodied Rearrangement [49.35582108902819]
本研究では,エージェントが新しいパートナーと協力し,ロボットが新しいパートナーと協力するシナリオをエミュレートする作業において,ゼロショットコーディネート(ZSC)を研究する。
本稿では,識別可能性の目的を通じて多様性を促進する新しいZSCアプローチである行動多様性プレイ(BDP)を提案する。
以上の結果から,BDPは視覚的コーディネーションに対処可能な適応エージェントを学習し,ゼロショットは未確認環境において新たなパートナーに一般化し,ベースラインに比べて35%,効率が32%向上した。
論文 参考訳(メタデータ) (2023-05-31T18:05:51Z) - A Hierarchical Approach to Population Training for Human-AI
Collaboration [20.860808795671343]
階層型強化学習(HRL)に基づくヒューマンAIコラボレーション手法を提案する。
本手法は,2人のプレイヤーによるオーバークッキングゲーム環境において,異なるプレイスタイルとスキルレベルを持つ新しいパートナに動的に適応できることを実証する。
論文 参考訳(メタデータ) (2023-05-26T07:53:12Z) - PECAN: Leveraging Policy Ensemble for Context-Aware Zero-Shot Human-AI
Coordination [52.991211077362586]
本研究では,集団におけるパートナーの多様性を高めるための政策アンサンブル手法を提案する。
そこで我々は,egoエージェントがパートナーの潜在的ポリシープリミティブを分析し,識別するためのコンテキスト認識手法を開発した。
このようにして、エゴエージェントは多様なパートナーとの共同作業において、より普遍的な協調行動を学ぶことができる。
論文 参考訳(メタデータ) (2023-01-16T12:14:58Z) - Conditional Imitation Learning for Multi-Agent Games [89.897635970366]
本研究では,条件付きマルチエージェント模倣学習の課題について考察する。
本稿では,スケーラビリティとデータ不足の難しさに対処する新しい手法を提案する。
我々のモデルは,egoやパートナエージェント戦略よりも低ランクなサブスペースを学習し,サブスペースに補間することで,新たなパートナ戦略を推論し,適応する。
論文 参考訳(メタデータ) (2022-01-05T04:40:13Z) - A Cordial Sync: Going Beyond Marginal Policies for Multi-Agent Embodied
Tasks [111.34055449929487]
エージェントが協力して家具をリビングルームに移動させるという,新しいタスクFurnMoveを紹介した。
既存のタスクとは異なり、FurnMoveはエージェントが各タイミングで調整する必要がある。
既存の分散化されたアクションサンプリング手順は、表現力のある共同アクションポリシーを許さない。
SynC-policiesとCORDIALを用いて、我々のエージェントはFurnMoveで58%の完成率を達成する。
論文 参考訳(メタデータ) (2020-07-09T17:59:57Z) - Evolving Dyadic Strategies for a Cooperative Physical Task [0.0]
我々はシミュレートされたエージェントを進化させ、実現可能なロールスイッチングポリシーの空間を探索する。
これらの切り替えポリシーを協調的なマニュアルタスクに適用すると、エージェントは視覚的および触覚的手がかりを処理して、いつ役割を切り替えるかを決定する。
最高の演奏ダイアドは高い時間的調整(反同期)を示す。
論文 参考訳(メタデータ) (2020-04-22T13:23:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。