論文の概要: Adaptive Coordination in Social Embodied Rearrangement
- arxiv url: http://arxiv.org/abs/2306.00087v1
- Date: Wed, 31 May 2023 18:05:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-02 20:07:07.510831
- Title: Adaptive Coordination in Social Embodied Rearrangement
- Title(参考訳): ソーシャル・エンボディド・リレンジメントにおける適応協調
- Authors: Andrew Szot, Unnat Jain, Dhruv Batra, Zsolt Kira, Ruta Desai, Akshara
Rai
- Abstract要約: 本研究では,エージェントが新しいパートナーと協力し,ロボットが新しいパートナーと協力するシナリオをエミュレートする作業において,ゼロショットコーディネート(ZSC)を研究する。
本稿では,識別可能性の目的を通じて多様性を促進する新しいZSCアプローチである行動多様性プレイ(BDP)を提案する。
以上の結果から,BDPは視覚的コーディネーションに対処可能な適応エージェントを学習し,ゼロショットは未確認環境において新たなパートナーに一般化し,ベースラインに比べて35%,効率が32%向上した。
- 参考スコア(独自算出の注目度): 49.35582108902819
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present the task of "Social Rearrangement", consisting of cooperative
everyday tasks like setting up the dinner table, tidying a house or unpacking
groceries in a simulated multi-agent environment. In Social Rearrangement, two
robots coordinate to complete a long-horizon task, using onboard sensing and
egocentric observations, and no privileged information about the environment.
We study zero-shot coordination (ZSC) in this task, where an agent collaborates
with a new partner, emulating a scenario where a robot collaborates with a new
human partner. Prior ZSC approaches struggle to generalize in our complex and
visually rich setting, and on further analysis, we find that they fail to
generate diverse coordination behaviors at training time. To counter this, we
propose Behavior Diversity Play (BDP), a novel ZSC approach that encourages
diversity through a discriminability objective. Our results demonstrate that
BDP learns adaptive agents that can tackle visual coordination, and zero-shot
generalize to new partners in unseen environments, achieving 35% higher success
and 32% higher efficiency compared to baselines.
- Abstract(参考訳): 本稿では,ディナーテーブルの設置,家の整理,食料品の包装解除などの協調的な日常的な作業から成る「社会的再配置」の課題について述べる。
ソーシャル・リアレンジメント(Social Rearrangement)では、2つのロボットが、オンボードセンシングとエゴセントリックな観察と、環境に関する特権的な情報を使用して、長い水平タスクを完了するように調整する。
本研究では,エージェントが新しいパートナーと協力し,ロボットが新しいパートナーと協力するシナリオをエミュレートする作業において,ゼロショットコーディネーション(ZSC)を研究する。
ZSCアプローチが我々の複雑で視覚的にリッチな設定を一般化するのに苦労する以前、さらなる分析により、トレーニング時に様々な協調行動を生成することができないことが判明した。
これに対応するために,識別可能性の目的を通じて多様性を促進する新しいZSCアプローチである行動多様性プレイ(BDP)を提案する。
以上の結果から,BDPは視覚的コーディネーションに対処可能な適応エージェントを学習し,ゼロショットは未確認環境において新たなパートナーに一般化し,ベースラインに比べて35%,効率が32%向上した。
関連論文リスト
- LLM-Based Cooperative Agents using Information Relevance and Plan Validation [5.299803738642663]
多エージェント協調は、3Dシーンと相互作用し、複雑な部分的な観察の下で分散エージェントと協調する。
現在のシステムは、観測を通して取得した情報を管理するのに非効率であることを示す。
空間データを意思決定プロセスに組み込むことの失敗は、エージェントが最適化された軌跡を構築する能力を制限する。
GPT-3.5を利用した新しい認知アーキテクチャREVECA(Relevance and Validation-Enhanced Cooperative Language Agent)を提案する。
論文 参考訳(メタデータ) (2024-05-27T01:47:14Z) - SOTOPIA: Interactive Evaluation for Social Intelligence in Language Agents [107.4138224020773]
人工エージェントと人間との複雑な社会的相互作用をシミュレートするオープンエンド環境であるSOTOPIAを提案する。
エージェントは、複雑な社会的目標を達成するために協調し、協力し、交換し、互いに競い合う。
GPT-4は,人間よりも目標達成率が著しく低く,社会的常識的推論や戦略的コミュニケーション能力の発揮に苦慮していることがわかった。
論文 参考訳(メタデータ) (2023-10-18T02:27:01Z) - MetaAgents: Simulating Interactions of Human Behaviors for LLM-based
Task-oriented Coordination via Collaborative Generative Agents [27.911816995891726]
我々は,一貫した行動パターンと課題解決能力を備えたLLMベースのエージェントを,協調的生成エージェントとして導入する。
本研究では,人間のような推論能力と専門的スキルを備えた協調生成エージェントを実現する新しい枠組みを提案する。
我々の研究は、タスク指向の社会シミュレーションにおける大規模言語モデルの役割と進化に関する貴重な洞察を提供する。
論文 参考訳(メタデータ) (2023-10-10T10:17:58Z) - Towards Few-shot Coordination: Revisiting Ad-hoc Teamplay Challenge In
the Game of Hanabi [15.917861586043813]
現状のZSCアルゴリズムは、異なる学習手法で訓練されたエージェントとペアリングした場合、性能が劣っていることを示す。
我々は,MARL手法の適応性を評価するために,ハナビと呼ばれる人気のある協調型マルチエージェントゲームに基づくフレームワークを構築した。
論文 参考訳(メタデータ) (2023-08-20T14:44:50Z) - Rearrange Indoor Scenes for Human-Robot Co-Activity [82.22847163761969]
本稿では,室内家具を人間ロボットのコアクティビティを向上するために,室内家具の配置を最適化した枠組みを提案する。
提案アルゴリズムは,SUNCGとConceptNetから抽出した空間的・意味的共起情報を統合することにより,家具間の機能的関係を保っている。
実験の結果、アレンジされたシーンは平均して14%のスペースを提供し、30%以上のオブジェクトをやりとりできることがわかった。
論文 参考訳(メタデータ) (2023-03-10T03:03:32Z) - Learning Roles with Emergent Social Value Orientations [49.16026283952117]
本稿では、人間社会における典型的な「労働・役割の分断」のメカニズムを紹介する。
我々は、社会的価値指向(SVO)を伴う時空間的社会的ジレンマ(ISD)に対する有望な解決策を提供する。
創発的SVOによる学習ロール(RESVO)と呼ばれる新しい学習フレームワークは、役割の学習を社会的価値指向の出現に変換するために提案されている。
論文 参考訳(メタデータ) (2023-01-31T17:54:09Z) - Multi-robot Social-aware Cooperative Planning in Pedestrian Environments
Using Multi-agent Reinforcement Learning [2.7716102039510564]
我々は、非政治的マルチエージェント強化学習(MARL)に基づく、新しいマルチロボット・ソーシャル・アウェア・効率的な協調プランナーを提案する。
我々は、時間空間グラフ(TSG)に基づくソーシャルエンコーダを採用し、その視野における各ロボットと歩行者の社会的関係の重要性をよりよく抽出する。
論文 参考訳(メタデータ) (2022-11-29T03:38:47Z) - Stateful active facilitator: Coordination and Environmental
Heterogeneity in Cooperative Multi-Agent Reinforcement Learning [71.53769213321202]
環境の調整レベルと不均一度の概念を定式化する。
異なるMARLアプローチの実証評価を容易にするマルチエージェント環境のスイートであるHECOGridを提案する。
本研究では,エージェントが高配向環境と高配向環境において効率的に作業することを可能にする訓練分散実行学習手法を提案する。
論文 参考訳(メタデータ) (2022-10-04T18:17:01Z) - Improved cooperation by balancing exploration and exploitation in
intertemporal social dilemma tasks [2.541277269153809]
本研究では,探索と搾取のバランスをとることができる学習率を組み込むことで協調を達成するための新たな学習戦略を提案する。
簡単な戦略を駆使したエージェントは、時間的社会的ジレンマと呼ばれる意思決定タスクにおいて、相対的に集団的リターンを改善する。
また、学習率の多様性が強化学習エージェントの人口に与える影響についても検討し、異種集団で訓練されたエージェントが特に協調した政策を発達させることを示す。
論文 参考訳(メタデータ) (2021-10-19T08:40:56Z) - On the Critical Role of Conventions in Adaptive Human-AI Collaboration [73.21967490610142]
規則依存表現と規則依存表現を区別する学習フレームワークを提案する。
複雑性が異なる3つの共同作業に対するアプローチを実験的に検証します。
論文 参考訳(メタデータ) (2021-04-07T02:46:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。