論文の概要: Diverse Auto-Curriculum is Critical for Successful Real-World Multiagent
Learning Systems
- arxiv url: http://arxiv.org/abs/2102.07659v1
- Date: Mon, 15 Feb 2021 16:40:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-16 15:29:30.517031
- Title: Diverse Auto-Curriculum is Critical for Successful Real-World Multiagent
Learning Systems
- Title(参考訳): 実世界のマルチエージェント学習システムにおける多種多様な自己帰結の重要性
- Authors: Yaodong Yang, Jun Luo, Ying Wen, Oliver Slumbers, Daniel Graves,
Haitham Bou Ammar, Jun Wang, Matthew E. Taylor
- Abstract要約: 私たちは、auto-curriculumテクニックに対する4つのオープンチャレンジを挙げています。
自律運転における現実的なインタラクティブな行動のモデリングを重要なテストベッドとして推奨する。
- 参考スコア(独自算出の注目度): 44.40385039839874
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multiagent reinforcement learning (MARL) has achieved a remarkable amount of
success in solving various types of video games. A cornerstone of this success
is the auto-curriculum framework, which shapes the learning process by
continually creating new challenging tasks for agents to adapt to, thereby
facilitating the acquisition of new skills. In order to extend MARL methods to
real-world domains outside of video games, we envision in this blue sky paper
that maintaining a diversity-aware auto-curriculum is critical for successful
MARL applications. Specifically, we argue that \emph{behavioural diversity} is
a pivotal, yet under-explored, component for real-world multiagent learning
systems, and that significant work remains in understanding how to design a
diversity-aware auto-curriculum. We list four open challenges for
auto-curriculum techniques, which we believe deserve more attention from this
community. Towards validating our vision, we recommend modelling realistic
interactive behaviours in autonomous driving as an important test bed, and
recommend the SMARTS benchmark.
- Abstract(参考訳): マルチエージェント強化学習(MARL)は,様々なタイプのビデオゲームを解く上で,極めて大きな成功を収めている。
この成功の基盤はオートカリキュラムフレームワークであり、エージェントが適応するための新しい困難なタスクを継続的に作成し、新たなスキルの獲得を促進することによって学習プロセスを形作る。
MARLの手法をゲーム以外の現実世界のドメインに拡張するためには、ダイバーシティを意識したオートカリキュラムの維持がMARLアプリケーションの成功に不可欠である、という青空の論文を構想する。
具体的には、 \emph{behavioural diversity} は実世界のマルチエージェント学習システムにおける重要かつ未知のコンポーネントであり、多様性を意識した自動カリキュラムの設計方法を理解する上で重要な作業が残っていると論じています。
私たちは、auto-curriculumテクニックに対する4つのオープンチャレンジを挙げています。
ビジョンを検証するために、自動運転における現実的なインタラクティブな行動を重要なテストベッドとしてモデル化することを推奨し、SMARTSベンチマークを推奨します。
関連論文リスト
- Quality Diversity Imitation Learning [9.627530753815968]
品質多様性模倣学習のための最初の汎用フレームワーク(QD-IL)を紹介する。
本フレームワークは,品質多様性の原則を逆模倣学習(AIL)法と統合し,逆強化学習(IRL)法を改良する可能性がある。
我々の手法は、最も挑戦的なヒューマノイド環境で2倍のエキスパート性能を達成できる。
論文 参考訳(メタデータ) (2024-10-08T15:49:33Z) - SoMeLVLM: A Large Vision Language Model for Social Media Processing [78.47310657638567]
ソーシャルメディア処理のための大規模ビジョン言語モデル(SoMeLVLM)を提案する。
SoMeLVLMは、知識と理解、応用、分析、評価、作成を含む5つの重要な機能を備えた認知フレームワークである。
実験により,複数のソーシャルメディアタスクにおいて,SoMeLVLMが最先端のパフォーマンスを達成できることが実証された。
論文 参考訳(メタデータ) (2024-02-20T14:02:45Z) - Delving into Multi-modal Multi-task Foundation Models for Road Scene Understanding: From Learning Paradigm Perspectives [56.2139730920855]
本稿では,道路シーンに特化して設計されたMM-VUFMの系統解析について述べる。
本研究の目的は,タスク特化モデル,統合マルチモーダルモデル,統合マルチタスクモデル,基礎モデル推進技術など,共通プラクティスの包括的概要を提供することである。
我々は、クローズドループ駆動システム、解釈可能性、エンボディドドライブエージェント、世界モデルなど、重要な課題と今後のトレンドに関する洞察を提供する。
論文 参考訳(メタデータ) (2024-02-05T12:47:09Z) - Mastering Robot Manipulation with Multimodal Prompts through Pretraining and Multi-task Fine-tuning [49.92517970237088]
我々はマルチモーダルなプロンプトを理解するためにロボットを訓練する問題に取り組む。
このようなタスクは、視覚と言語信号の相互接続と相補性を理解するロボットの能力にとって大きな課題となる。
マルチモーダルプロンプトを用いてロボット操作を行うためのポリシーを学習する効果的なフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-14T22:24:58Z) - Multi-task curriculum learning in a complex, visual, hard-exploration
domain: Minecraft [18.845438529816004]
私たちは、複雑な視覚的な領域でカリキュラムの学習を探索し、多くの難しい探索課題を経験します。
学習の進歩は,効果的なカリキュラムを自動構築する上で,学習可能性の信頼性の高い尺度であることが判明した。
論文 参考訳(メタデータ) (2021-06-28T17:50:40Z) - SMARTS: Scalable Multi-Agent Reinforcement Learning Training School for
Autonomous Driving [96.50297622371457]
マルチエージェントインタラクションは、現実の世界における自律運転の基本的な側面である。
研究と開発が10年以上続いたにもかかわらず、様々なシナリオで多様な道路ユーザーと対話する方法の問題は未解決のままである。
SMARTSと呼ばれる,多種多様な運転インタラクションを生成する専用シミュレーションプラットフォームを開発した。
論文 参考訳(メタデータ) (2020-10-19T18:26:10Z) - Automatic Curriculum Learning through Value Disagreement [95.19299356298876]
新しい未解決タスクを継続的に解決することが、多様な行動を学ぶための鍵です。
エージェントが複数の目標を達成する必要があるマルチタスク領域では、トレーニング目標の選択はサンプル効率に大きな影響を与える可能性がある。
そこで我々は,エージェントが解決すべき目標のための自動カリキュラムを作成することを提案する。
提案手法は,13のマルチゴールロボットタスクと5つのナビゲーションタスクにまたがって評価し,現在の最先端手法よりも高い性能を示す。
論文 参考訳(メタデータ) (2020-06-17T03:58:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。