論文の概要: Deep Latent Competition: Learning to Race Using Visual Control Policies
in Latent Space
- arxiv url: http://arxiv.org/abs/2102.09812v1
- Date: Fri, 19 Feb 2021 09:00:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-22 13:31:54.278112
- Title: Deep Latent Competition: Learning to Race Using Visual Control Policies
in Latent Space
- Title(参考訳): Deep Latent Competition: 潜時空間におけるビジュアルコントロールポリシを用いたレース学習
- Authors: Wilko Schwarting, Tim Seyde, Igor Gilitschenski, Lucas Liebenwein,
Ryan Sander, Sertac Karaman, Daniela Rus
- Abstract要約: Deep Latent Competition (DLC) は、想像力の自己プレイを通じて、競合する視覚制御ポリシーを学ぶ強化学習アルゴリズムである。
想像すると、セルフプレイは現実世界でコストのかかるサンプル生成を削減し、潜在表現は観測次元で計画を優雅にスケールできる。
- 参考スコア(独自算出の注目度): 63.57289340402389
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning competitive behaviors in multi-agent settings such as racing
requires long-term reasoning about potential adversarial interactions. This
paper presents Deep Latent Competition (DLC), a novel reinforcement learning
algorithm that learns competitive visual control policies through self-play in
imagination. The DLC agent imagines multi-agent interaction sequences in the
compact latent space of a learned world model that combines a joint transition
function with opponent viewpoint prediction. Imagined self-play reduces costly
sample generation in the real world, while the latent representation enables
planning to scale gracefully with observation dimensionality. We demonstrate
the effectiveness of our algorithm in learning competitive behaviors on a novel
multi-agent racing benchmark that requires planning from image observations.
Code and videos available at
https://sites.google.com/view/deep-latent-competition.
- Abstract(参考訳): レースなどのマルチエージェント環境での競争行動を学ぶには、潜在的な敵対的相互作用に関する長期的な推論が必要です。
本稿では、自己表現による視覚制御の競合を学習する新しい強化学習アルゴリズムであるDeep Latent Competition (DLC)を提案する。
DLCエージェントは、共役遷移関数と反対の視点予測を組み合わせた学習世界のモデルのコンパクト潜在空間におけるマルチエージェント相互作用シーケンスを想像する。
想像すると、セルフプレイは現実世界でコストのかかるサンプル生成を削減し、潜在表現は観測次元で計画を優雅にスケールできる。
画像観察から計画を必要とする新しいマルチエージェントレーシングベンチマークで、競争行動の学習におけるアルゴリズムの有効性を実証します。
コードとビデオはhttps://sites.google.com/view/deep-latent-competitionで入手できる。
関連論文リスト
- Learn 2 Rage: Experiencing The Emotional Roller Coaster That Is Reinforcement Learning [5.962453678471195]
この研究は、AIcrowdが主催するLearn To Race Autonomous Racing Virtual Challenge 2022で優勝したチームの実験とソリューションの概要を示します。
Learn-to-Raceコンペティションの目的は、自動運転の安全性のメリットを達成することに焦点を当て、自動運転技術の境界を推し進めることである。
SAC(Soft Actor Critic)の変種の実装に焦点をあてた。
私たちのゴールは、視覚的特徴と幾何学的特徴のみからレースカーの非自明な制御を学習し、ピクセルを直接制御アクションにマッピングすることでした。
論文 参考訳(メタデータ) (2024-10-24T06:16:52Z) - Learning Robot Soccer from Egocentric Vision with Deep Reinforcement Learning [17.906144781244336]
我々は,自己中心型RGBビジョンによる完全オンボード計算とセンシングにより,エンドツーエンドのロボットサッカーポリシーを訓練する。
本稿では,マルチエージェントロボットサッカーにおけるエンドツーエンドトレーニングの最初の実演を行う。
論文 参考訳(メタデータ) (2024-05-03T18:41:13Z) - Learning of Generalizable and Interpretable Knowledge in Grid-Based
Reinforcement Learning Environments [5.217870815854702]
本稿では,強化学習ポリシーを模倣するプログラム合成を提案する。
我々は,グリッド環境における概念学習に最先端のプログラム合成システムDreamCoderを適用した。
論文 参考訳(メタデータ) (2023-09-07T11:46:57Z) - Finding mixed-strategy equilibria of continuous-action games without
gradients using randomized policy networks [83.28949556413717]
グラデーションへのアクセスを伴わない連続アクションゲームのナッシュ平衡を近似的に計算する問題について検討する。
ニューラルネットワークを用いてプレイヤーの戦略をモデル化する。
本論文は、制約のない混合戦略と勾配情報のない一般的な連続アクションゲームを解決する最初の方法である。
論文 参考訳(メタデータ) (2022-11-29T05:16:41Z) - Stochastic Coherence Over Attention Trajectory For Continuous Learning
In Video Streams [64.82800502603138]
本稿では,映像ストリーム中のピクセルワイズ表現を段階的かつ自律的に開発するための,ニューラルネットワークに基づく新しいアプローチを提案する。
提案手法は, 参加者の入場地を観察することで, エージェントが学習できる, 人間の様の注意機構に基づく。
実験では,3次元仮想環境を利用して,映像ストリームを観察することで,エージェントが物体の識別を学べることを示す。
論文 参考訳(メタデータ) (2022-04-26T09:52:31Z) - Time-series Imputation of Temporally-occluded Multiagent Trajectories [18.862173210927658]
エージェントのサブセットの過去と将来の観測が、他のエージェントの欠落した観察を推定するために使用される、マルチエージェントの時系列計算の問題について検討する。
グラフインプタ(Graph Imputer)と呼ばれる我々の手法は,グラフネットワークと変分オートエンコーダを組み合わせた前方情報と後方情報を利用する。
提案手法は,プロジェクティブカメラモジュールを用いて,オフスクリーンプレーヤの状態推定設定のためのモデルをトレーニングし,評価する。
論文 参考訳(メタデータ) (2021-06-08T09:58:43Z) - CoCon: Cooperative-Contrastive Learning [52.342936645996765]
自己教師付き視覚表現学習は効率的な映像分析の鍵である。
最近の画像表現の学習の成功は、コントラスト学習がこの課題に取り組むための有望なフレームワークであることを示唆している。
コントラスト学習の協調的バリエーションを導入し、ビュー間の相補的な情報を活用する。
論文 参考訳(メタデータ) (2021-04-30T05:46:02Z) - Learning to Play Sequential Games versus Unknown Opponents [93.8672371143881]
学習者が最初にプレーするゲームと、選択した行動に反応する相手との連続的なゲームについて考察する。
対戦相手の対戦相手列と対戦する際,学習者に対して新しいアルゴリズムを提案する。
我々の結果には、相手の反応の正則性に依存するアルゴリズムの後悔の保証が含まれている。
論文 参考訳(メタデータ) (2020-07-10T09:33:05Z) - Learning from Learners: Adapting Reinforcement Learning Agents to be
Competitive in a Card Game [71.24825724518847]
本稿では,競争力のあるマルチプレイヤーカードゲームの現実的な実装を学習・プレイするために,一般的な強化学習アルゴリズムをどのように適用できるかについて検討する。
本研究は,学習エージェントに対して,エージェントが競争力を持つことの学習方法を評価するための特定のトレーニングと検証ルーチンを提案し,それらが相互の演奏スタイルにどのように適応するかを説明する。
論文 参考訳(メタデータ) (2020-04-08T14:11:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。