論文の概要: Approximate Inverse Reinforcement Learning from Vision-based Imitation
Learning
- arxiv url: http://arxiv.org/abs/2004.08051v3
- Date: Thu, 8 Apr 2021 19:52:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-12 10:05:49.407773
- Title: Approximate Inverse Reinforcement Learning from Vision-based Imitation
Learning
- Title(参考訳): 視覚に基づく模倣学習からの近似逆強化学習
- Authors: Keuntaek Lee, Bogdan Vlahov, Jason Gibson, James M. Rehg, Evangelos A.
Theodorou
- Abstract要約: 視覚に基づくナビゲーションのための暗黙的客観関数を求める手法を提案する。
提案手法は, シミュレーション学習, モデル予測制御(MPC), 深層ニューラルネットワークにおける解釈手法に依存する。
- 参考スコア(独自算出の注目度): 34.5366377122507
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work, we present a method for obtaining an implicit objective
function for vision-based navigation. The proposed methodology relies on
Imitation Learning, Model Predictive Control (MPC), and an interpretation
technique used in Deep Neural Networks. We use Imitation Learning as a means to
do Inverse Reinforcement Learning in order to create an approximate cost
function generator for a visual navigation challenge. The resulting cost
function, the costmap, is used in conjunction with MPC for real-time control
and outperforms other state-of-the-art costmap generators in novel
environments. The proposed process allows for simple training and robustness to
out-of-sample data. We apply our method to the task of vision-based autonomous
driving in multiple real and simulated environments and show its
generalizability.
- Abstract(参考訳): 本稿では,視覚に基づくナビゲーションのための暗黙的目的関数を得る手法を提案する。
提案手法は、模倣学習、モデル予測制御(mpc)、深層ニューラルネットワークで使用される解釈技術に依存する。
我々は,視覚ナビゲーション課題に対して近似コスト関数生成器を作成するために,模倣学習を逆強化学習の手段として用いる。
結果として生じるコストマップは、MPCと協調してリアルタイム制御を行い、新しい環境における他の最先端のコストマップジェネレータよりも優れている。
提案するプロセスは、サンプル外データに対する簡単なトレーニングと堅牢性を可能にする。
本手法は,複数の実環境およびシミュレーション環境における視覚に基づく自律運転の課題に適用し,その一般化性を示す。
関連論文リスト
- Unsupervised Meta-Learning via In-Context Learning [3.4165401459803335]
本稿では,教師なしメタ学習における教師なしメタ学習の一般化能力を活用した新しい手法を提案する。
提案手法は,メタラーニングをシーケンスモデリング問題として再設計し,トランスフォーマーエンコーダがサポート画像からタスクコンテキストを学習できるようにする。
論文 参考訳(メタデータ) (2024-05-25T08:29:46Z) - Graphical Object-Centric Actor-Critic [55.2480439325792]
本稿では,アクター批判とモデルに基づくアプローチを組み合わせたオブジェクト中心強化学習アルゴリズムを提案する。
変換器エンコーダを用いてオブジェクト表現とグラフニューラルネットワークを抽出し、環境のダイナミクスを近似する。
本アルゴリズムは,現状のモデルフリーアクター批判アルゴリズムよりも複雑な3次元ロボット環境と構成構造をもつ2次元環境において,より優れた性能を発揮する。
論文 参考訳(メタデータ) (2023-10-26T06:05:12Z) - CoopInit: Initializing Generative Adversarial Networks via Cooperative
Learning [50.90384817689249]
CoopInitは、協力的な学習ベースの戦略で、GANにとって良い出発点を素早く学べる。
本稿では,画像生成における提案手法の有効性を示す。
論文 参考訳(メタデータ) (2023-03-21T07:49:32Z) - Predictive Experience Replay for Continual Visual Control and
Forecasting [62.06183102362871]
視覚力学モデリングのための新しい連続学習手法を提案し,その視覚制御と予測における有効性について検討する。
まず,タスク固有のダイナミクスをガウスの混合で学習する混合世界モデルを提案し,その上で,破滅的な忘れを克服するための新たなトレーニング戦略を提案する。
我々のモデルは,DeepMind Control と Meta-World のベンチマークにおいて,既存の連続的学習アルゴリズムと視覚的RLアルゴリズムの単純な組み合わせよりも優れている。
論文 参考訳(メタデータ) (2023-03-12T05:08:03Z) - Goal-Guided Transformer-Enabled Reinforcement Learning for Efficient
Autonomous Navigation [15.501449762687148]
本稿ではゴール誘導ナビゲーションのためのゴール誘導トランスフォーマー対応強化学習(GTRL)手法を提案する。
本手法は,DRL学習プロセスのデータ効率を大幅に向上させる,主にゴール関連機能に焦点を当てたシーン表現の動機付けである。
データ効率, 性能, 堅牢性, および sim-to-real 一般化の観点から, シミュレーションと実世界の実験結果の両方が, 我々のアプローチの優位性を示している。
論文 参考訳(メタデータ) (2023-01-01T07:14:30Z) - Visual-Language Navigation Pretraining via Prompt-based Environmental
Self-exploration [83.96729205383501]
本稿では,言語埋め込みの高速適応を実現するために,プロンプトベースの学習を導入する。
我々のモデルは、VLNやREVERIEを含む多様な視覚言語ナビゲーションタスクに適応することができる。
論文 参考訳(メタデータ) (2022-03-08T11:01:24Z) - Spatiotemporal Costmap Inference for MPC via Deep Inverse Reinforcement
Learning [27.243603228431564]
目標条件付き時間報酬関数を学習するIRLRLアルゴリズムを提案する。
結果として生じるコストマップは、Model Predictive Controllers (MPC) によってタスクの実行に使用される。
論文 参考訳(メタデータ) (2022-01-17T17:36:29Z) - Multitask Adaptation by Retrospective Exploration with Learned World
Models [77.34726150561087]
本稿では,タスク非依存ストレージから取得したMBRLエージェントのトレーニングサンプルを提供するRAMaというメタ学習型アドレッシングモデルを提案する。
このモデルは、期待されるエージェントのパフォーマンスを最大化するために、ストレージから事前のタスクを解く有望な軌道を選択することで訓練される。
論文 参考訳(メタデータ) (2021-10-25T20:02:57Z) - DEALIO: Data-Efficient Adversarial Learning for Imitation from
Observation [57.358212277226315]
観察ifoからの模倣学習において、学習エージェントは、実演者の生成した制御信号にアクセスせずに、実演行動の観察のみを用いて実演エージェントを模倣しようとする。
近年、逆模倣学習に基づく手法は、ifO問題に対する最先端のパフォーマンスをもたらすが、データ非効率でモデルなしの強化学習アルゴリズムに依存するため、サンプルの複雑さに悩まされることが多い。
この問題は、サンプルの収集が時間、エネルギー、およびリスクの面で高いコストを被る可能性がある現実世界の設定に展開することは非現実的です。
よりデータ効率の高いifOアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-31T23:46:32Z) - Vision-Based Autonomous Drone Control using Supervised Learning in
Simulation [0.0]
室内環境におけるMAVの自律的ナビゲーションと着陸にSupervised Learningを用いた視覚に基づく制御手法を提案する。
我々は、低解像度画像とセンサー入力を高レベル制御コマンドにマッピングする畳み込みニューラルネットワーク(CNN)を訓練した。
我々のアプローチは、類似の強化学習アプローチよりも短いトレーニング時間を必要としており、匹敵するSupervised Learningアプローチが直面する手動データ収集の限界を克服する可能性がある。
論文 参考訳(メタデータ) (2020-09-09T13:45:41Z) - Denoising IMU Gyroscopes with Deep Learning for Open-Loop Attitude
Estimation [0.0]
本稿では,慣性計測ユニット(IMU)のジャイロスコープを地中真実データを用いて識別する学習手法を提案する。
得られたアルゴリズムは、(目に見えない)テストシーケンスで最先端の処理を行う。
論文 参考訳(メタデータ) (2020-02-25T08:04:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。