論文の概要: A Bayesian Approach to Reinforcement Learning of Vision-Based Vehicular
Control
- arxiv url: http://arxiv.org/abs/2104.03807v1
- Date: Thu, 8 Apr 2021 14:34:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-09 13:19:28.190432
- Title: A Bayesian Approach to Reinforcement Learning of Vision-Based Vehicular
Control
- Title(参考訳): 視覚に基づく車体制御の強化学習へのベイズ的アプローチ
- Authors: Zahra Gharaee and Karl Holmquist and Linbo He and Michael Felsberg
- Abstract要約: 自律運転のための最先端の強化学習手法を提案する。
基礎的真理と推定意味セグメンテーション入力の両方を用いてシステムを訓練した。
システムの必要なトレーニング時間は低く、ベンチマークのパフォーマンスは競合するアプローチよりも優れていることが示されています。
- 参考スコア(独自算出の注目度): 14.713547378267748
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In this paper, we present a state-of-the-art reinforcement learning method
for autonomous driving. Our approach employs temporal difference learning in a
Bayesian framework to learn vehicle control signals from sensor data. The agent
has access to images from a forward facing camera, which are preprocessed to
generate semantic segmentation maps. We trained our system using both ground
truth and estimated semantic segmentation input. Based on our observations from
a large set of experiments, we conclude that training the system on ground
truth input data leads to better performance than training the system on
estimated input even if estimated input is used for evaluation. The system is
trained and evaluated in a realistic simulated urban environment using the
CARLA simulator. The simulator also contains a benchmark that allows for
comparing to other systems and methods. The required training time of the
system is shown to be lower and the performance on the benchmark superior to
competing approaches.
- Abstract(参考訳): 本稿では,自律運転のための最先端の強化学習手法を提案する。
本手法では,センサデータから車両制御信号を学習するために,時間差分学習を用いる。
エージェントは前方カメラからのイメージにアクセスでき、セマンティックセグメンテーションマップを生成するために前処理される。
基礎的真理と推定意味セグメンテーション入力の両方を用いてシステムを訓練した。
大規模な実験から得られた結果から, 地中真理入力データに基づくシステムトレーニングは, 推定入力を用いた場合であっても, 推定入力によるシステムトレーニングよりも優れた性能が得られると結論付けた。
このシステムは,CARLAシミュレータを用いて,現実的な都市環境下での訓練と評価を行う。
シミュレータには、他のシステムやメソッドとの比較が可能なベンチマークも含まれている。
システムに必要なトレーニング時間は低く、ベンチマークのパフォーマンスは、競合するアプローチよりも優れていることが示されている。
関連論文リスト
- Automatic UAV-based Airport Pavement Inspection Using Mixed Real and
Virtual Scenarios [3.0874677990361246]
本稿では,UAVが捉えた画像を用いて,舗装の苦悩を自動的に識別する視覚的アプローチを提案する。
提案手法は,画像の欠陥を分割する深層学習(DL)に基づいている。
合成および実訓練画像からなる混合データセットを使用することで、実アプリケーションシナリオでトレーニングモデルをテストする場合、より良い結果が得られることを示す。
論文 参考訳(メタデータ) (2024-01-11T16:30:07Z) - SAVME: Efficient Safety Validation for Autonomous Systems Using
Meta-Learning [36.896695278624776]
メタ学習戦略とマルチアームバンディットフレームワークを統合したベイズ的手法を提案する。
我々は,最先端の3D運転シミュレータを用いて,自律走行車スタックに16の忠実度設定を組み込んだ方法論を紹介した。
従来の手法に比べて最大18倍の高速化を実現している。
論文 参考訳(メタデータ) (2023-09-21T20:41:47Z) - CONVIQT: Contrastive Video Quality Estimator [63.749184706461826]
知覚ビデオ品質評価(VQA)は、多くのストリーミングおよびビデオ共有プラットフォームにおいて不可欠な要素である。
本稿では,視覚的に関連のある映像品質表現を自己指導的に学習する問題について考察する。
本研究は, 自己教師型学習を用いて, 知覚力による説得力のある表現が得られることを示す。
論文 参考訳(メタデータ) (2022-06-29T15:22:01Z) - Towards Optimal Strategies for Training Self-Driving Perception Models
in Simulation [98.51313127382937]
合成ドメインのみにおけるラベルの使用に焦点を当てる。
提案手法では,ニューラル不変表現の学習方法と,シミュレータからデータをサンプリングする方法に関する理論的にインスピレーションを得た視点を導入する。
マルチセンサーデータを用いた鳥眼視車両分割作業におけるアプローチについて紹介する。
論文 参考訳(メタデータ) (2021-11-15T18:37:43Z) - Vision-Based Autonomous Car Racing Using Deep Imitative Reinforcement
Learning [13.699336307578488]
深層模倣強化学習(DIRL)は、視覚入力を使用してアジャイルな自律レースを実現する。
我々は,高忠実性運転シミュレーションと実世界の1/20スケールRC-car上での車載計算の制限により,本アルゴリズムの有効性を検証した。
論文 参考訳(メタデータ) (2021-07-18T00:00:48Z) - Real-world Ride-hailing Vehicle Repositioning using Deep Reinforcement
Learning [52.2663102239029]
アイドルヘイリングプラットフォーム上での現実世界の車両の深層強化学習と意思決定時間計画に基づく新しい実用的枠組みを提示する。
本手法は,重み付きバッチ学習アルゴリズムを用いて乗車時の状態値関数を学習する。
配車シミュレーション環境におけるベースラインでアルゴリズムをベンチマークし、収益効率の向上における優位性を実証します。
論文 参考訳(メタデータ) (2021-03-08T05:34:05Z) - Self-supervised Co-training for Video Representation Learning [103.69904379356413]
実例に基づく情報ノイズコントラスト推定訓練に意味クラス正の付加を施すことの利点について検討する。
本稿では,インフォネッションNCEの損失を改善するための,自己指導型協調学習手法を提案する。
本研究では,2つの下流タスク(行動認識とビデオ検索)における学習表現の質を評価する。
論文 参考訳(メタデータ) (2020-10-19T17:59:01Z) - Learning Invariant Representations for Reinforcement Learning without
Reconstruction [98.33235415273562]
本研究では,表現学習が画像などのリッチな観察からの強化学習を,ドメイン知識や画素再構成に頼ることなく促進する方法について検討する。
シミュレーションメトリクスは、連続MDPの状態間の振る舞いの類似性を定量化する。
修正された視覚的 MuJoCo タスクを用いてタスク関連情報を無視する手法の有効性を実証する。
論文 参考訳(メタデータ) (2020-06-18T17:59:35Z) - SimAug: Learning Robust Representations from Simulation for Trajectory
Prediction [78.91518036949918]
本研究では,シミュレーション学習データの拡張により,ロバスト表現を学習する新しい手法を提案する。
我々は,SimAugが実世界の3つのベンチマークで有望な結果を得ることを示す。
論文 参考訳(メタデータ) (2020-04-04T21:22:01Z) - When Autonomous Systems Meet Accuracy and Transferability through AI: A
Survey [17.416847623629362]
本稿では,自律システムにおける学習に基づくアプローチを,正確性と伝達可能性の観点から概観する。
敵の学習の利点を示すため、正確性や伝達可能性の見直しに重点を置いている。
本稿では,自律システムにおける対人学習,RL,メタラーニングの課題と今後の課題について論じる。
論文 参考訳(メタデータ) (2020-03-29T04:50:22Z) - Denoising IMU Gyroscopes with Deep Learning for Open-Loop Attitude
Estimation [0.0]
本稿では,慣性計測ユニット(IMU)のジャイロスコープを地中真実データを用いて識別する学習手法を提案する。
得られたアルゴリズムは、(目に見えない)テストシーケンスで最先端の処理を行う。
論文 参考訳(メタデータ) (2020-02-25T08:04:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。