論文の概要: Controlling Steering with Energy-Based Models
- arxiv url: http://arxiv.org/abs/2301.12264v1
- Date: Sat, 28 Jan 2023 18:27:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-31 18:12:42.013298
- Title: Controlling Steering with Energy-Based Models
- Title(参考訳): エネルギーモデルによる操舵制御
- Authors: Mykyta Baliesnyi, Ardi Tampuu, Tambet Matiisen
- Abstract要約: エネルギーモデルによる暗黙の行動クローニングは、ロボット操作タスクにおいて有望な結果を示している。
エンド・ツー・エンドの運転モデルを用いて、実際の自動運転車のステアリングを制御する上で、この手法の利点が持続するかどうかを検証した。
我々は、ステアリングのみの道路追従タスクには、エネルギーベースのモデルから恩恵を受けるためのマルチモーダルが多すぎると論じている。
- 参考スコア(独自算出の注目度): 1.1602089225841632
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: So-called implicit behavioral cloning with energy-based models has shown
promising results in robotic manipulation tasks. We tested if the method's
advantages carry on to controlling the steering of a real self-driving car with
an end-to-end driving model. We performed an extensive comparison of the
implicit behavioral cloning approach with explicit baseline approaches, all
sharing the same neural network backbone architecture. Baseline explicit models
were trained with regression (MAE) loss, classification loss (softmax and
cross-entropy on a discretization), or as mixture density networks (MDN). While
models using the energy-based formulation performed comparably to baseline
approaches in terms of safety driver interventions, they had a higher whiteness
measure, indicating higher jerk. To alleviate this, we show two methods that
can be used to improve the smoothness of steering. We confirmed that
energy-based models handle multimodalities slightly better than simple
regression, but this did not translate to significantly better driving ability.
We argue that the steering-only road-following task has too few multimodalities
to benefit from energy-based models. This shows that applying implicit
behavioral cloning to real-world tasks can be challenging, and further
investigation is needed to bring out the theoretical advantages of energy-based
models.
- Abstract(参考訳): エネルギーベースのモデルを用いたいわゆる暗黙的行動クローニングは、ロボット操作タスクにおいて有望な結果を示している。
エンド・ツー・エンドの運転モデルを用いて、実際の自動運転車のステアリングを制御する方法の利点を検証した。
我々は、暗黙的行動クローニングアプローチと明示的なベースラインアプローチを広範囲に比較し、すべて同じニューラルネットワークバックボーンアーキテクチャを共有した。
ベースライン明示モデルは回帰損失 (mae) 、分類損失 (softmax and cross-entropy on a discretization)、または混合密度ネットワーク (mdn) を用いて訓練された。
エネルギーベースの定式化を用いたモデルは、安全運転者の介入の観点からのベースラインアプローチと比較すると、高いホワイトネス尺度を示し、高いジャークを示している。
これを軽減するために, ステアリングの平滑性を改善するための2つの方法を示す。
エネルギーベースモデルでは, 単純な回帰よりも若干, マルチモーダル性を扱うことが確認できたが, 運転能力は著しく向上しなかった。
我々は、ステアリングのみの道路追従作業はエネルギーベースのモデルから恩恵を受けるには多様さが少なすぎると主張している。
このことは、実世界のタスクに暗黙的な行動的クローンを適用することは困難であり、エネルギーベースモデルの理論的優位性を引き出すためにさらなる調査が必要であることを示している。
関連論文リスト
- MetaFollower: Adaptable Personalized Autonomous Car Following [63.90050686330677]
適応型パーソナライズされた自動車追従フレームワークであるMetaFollowerを提案する。
まず,モデルに依存しないメタラーニング(MAML)を用いて,様々なCFイベントから共通運転知識を抽出する。
さらに、Long Short-Term Memory (LSTM) と Intelligent Driver Model (IDM) を組み合わせて、時間的不均一性を高い解釈性で反映する。
論文 参考訳(メタデータ) (2024-06-23T15:30:40Z) - Distilling Reinforcement Learning Policies for Interpretable Robot Locomotion: Gradient Boosting Machines and Symbolic Regression [53.33734159983431]
本稿では, ニューラルRLポリシをより解釈可能な形式に蒸留する新しい手法を提案する。
我々は、RLを用いて専門家のニューラルネットワークポリシーを訓練し、(i)GBM、(ii)EBM、(iii)シンボリックポリシーに蒸留する。
論文 参考訳(メタデータ) (2024-03-21T11:54:45Z) - MOTO: Offline Pre-training to Online Fine-tuning for Model-based Robot
Learning [52.101643259906915]
本研究では,高次元観測による強化学習におけるオフライン事前学習とオンラインファインチューニングの問題について検討する。
既存のモデルベースオフラインRL法は高次元領域におけるオフラインからオンラインへの微調整には適していない。
本稿では,事前データをモデルベース値拡張とポリシー正則化によって効率的に再利用できるオンラインモデルベース手法を提案する。
論文 参考訳(メタデータ) (2024-01-06T21:04:31Z) - On Learning the Tail Quantiles of Driving Behavior Distributions via
Quantile Regression and Flows [13.540998552232006]
本研究では,人間の運転行動確率分布の多様性とテール量子化を正確に把握する学習モデルの問題点を考察する。
この設定に2つのフレキシブルな量子学習フレームワークを適用し、強い分布仮定を避ける。
我々は1ステップの加速予測タスクと複数ステップのドライバーシミュレーションのロールアウトでアプローチを評価した。
論文 参考訳(メタデータ) (2023-05-22T15:09:04Z) - Your Autoregressive Generative Model Can be Better If You Treat It as an
Energy-Based One [83.5162421521224]
本稿では,自己回帰生成モデルの学習のための独自のE-ARM法を提案する。
E-ARMは、よく設計されたエネルギーベースの学習目標を活用する。
我々は、E-ARMを効率的に訓練でき、露光バイアス問題を緩和できることを示した。
論文 参考訳(メタデータ) (2022-06-26T10:58:41Z) - Passive and Active Learning of Driver Behavior from Electric Vehicles [2.9623902973073375]
運転者の振る舞いをモデル化することは、電気自動車のエネルギー消費の予測など、自動車業界にいくつかの利点をもたらす。
機械学習手法はドライバーの行動分類に広く使われており、いくつかの課題をもたらす可能性がある。
これには、長期のウィンドウ上のシーケンスモデリングや、高価なアノテーションによるラベル付きデータの欠如が含まれる。
論文 参考訳(メタデータ) (2022-03-04T08:18:02Z) - Formulation and validation of a car-following model based on deep
reinforcement learning [0.0]
深部強化学習に基づく新車追従モデルの提案と検証を行う。
当社のモデルは, 自由・自動車追従体制において, 外部に与えられた報酬関数を最大化するように訓練されている。
これらの報酬関数のパラメータは、Intelligent Driver Modelのような従来のモデルに類似している。
論文 参考訳(メタデータ) (2021-09-29T08:27:12Z) - Multimodal VAE Active Inference Controller [0.0]
本稿では,産業用アームのアクティブ推論トルク制御装置を提案する。
線形結合型マルチモーダル変分オートエンコーダを用いたマルチモーダル状態表現学習を含む。
結果は、表現力の増加による目標方向到達の追跡と制御の改善を示した。
論文 参考訳(メタデータ) (2021-03-07T18:00:27Z) - Action-Based Representation Learning for Autonomous Driving [8.296684637620551]
本稿では,行動に基づく運転データを学習表現に用いることを提案する。
提案手法を用いて事前学習した空き時間に基づく運転モデルでは,比較的少量の弱注釈画像が有効であることを示す。
論文 参考訳(メタデータ) (2020-08-21T10:49:13Z) - AvgOut: A Simple Output-Probability Measure to Eliminate Dull Responses [97.50616524350123]
機能エンジニアリングなしで、どの発話やトークンが退屈であるかを動的に認識する対話モデルを構築します。
最初のモデルMinAvgOutは、各バッチの出力分布を通して、ダイバーシティスコアを直接最大化する。
第2のモデルであるラベルファインチューニング(LFT)は、多様性スコアによって連続的にスケールされたラベルをソースシーケンスにプリペイドし、多様性レベルを制御する。
3つ目のモデルであるRLは強化学習を採用し、多様性スコアを報奨信号として扱う。
論文 参考訳(メタデータ) (2020-01-15T18:32:06Z) - Model Fusion via Optimal Transport [64.13185244219353]
ニューラルネットワークのための階層モデル融合アルゴリズムを提案する。
これは、不均一な非i.d.データに基づいてトレーニングされたニューラルネットワーク間での"ワンショット"な知識伝達に成功していることを示す。
論文 参考訳(メタデータ) (2019-10-12T22:07:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。