論文の概要: The Impact of Missing Velocity Information in Dynamic Obstacle Avoidance
based on Deep Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2112.12465v1
- Date: Thu, 23 Dec 2021 11:07:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-24 21:29:02.857693
- Title: The Impact of Missing Velocity Information in Dynamic Obstacle Avoidance
based on Deep Reinforcement Learning
- Title(参考訳): 深部強化学習に基づく動的障害物回避における速度情報の欠落の影響
- Authors: Fabian Hart, Martin Waltz, Ostap Okhrin
- Abstract要約: 本稿では,Deep Reinforcement Learningに基づく動的障害物回避手法を提案する。
障害物回避作業におけるエージェントの性能に及ぼす速度情報不足の影響を徹底的に検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce a novel approach to dynamic obstacle avoidance based on Deep
Reinforcement Learning by defining a traffic type independent environment with
variable complexity. Filling a gap in the current literature, we thoroughly
investigate the effect of missing velocity information on an agent's
performance in obstacle avoidance tasks. This is a crucial issue in practice
since several sensors yield only positional information of objects or vehicles.
We evaluate frequently-applied approaches in scenarios of partial
observability, namely the incorporation of recurrency in the deep neural
networks and simple frame-stacking. For our analysis, we rely on
state-of-the-art model-free deep RL algorithms. The lack of velocity
information is found to significantly impact the performance of an agent. Both
approaches - recurrency and frame-stacking - cannot consistently replace
missing velocity information in the observation space. However, in simplified
scenarios, they can significantly boost performance and stabilize the overall
training procedure.
- Abstract(参考訳): 本稿では,複雑な交通型独立環境を定義することにより,深層強化学習に基づく動的障害物回避手法を提案する。
現在の文献のギャップを埋めるため,障害物回避作業におけるエージェントの性能に及ぼす速度情報不足の影響を徹底的に検討した。
これは実際に重要な問題であり、いくつかのセンサーは物体や車両の位置情報しか得られない。
我々は、部分観測可能性のシナリオ、すなわちディープニューラルネットワークにおける繰り返しの取り込みと単純なフレームスタッキングにおける頻繁な適用アプローチを評価する。
我々の分析では、最先端のモデルフリーディープRLアルゴリズムに頼っている。
速度情報の欠如はエージェントのパフォーマンスに大きな影響を与えることが分かる。
繰り返しとフレームスタッキングの両方のアプローチは、観測空間における欠落した速度情報を一貫して置き換えることはできない。
しかし、単純なシナリオでは、パフォーマンスを著しく向上させ、全体的なトレーニング手順を安定化させることができる。
関連論文リスト
- Localized Gaussians as Self-Attention Weights for Point Clouds Correspondence [92.07601770031236]
本稿では,エンコーダのみのトランスフォーマーアーキテクチャのアテンションヘッドにおける意味的意味パターンについて検討する。
注意重みの修正はトレーニングプロセスの促進だけでなく,最適化の安定性の向上にも寄与する。
論文 参考訳(メタデータ) (2024-09-20T07:41:47Z) - Analyzing Adversarial Inputs in Deep Reinforcement Learning [53.3760591018817]
本稿では, 正当性検証のレンズを用いて, 逆入力の特性を包括的に解析する。
このような摂動に対する感受性に基づいてモデルを分類するために、新しい計量である逆数率(Adversarial Rate)を導入する。
本分析は, 直交入力が所定のDRLシステムの安全性にどのように影響するかを実証的に示す。
論文 参考訳(メタデータ) (2024-02-07T21:58:40Z) - Video Dynamics Prior: An Internal Learning Approach for Robust Video
Enhancements [83.5820690348833]
外部トレーニングデータコーパスを必要としない低レベルの視覚タスクのためのフレームワークを提案する。
提案手法は,コヒーレンス・時間的テストの重み付けと統計内部統計を利用して,破損したシーケンスを最適化することでニューラルモジュールを学習する。
論文 参考訳(メタデータ) (2023-12-13T01:57:11Z) - Robustness Benchmark of Road User Trajectory Prediction Models for
Automated Driving [0.0]
車両内のモデル展開中に観測される機能不全をシミュレートする摂動に対して、機械学習モデルをベンチマークする。
同様の摂動を持つモデルのトレーニングは、パフォーマンスの劣化を効果的に低減し、エラーは+87.5%まで増加する。
効果的な緩和戦略であるにもかかわらず、トレーニング中の摂動によるデータ拡張は、予期せぬ摂動に対する堅牢性を保証するものではない、と我々は主張する。
論文 参考訳(メタデータ) (2023-04-04T15:47:42Z) - Enhancing Multiple Reliability Measures via Nuisance-extended
Information Bottleneck [77.37409441129995]
トレーニングデータに制限がある現実的なシナリオでは、データ内の多くの予測信号は、データ取得のバイアスからより多く得る。
我々は,相互情報制約の下で,より広い範囲の摂動をカバーできる敵の脅威モデルを考える。
そこで本研究では,その目的を実現するためのオートエンコーダベーストレーニングと,提案したハイブリッド識別世代学習を促進するための実用的なエンコーダ設計を提案する。
論文 参考訳(メタデータ) (2023-03-24T16:03:21Z) - RIOT: Recursive Inertial Odometry Transformer for Localisation from
Low-Cost IMU Measurements [5.770538064283154]
我々は,慣性データにおける空間的特徴と長距離依存性の両方を自己注意を利用して捉えた,不変な深部慣性音韻のポーズのための2つのエンドツーエンドフレームワークを提案する。
我々は、同じデータで同じ方法で訓練されたカスタム2層Gated Recurrent Unitに対するアプローチを評価し、複数の異なるユーザ、デバイス、アクティビティに対してそれぞれのアプローチをテストした。
論文 参考訳(メタデータ) (2023-03-03T00:20:01Z) - Robust Longitudinal Control for Vehicular Autonomous Platoons Using Deep
Reinforcement Learning [3.0552168294716298]
本稿では,各エージェントの加速度コマンドがネットワークトポロジーに依存しないように,車両小隊の訓練プロセスを一般化する手法を提案する。
本稿では,異なるネットワークトポロジ,不確実なパラメータ,外部力を用いた実験により提案手法の有効性について述べる。
論文 参考訳(メタデータ) (2022-05-31T20:38:12Z) - Improving robustness of jet tagging algorithms with adversarial training [56.79800815519762]
本研究では,フレーバータグ付けアルゴリズムの脆弱性について,敵攻撃による検証を行った。
シミュレーション攻撃の影響を緩和する対人訓練戦略を提案する。
論文 参考訳(メタデータ) (2022-03-25T19:57:19Z) - Spatial-Temporal Conv-sequence Learning with Accident Encoding for
Traffic Flow Prediction [17.94199362114272]
インテリジェント交通システムにおいて、交通予測の重要な問題は、周期的時間的依存関係と複雑な空間的相関を抽出する方法である。
本研究では、集中時間ブロックが一方向の畳み込みを用いて、短時間の時間的依存を効果的に捉えた時空間連続学習(STCL)を提案する。
本研究では,大規模実世界のタスクについて広範な実験を行い,提案手法の有効性を検証した。
論文 参考訳(メタデータ) (2021-05-21T17:43:07Z) - Attribute-Guided Adversarial Training for Robustness to Natural
Perturbations [64.35805267250682]
本稿では,属性空間への分類器の露出を最大化するために,新しいサンプルを生成することを学習する逆学習手法を提案する。
我々のアプローチは、ディープニューラルネットワークが自然に発生する摂動に対して堅牢であることを可能にする。
論文 参考訳(メタデータ) (2020-12-03T10:17:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。