論文の概要: EnsembleFollower: A Hybrid Car-Following Framework Based On
Reinforcement Learning and Hierarchical Planning
- arxiv url: http://arxiv.org/abs/2308.16008v1
- Date: Wed, 30 Aug 2023 12:55:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-31 13:25:41.602862
- Title: EnsembleFollower: A Hybrid Car-Following Framework Based On
Reinforcement Learning and Hierarchical Planning
- Title(参考訳): EnsembleFollower: 強化学習と階層的計画に基づくハイブリッドカーフォローフレームワーク
- Authors: Xu Han, Xianda Chen, Meixin Zhu, Pinlong Cai, Jianshan Zhou, Xiaowen
Chu
- Abstract要約: 先進的な人間的な車追従を実現するための階層的計画枠組みを提案する。
EnsembleFollowerフレームワークには、複数の低レベルの自動車追従モデルを司法的に管理する、高レベルの強化学習ベースのエージェントが含まれている。
提案手法は,HighDデータセットから実世界の運転データに基づいて評価する。
- 参考スコア(独自算出の注目度): 22.63087292154406
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Car-following models have made significant contributions to our understanding
of longitudinal driving behavior. However, they often exhibit limited accuracy
and flexibility, as they cannot fully capture the complexity inherent in
car-following processes, or may falter in unseen scenarios due to their
reliance on confined driving skills present in training data. It is worth
noting that each car-following model possesses its own strengths and weaknesses
depending on specific driving scenarios. Therefore, we propose
EnsembleFollower, a hierarchical planning framework for achieving advanced
human-like car-following. The EnsembleFollower framework involves a high-level
Reinforcement Learning-based agent responsible for judiciously managing
multiple low-level car-following models according to the current state, either
by selecting an appropriate low-level model to perform an action or by
allocating different weights across all low-level components. Moreover, we
propose a jerk-constrained kinematic model for more convincing car-following
simulations. We evaluate the proposed method based on real-world driving data
from the HighD dataset. The experimental results illustrate that
EnsembleFollower yields improved accuracy of human-like behavior and achieves
effectiveness in combining hybrid models, demonstrating that our proposed
framework can handle diverse car-following conditions by leveraging the
strengths of various low-level models.
- Abstract(参考訳): 自動車追従モデルが縦方向運転行動の理解に大きく貢献している。
しかし、車追従プロセスに固有の複雑さを完全に捉えられないため、あるいはトレーニングデータに存在する制限された運転スキルに依存するため、目に見えないシナリオに陥る可能性があるため、正確さと柔軟性は限られていることが多い。
それぞれの車追従モデルは、特定の運転シナリオに応じて独自の強みと弱みを持っている点に注意が必要だ。
そこで我々は,先進的な人間的な車追従を実現するための階層的計画枠組みであるEnsembleFollowerを提案する。
アンサンブルフォローアフレームワークは、アクションを実行するために適切な低レベルモデルを選択するか、またはすべての低レベルコンポーネントに異なる重みを割り当てることによって、現在の状態に応じて複数の低レベルカーフォローアモデルを公平に管理する、高レベル強化学習ベースのエージェントを含む。
さらに,より説得力のある車追従シミュレーションのためのjerk-constrained kinematic modelを提案する。
提案手法は,HighDデータセットから実世界の運転データに基づいて評価する。
実験の結果,アンサンブル従者により,人間のような行動の精度が向上し,ハイブリッドモデルを組み合わせた場合の有効性が得られた。
関連論文リスト
- RACER: Rational Artificial Intelligence Car-following-model Enhanced by
Reality [51.244807332133696]
本稿では,アダプティブ・クルーズ・コントロール(ACC)運転行動を予測する,最先端の深層学習車追従モデルであるRACERを紹介する。
従来のモデルとは異なり、RACERは実走行の重要な要素であるRDC(Rational Driving Constraints)を効果的に統合している。
RACERはアクセラレーション、ベロシティ、スペーシングといった主要なメトリクスを網羅し、ゼロ違反を登録する。
論文 参考訳(メタデータ) (2023-12-12T06:21:30Z) - Beyond One Model Fits All: Ensemble Deep Learning for Autonomous
Vehicles [16.398646583844286]
本研究では,Mediated Perception, Behavior Reflex, Direct Perceptionの3つの異なるニューラルネットワークモデルを紹介する。
我々のアーキテクチャは、グローバルなルーティングコマンドを使用して、ベース、将来の潜伏ベクトル予測、補助タスクネットワークからの情報を融合し、適切なアクションサブネットワークを選択する。
論文 参考訳(メタデータ) (2023-12-10T04:40:02Z) - Trajeglish: Learning the Language of Driving Scenarios [75.61820235290608]
自動運転開発における長年の課題は、記録された運転ログからシードされた動的運転シナリオをシミュレートすることだ。
車両、歩行者、サイクリストが運転シナリオでどのように相互作用するかをモデル化するために、離散シーケンスモデリングのツールを適用します。
我々のモデルはSim Agents Benchmarkを上回り、リアリズムメタメトリックの先行作業の3.3%、インタラクションメトリックの9.9%を上回ります。
論文 参考訳(メタデータ) (2023-12-07T18:53:27Z) - TrafficBots: Towards World Models for Autonomous Driving Simulation and
Motion Prediction [149.5716746789134]
我々は,データ駆動型交通シミュレーションを世界モデルとして定式化できることを示した。
動作予測とエンドツーエンドの運転に基づくマルチエージェントポリシーであるTrafficBotsを紹介する。
オープンモーションデータセットの実験は、TrafficBotsが現実的なマルチエージェント動作をシミュレートできることを示している。
論文 参考訳(メタデータ) (2023-03-07T18:28:41Z) - When Demonstrations Meet Generative World Models: A Maximum Likelihood
Framework for Offline Inverse Reinforcement Learning [62.00672284480755]
本稿では, 専門家エージェントから, 一定の有限個の実演において観測された動作を過小評価する報酬と環境力学の構造を復元することを目的とする。
タスクを実行するための正確な専門知識モデルは、臨床的意思決定や自律運転のような安全に敏感な応用に応用できる。
論文 参考訳(メタデータ) (2023-02-15T04:14:20Z) - A Hierarchical Pedestrian Behavior Model to Generate Realistic Human
Behavior in Traffic Simulation [11.525073205608681]
本稿では,行動木を用いた階層的歩行者行動モデルを提案する。
私たちの作業の完全な実装は、シナリオ定義と実行エンジンであるGeoScenario Serverに統合されます。
提案モデルでは,実際の歩行者の軌跡を高精度に再現し,意思決定精度を98%以上とした。
論文 参考訳(メタデータ) (2022-06-01T02:04:38Z) - Evaluating model-based planning and planner amortization for continuous
control [79.49319308600228]
我々は、モデル予測制御(MPC)と学習モデルとモデルフリーポリシー学習を組み合わせたハイブリッドアプローチを採っている。
モデルフリーエージェントは高いDoF制御問題においても強いベースラインであることがわかった。
モデルに基づくプランナを,パフォーマンスを損なうことなく,計画が損なわれるようなポリシーに置き換えることが可能であることを示す。
論文 参考訳(メタデータ) (2021-10-07T12:00:40Z) - Formulation and validation of a car-following model based on deep
reinforcement learning [0.0]
深部強化学習に基づく新車追従モデルの提案と検証を行う。
当社のモデルは, 自由・自動車追従体制において, 外部に与えられた報酬関数を最大化するように訓練されている。
これらの報酬関数のパラメータは、Intelligent Driver Modelのような従来のモデルに類似している。
論文 参考訳(メタデータ) (2021-09-29T08:27:12Z) - Model-based versus Model-free Deep Reinforcement Learning for Autonomous
Racing Cars [46.64253693115981]
本稿では,モデルに基づく深層強化学習エージェントが現実世界の自律車両制御タスクに一般化する方法について検討する。
本稿では,想像力で学習可能なモデルベースエージェント,パフォーマンス,サンプル効率,タスク完了,一般化に関して,モデルフリーエージェントを実質的に上回っていることを示す。
論文 参考訳(メタデータ) (2021-03-08T17:15:23Z) - Goal-Aware Prediction: Learning to Model What Matters [105.43098326577434]
学習した前進力学モデルを使用する際の根本的な課題の1つは、学習したモデルの目的と下流のプランナーやポリシーの目標とのミスマッチである。
本稿では,タスク関連情報への直接的予測を提案し,そのモデルが現在のタスクを認識し,状態空間の関連量のみをモデル化することを奨励する。
提案手法は,目標条件付きシーンの関連部分を効果的にモデル化し,その結果,標準タスク非依存のダイナミックスモデルやモデルレス強化学習より優れていることがわかった。
論文 参考訳(メタデータ) (2020-07-14T16:42:59Z) - Driver Modeling through Deep Reinforcement Learning and Behavioral Game
Theory [0.0]
自動運転車がドライバーと同一の安全レベルに達するためには、数百万マイルの走行テストが必要であると推定されている。
本稿では、複数の人的意思決定者からなる高忠実度交通シミュレータにおいて、安全かつ迅速な自動運転アルゴリズムの評価を可能にすることにより、テストに費やした時間と労力を削減するために利用することができる。
論文 参考訳(メタデータ) (2020-03-24T18:59:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。