論文の概要: A Conflicts-free, Speed-lossless KAN-based Reinforcement Learning Decision System for Interactive Driving in Roundabouts
- arxiv url: http://arxiv.org/abs/2408.08242v1
- Date: Thu, 15 Aug 2024 16:10:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-08-16 13:26:45.279383
- Title: A Conflicts-free, Speed-lossless KAN-based Reinforcement Learning Decision System for Interactive Driving in Roundabouts
- Title(参考訳): 衝突のない高速ロバストなKANを用いたラウンドアウェイにおける対話運転のための強化学習システム
- Authors: Zhihao Lin, Zhen Tian, Qi Zhang, Ziyang Ye, Hanyang Zhuang, Jianglin Lan,
- Abstract要約: 本稿では,ラウンドアバウンドにおける安全かつ効率的な運転行動を促進するための学習アルゴリズムを提案する。
提案アルゴリズムは、複雑なマルチサイクルラウンドアバウトにおける安全かつ効率的な運転戦略を学習するために、深層Q-ラーニングネットワークを用いる。
その結果,本システムは安定したトレーニングプロセスを維持しつつ,安全かつ効率的な運転を実現することができた。
- 参考スコア(独自算出の注目度): 17.434924472015812
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Safety and efficiency are crucial for autonomous driving in roundabouts, especially in the context of mixed traffic where autonomous vehicles (AVs) and human-driven vehicles coexist. This paper introduces a learning-based algorithm tailored to foster safe and efficient driving behaviors across varying levels of traffic flows in roundabouts. The proposed algorithm employs a deep Q-learning network to effectively learn safe and efficient driving strategies in complex multi-vehicle roundabouts. Additionally, a KAN (Kolmogorov-Arnold network) enhances the AVs' ability to learn their surroundings robustly and precisely. An action inspector is integrated to replace dangerous actions to avoid collisions when the AV interacts with the environment, and a route planner is proposed to enhance the driving efficiency and safety of the AVs. Moreover, a model predictive control is adopted to ensure stability and precision of the driving actions. The results show that our proposed system consistently achieves safe and efficient driving whilst maintaining a stable training process, as evidenced by the smooth convergence of the reward function and the low variance in the training curves across various traffic flows. Compared to state-of-the-art benchmarks, the proposed algorithm achieves a lower number of collisions and reduced travel time to destination.
- Abstract(参考訳): 安全と効率性は、特に自律走行車(AV)と人間駆動車両が共存する混成交通の文脈において、ラウンドアバウンドでの自動運転にとって不可欠である。
本稿では,ラウンドアバウンドにおける各種交通流の安全かつ効率的な運転行動の促進を目的とした学習に基づくアルゴリズムを提案する。
提案アルゴリズムは、複雑なマルチサイクルラウンドアバウトにおける安全かつ効率的な運転戦略を効果的に学習するために、深層Q-ラーニングネットワークを用いる。
さらに、Kan(Kolmogorov-Arnoldネットワーク)は、AVの周囲を堅牢かつ正確に学習する能力を高める。
AVが環境と相互作用する際の衝突を避けるために、危険な行動を置き換えるためにアクションインスペクタが統合され、AVの運転効率と安全性を高めるためにルートプランナーが提案される。
さらに、運転動作の安定性と精度を確保するため、モデル予測制御を採用する。
提案システムは,報奨関数のスムーズな収束と各種交通流間のトレーニング曲線の低分散によって証明されるように,安定したトレーニングプロセスを維持しつつ,安全かつ効率的な運転を実現する。
最先端のベンチマークと比較すると,提案アルゴリズムは衝突回数を少なくし,目的地への移動時間を短縮する。
関連論文リスト
- Exploring the impact of traffic signal control and connected and automated vehicles on intersections safety: A deep reinforcement learning approach [2.681732331705502]
この研究は、DQN(Deep Q Network)を用いて、CAVとHuman Drive Vehicles(HDV)の交通信号と運転行動を制御する。
これらの結果から,CAVとDQNを併用した交通信号制御による後方・横断競合の大幅な低減が示された。
論文 参考訳(メタデータ) (2024-05-29T16:17:19Z) - RACER: Epistemic Risk-Sensitive RL Enables Fast Driving with Fewer Crashes [57.319845580050924]
本稿では,リスク感応制御と適応行動空間のカリキュラムを組み合わせた強化学習フレームワークを提案する。
提案アルゴリズムは,現実世界のオフロード運転タスクに対して,高速なポリシーを学習可能であることを示す。
論文 参考訳(メタデータ) (2024-05-07T23:32:36Z) - CAT: Closed-loop Adversarial Training for Safe End-to-End Driving [54.60865656161679]
Adversarial Training (CAT) は、自動運転車における安全なエンドツーエンド運転のためのフレームワークである。
Catは、安全クリティカルなシナリオでエージェントを訓練することで、運転エージェントの安全性を継続的に改善することを目的としている。
猫は、訓練中のエージェントに対抗する敵シナリオを効果的に生成できる。
論文 参考訳(メタデータ) (2023-10-19T02:49:31Z) - Convergence of Communications, Control, and Machine Learning for Secure
and Autonomous Vehicle Navigation [78.60496411542549]
接続された自動運転車(CAV)は、交通事故におけるヒューマンエラーを低減し、道路効率を向上し、様々なタスクを実行する。これらのメリットを享受するためには、CAVが目標とする目的地へ自律的にナビゲートする必要がある。
本稿では,通信理論,制御理論,機械学習の収束を利用して,効果的なCAVナビゲーションを実現する手法を提案する。
論文 参考訳(メタデータ) (2023-07-05T21:38:36Z) - DenseLight: Efficient Control for Large-scale Traffic Signals with Dense
Feedback [109.84667902348498]
交通信号制御(TSC)は、道路網における車両の平均走行時間を短縮することを目的としている。
従来のTSC手法は、深い強化学習を利用して制御ポリシーを探索する。
DenseLightは、不偏報酬関数を用いてポリシーの有効性をフィードバックする新しいRTLベースのTSC手法である。
論文 参考訳(メタデータ) (2023-06-13T05:58:57Z) - SafeLight: A Reinforcement Learning Method toward Collision-free Traffic
Signal Control [5.862792724739738]
アメリカの道路事故の4分の1は、信号のタイミングの問題により交差点で発生している。
安全強化強化学習法(SafeLight)を提案する。
本手法は交通の移動性を高めながら衝突を著しく低減することができる。
論文 参考訳(メタデータ) (2022-11-20T05:09:12Z) - A Cooperation-Aware Lane Change Method for Autonomous Vehicles [16.937363492078426]
本稿では,車両間の相互作用を利用した協調型車線変更手法を提案する。
まず,AVと他者間の協調の可能性を探るため,対話的な軌道予測手法を提案する。
次に,モデル予測制御(MPC)に基づく動作計画アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-01-26T04:45:45Z) - Learning Interaction-aware Guidance Policies for Motion Planning in
Dense Traffic Scenarios [8.484564880157148]
本稿では,高密度交通シナリオにおける対話型モーションプランニングのための新しい枠組みを提案する。
我々は,他車両の協調性に関する国際的ガイダンスを提供するインタラクション対応政策であるDeep Reinforcement Learning (RL) を通じて学習することを提案する。
学習されたポリシーは、ローカル最適化ベースのプランナーを推論し、対話的な振る舞いで誘導し、他の車両が収まらない場合に安全を維持しながら、密集したトラフィックに積極的にマージする。
論文 参考訳(メタデータ) (2021-07-09T16:43:12Z) - Transferable Deep Reinforcement Learning Framework for Autonomous
Vehicles with Joint Radar-Data Communications [69.24726496448713]
本稿では,AVの最適決定を支援するために,マルコフ決定プロセス(MDP)に基づくインテリジェントな最適化フレームワークを提案する。
そこで我々は,近年の深層強化学習技術を活用した効果的な学習アルゴリズムを開発し,AVの最適方針を見出す。
提案手法は,従来の深部強化学習手法と比較して,AVによる障害物ミス検出確率を最大67%削減することを示す。
論文 参考訳(メタデータ) (2021-05-28T08:45:37Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - SAINT-ACC: Safety-Aware Intelligent Adaptive Cruise Control for
Autonomous Vehicles Using Deep Reinforcement Learning [17.412117389855226]
SAINT-ACC:Setyaf-Aware Intelligent ACC system (SAINT-ACC) は、交通効率、運転安全性、運転快適性の同時最適化を実現するために設計された。
交通効率と運転安全・快適性の最適バランスを求めるために,新しい二重RLエージェントベースアプローチを開発した。
論文 参考訳(メタデータ) (2021-03-06T14:01:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。