論文の概要: RACE-SM: Reinforcement Learning Based Autonomous Control for Social
On-Ramp Merging
- arxiv url: http://arxiv.org/abs/2403.03359v1
- Date: Tue, 5 Mar 2024 23:03:56 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-07 16:45:13.486076
- Title: RACE-SM: Reinforcement Learning Based Autonomous Control for Social
On-Ramp Merging
- Title(参考訳): RACE-SM:ソーシャルオンランプマージのための強化学習に基づく自律制御
- Authors: Jordan Poots
- Abstract要約: 既存の非学習ベースの車両制御ソリューションは主にルールと最適化に依存している。
近年のDeep Reinforcement Learningの進歩は、将来性を示し、学術的な関心を集めている。
エゴ車とその周辺車両の実用性を明確に考慮した,アクセラレーションと車線変更決定のための新しい学習ベースモデル。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous parallel-style on-ramp merging in human controlled traffic
continues to be an existing issue for autonomous vehicle control. Existing
non-learning based solutions for vehicle control rely on rules and optimization
primarily. These methods have been seen to present significant challenges.
Recent advancements in Deep Reinforcement Learning have shown promise and have
received significant academic interest however the available learning based
approaches show inadequate attention to other highway vehicles and often rely
on inaccurate road traffic assumptions. In addition, the parallel-style case is
rarely considered. A novel learning based model for acceleration and lane
change decision making that explicitly considers the utility to both the ego
vehicle and its surrounding vehicles which may be cooperative or uncooperative
to produce behaviour that is socially acceptable is proposed. The novel reward
function makes use of Social Value Orientation to weight the vehicle's level of
social cooperation and is divided into ego vehicle and surrounding vehicle
utility which are weighted according to the model's designated Social Value
Orientation. A two-lane highway with an on-ramp divided into a taper-style and
parallel-style section is considered. Simulation results indicated the
importance of considering surrounding vehicles in reward function design and
show that the proposed model matches or surpasses those in literature in terms
of collisions while also introducing socially courteous behaviour avoiding near
misses and anti-social behaviour through direct consideration of the effect of
merging on surrounding vehicles.
- Abstract(参考訳): 人力による交通制御における自律並列方式のオンランプ・マージは、自動運転車の制御における既存の問題であり続けている。
既存の非学習ベースの車両制御ソリューションは主にルールと最適化に依存している。
これらの手法は重要な課題を呈している。
近年のDeep Reinforcement Learningの進歩は将来性を示し、学術的な関心を集めているが、利用可能な学習ベースのアプローチは他の高速道路車両に不適切な注意を払っており、しばしば不正確な道路交通の前提に依存している。
また、並列型の場合はほとんど考慮されない。
社会に受け入れられる行動を生み出すために,エゴ車とその周辺車両に協調的あるいは協力的でないものの両方の有用性を明確に考慮した,アクセラレーションとレーン変更決定のための新しい学習モデルを提案する。
新たな報酬関数は、車両の社会的協力のレベルを重み付けするために社会価値オリエンテーションを利用し、モデルが指定した社会価値オリエンテーションに応じて重み付けされるエゴ車と周辺車両ユーティリティに分割される。
オンランプの2車線道路は、テーパースタイルとパラレルスタイルに分けられている。
シミュレーションの結果, 報酬関数設計における周辺車両の考察の重要性が示され, 提案モデルが衝突の観点で文献上のものと一致し, また周辺車両へのマージ効果を直接考慮して, 近距離ミスや反社会的行動を避ける社会的礼儀正しい行動が導入された。
関連論文リスト
- Interaction-Aware Decision-Making for Autonomous Vehicles in Forced
Merging Scenario Leveraging Social Psychology Factors [7.812717451846781]
インタラクションドライバの社会的行動と個人的目的の両方を取り入れた行動モデルを考える。
我々は、他のドライバーの意図をオンラインで見積もる、後退する水平制御に基づく意思決定戦略を開発する。
論文 参考訳(メタデータ) (2023-09-25T19:49:14Z) - Robust Driving Policy Learning with Guided Meta Reinforcement Learning [49.860391298275616]
本稿では,ソーシャルカーの多種多様な運転方針を一つのメタ政治として訓練する効率的な方法を提案する。
ソーシャルカーのインタラクションに基づく報酬関数をランダム化することにより、多様な目的を生み出し、メタ政治を効率的に訓練することができる。
本研究では,社会自動車が学習メタ政治によって制御される環境を利用して,エゴ自動車の運転方針の堅牢性を高めるためのトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2023-07-19T17:42:36Z) - Studying the Impact of Semi-Cooperative Drivers on Overall Highway Flow [76.38515853201116]
半協調行動は、人間ドライバーの本質的な性質であり、自律運転には考慮すべきである。
新たな自律型プランナーは、社会的に準拠した軌道を生成するために、人間のドライバーの社会的価値指向(SVO)を考慮することができる。
エージェントが反復的最適応答のゲーム理論バージョンをデプロイする暗黙的な半協調運転について検討する。
論文 参考訳(メタデータ) (2023-04-23T16:01:36Z) - Decision Making for Autonomous Driving in Interactive Merge Scenarios
via Learning-based Prediction [39.48631437946568]
本稿では,他のドライバの動作から不確実性が生ずる移動トラフィックにマージする複雑なタスクに焦点を当てる。
我々はこの問題を部分的に観測可能なマルコフ決定プロセス(POMDP)とみなし、モンテカルロ木探索でオンラインに解決する。
POMDPの解決策は、接近する車に道を譲る、前方の車から安全な距離を維持する、あるいは交通に合流するといった、高いレベルの運転操作を行う政策である。
論文 参考訳(メタデータ) (2023-03-29T16:12:45Z) - Model-Based Reinforcement Learning with Isolated Imaginations [61.67183143982074]
モデルに基づく強化学習手法であるIso-Dream++を提案する。
我々は、切り離された潜在的想像力に基づいて政策最適化を行う。
これにより、野生の混合力学源を孤立させることで、長い水平振動子制御タスクの恩恵を受けることができる。
論文 参考訳(メタデータ) (2023-03-27T02:55:56Z) - RLPG: Reinforcement Learning Approach for Dynamic Intra-Platoon Gap
Adaptation for Highway On-Ramp Merging [14.540226579203207]
小隊は、非常に近い距離で一緒に移動する車両のグループを指す。
近年の研究では、高規格道路と高架道路の合流時の交通流に対する極小小小高架区間の影響が明らかにされている。
本稿では,各小隊員の小隊内ギャップを適応的に調整し,交通流を最大化する新しい補強学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-07T07:33:54Z) - Eco-driving for Electric Connected Vehicles at Signalized Intersections:
A Parameterized Reinforcement Learning approach [6.475252042082737]
本稿では、強化学習(RL)に基づく電気連系車両(CV)のエコ駆動フレームワークを提案する。
我々の戦略は、他の人間駆動車(HDV)を中断することなく適切な行動スキームを学習することで、エネルギー消費を大幅に削減できることを示す。
論文 参考訳(メタデータ) (2022-06-24T04:11:28Z) - Learning Interaction-aware Guidance Policies for Motion Planning in
Dense Traffic Scenarios [8.484564880157148]
本稿では,高密度交通シナリオにおける対話型モーションプランニングのための新しい枠組みを提案する。
我々は,他車両の協調性に関する国際的ガイダンスを提供するインタラクション対応政策であるDeep Reinforcement Learning (RL) を通じて学習することを提案する。
学習されたポリシーは、ローカル最適化ベースのプランナーを推論し、対話的な振る舞いで誘導し、他の車両が収まらない場合に安全を維持しながら、密集したトラフィックに積極的にマージする。
論文 参考訳(メタデータ) (2021-07-09T16:43:12Z) - Deep Structured Reactive Planning [94.92994828905984]
自動運転のための新しいデータ駆動型リアクティブ計画目標を提案する。
本モデルは,非常に複雑な操作を成功させる上で,非反応性変種よりも優れることを示す。
論文 参考訳(メタデータ) (2021-01-18T01:43:36Z) - What-If Motion Prediction for Autonomous Driving [58.338520347197765]
生存可能なソリューションは、道路レーンのような静的な幾何学的文脈と、複数のアクターから生じる動的な社会的相互作用の両方を考慮しなければならない。
本稿では,解釈可能な幾何学的(アクター・レーン)と社会的(アクター・アクター)の関係を持つグラフに基づく注意的アプローチを提案する。
提案モデルでは,道路レーンやマルチアクターの相互作用を仮定的に,あるいは「何」かで予測できる。
論文 参考訳(メタデータ) (2020-08-24T17:49:30Z) - Intelligent Roundabout Insertion using Deep Reinforcement Learning [68.8204255655161]
本稿では,多忙なラウンドアバウンドの入場を交渉できる演習計画モジュールを提案する。
提案されたモジュールは、トレーニングされたニューラルネットワークに基づいて、操作の全期間にわたって、ラウンドアバウンドに入るタイミングと方法を予測する。
論文 参考訳(メタデータ) (2020-01-03T11:16:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。