論文の概要: Reinforcement Learning for Joint V2I Network Selection and Autonomous
Driving Policies
- arxiv url: http://arxiv.org/abs/2208.02249v1
- Date: Wed, 3 Aug 2022 04:33:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-05 12:53:03.565925
- Title: Reinforcement Learning for Joint V2I Network Selection and Autonomous
Driving Policies
- Title(参考訳): v2iネットワーク選択と自律運転政策のための強化学習
- Authors: Zijiang Yan and Hina Tabassum
- Abstract要約: 自動運転車(AV)の信頼性向上に向けたV2I通信の重要性が高まっている
道路衝突を最小限に抑えるため,AVのネットワーク選択と運転ポリシーを同時に最適化することが重要である。
我々は,効率的なネットワーク選択と自律運転ポリシーを特徴付ける強化学習フレームワークを開発した。
- 参考スコア(独自算出の注目度): 14.518558523319518
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Vehicle-to-Infrastructure (V2I) communication is becoming critical for the
enhanced reliability of autonomous vehicles (AVs). However, the uncertainties
in the road-traffic and AVs' wireless connections can severely impair timely
decision-making. It is thus critical to simultaneously optimize the AVs'
network selection and driving policies in order to minimize road collisions
while maximizing the communication data rates. In this paper, we develop a
reinforcement learning (RL) framework to characterize efficient network
selection and autonomous driving policies in a multi-band vehicular network
(VNet) operating on conventional sub-6GHz spectrum and Terahertz (THz)
frequencies. The proposed framework is designed to (i) maximize the traffic
flow and minimize collisions by controlling the vehicle's motion dynamics
(i.e., speed and acceleration) from autonomous driving perspective, and (ii)
maximize the data rates and minimize handoffs by jointly controlling the
vehicle's motion dynamics and network selection from telecommunication
perspective. We cast this problem as a Markov Decision Process (MDP) and
develop a deep Q-learning based solution to optimize the actions such as
acceleration, deceleration, lane-changes, and AV-base station assignments for a
given AV's state. The AV's state is defined based on the velocities and
communication channel states of AVs. Numerical results demonstrate interesting
insights related to the inter-dependency of vehicle's motion dynamics,
handoffs, and the communication data rate. The proposed policies enable AVs to
adopt safe driving behaviors with improved connectivity.
- Abstract(参考訳): 自動運転車(AV)の信頼性を高めるために、V2I通信が重要になっている。
しかし、道路交通とAVの無線接続の不確実性は、時間的決定を著しく損なう可能性がある。
したがって、通信データレートを最大化しつつ道路衝突を最小限に抑えるために、avsのネットワーク選択と運転ポリシーを同時に最適化することが重要である。
本稿では,従来のサブ6GHz帯とテラヘルツ(THz)周波数で動作するマルチバンド車両ネットワーク(VNet)において,効率的なネットワーク選択と自律運転ポリシーを特徴付ける強化学習フレームワークを開発する。
提案するフレームワークは設計されている
(i)自律走行の観点から車両の運動力学(すなわち速度と加速)を制御し、交通の流れを最大化し衝突を最小限に抑えること。
(ii)テレコミュニケーションの観点から車両の動作ダイナミクスとネットワーク選択を共同で制御することにより、データレートを最大化し、ハンドオフを最小化する。
我々は,この問題をマルコフ決定プロセス(MDP)として実装し,与えられたAV状態に対する加速度,減速,車線変更,AVベースステーション割り当てなどの動作を最適化する深層Q-ラーニングベースのソリューションを開発した。
AVの状態は、AVの速度と通信チャネル状態に基づいて定義される。
数値実験の結果,車両の動特性,ハンドオフ,通信データ速度の相互依存性に関する興味深い知見が得られた。
提案されたポリシーにより、AVは接続性を改善した安全な運転行動を採用することができる。
関連論文リスト
- SPformer: A Transformer Based DRL Decision Making Method for Connected Automated Vehicles [9.840325772591024]
本稿ではトランスフォーマーと強化学習アルゴリズムに基づくCAV意思決定アーキテクチャを提案する。
学習可能なポリシートークンは、多車連携ポリシーの学習媒体として使用される。
我々のモデルは交通シナリオにおける車両の全ての状態情報をうまく活用することができる。
論文 参考訳(メタデータ) (2024-09-23T15:16:35Z) - Generalized Multi-Objective Reinforcement Learning with Envelope Updates in URLLC-enabled Vehicular Networks [12.323383132739195]
我々は,無線ネットワークの選択と自律運転ポリシーを協調的に最適化する,新しい多目的強化学習フレームワークを開発した。
提案フレームワークは,車両の運動力学を制御することにより,交通流の最大化と衝突の最小化を目的としている。
提案されたポリシーにより、自動運転車は、接続性を改善した安全な運転行動を採用することができる。
論文 参考訳(メタデータ) (2024-05-18T16:31:32Z) - Convergence of Communications, Control, and Machine Learning for Secure
and Autonomous Vehicle Navigation [78.60496411542549]
接続された自動運転車(CAV)は、交通事故におけるヒューマンエラーを低減し、道路効率を向上し、様々なタスクを実行する。これらのメリットを享受するためには、CAVが目標とする目的地へ自律的にナビゲートする必要がある。
本稿では,通信理論,制御理論,機械学習の収束を利用して,効果的なCAVナビゲーションを実現する手法を提案する。
論文 参考訳(メタデータ) (2023-07-05T21:38:36Z) - Reinforcement Learning based Cyberattack Model for Adaptive Traffic
Signal Controller in Connected Transportation Systems [61.39400591328625]
接続輸送システムにおいて、適応交通信号制御装置(ATSC)は、車両から受信したリアルタイム車両軌跡データを利用して、グリーンタイムを規制する。
この無線接続されたATSCはサイバー攻撃面を増やし、その脆弱性を様々なサイバー攻撃モードに拡大する。
そのようなモードの1つは、攻撃者がネットワーク内で偽の車両を作成する「シビル」攻撃である。
RLエージェントは、シビル車噴射の最適速度を学習し、アプローチの混雑を生じさせるように訓練される
論文 参考訳(メタデータ) (2022-10-31T20:12:17Z) - COOPERNAUT: End-to-End Driving with Cooperative Perception for Networked
Vehicles [54.61668577827041]
本稿では,車間認識を用いたエンドツーエンド学習モデルであるCOOPERNAUTを紹介する。
われわれのAutoCastSim実験は、我々の協調知覚駆動モデルが平均成功率を40%向上させることを示唆している。
論文 参考訳(メタデータ) (2022-05-04T17:55:12Z) - AI-aided Traffic Control Scheme for M2M Communications in the Internet
of Vehicles [61.21359293642559]
交通のダイナミクスと異なるIoVアプリケーションの異種要求は、既存のほとんどの研究では考慮されていない。
本稿では,ハイブリッド交通制御方式とPPO法を併用して検討する。
論文 参考訳(メタデータ) (2022-03-05T10:54:05Z) - Learning to Help Emergency Vehicles Arrive Faster: A Cooperative
Vehicle-Road Scheduling Approach [24.505687255063986]
車両中心のスケジューリングアプローチは、緊急車両の最適経路を推奨する。
道路中心のスケジューリングアプローチは、交通状況を改善し、EVが交差点を通過するための優先度を高めることを目的としている。
本稿では,リアルタイム経路計画モジュールと協調交通信号制御モジュールを含む協調型VehIcle-roaDスケジューリング手法であるLEVIDを提案する。
論文 参考訳(メタデータ) (2022-02-20T10:25:15Z) - Learning Interaction-aware Guidance Policies for Motion Planning in
Dense Traffic Scenarios [8.484564880157148]
本稿では,高密度交通シナリオにおける対話型モーションプランニングのための新しい枠組みを提案する。
我々は,他車両の協調性に関する国際的ガイダンスを提供するインタラクション対応政策であるDeep Reinforcement Learning (RL) を通じて学習することを提案する。
学習されたポリシーは、ローカル最適化ベースのプランナーを推論し、対話的な振る舞いで誘導し、他の車両が収まらない場合に安全を維持しながら、密集したトラフィックに積極的にマージする。
論文 参考訳(メタデータ) (2021-07-09T16:43:12Z) - Transferable Deep Reinforcement Learning Framework for Autonomous
Vehicles with Joint Radar-Data Communications [69.24726496448713]
本稿では,AVの最適決定を支援するために,マルコフ決定プロセス(MDP)に基づくインテリジェントな最適化フレームワークを提案する。
そこで我々は,近年の深層強化学習技術を活用した効果的な学習アルゴリズムを開発し,AVの最適方針を見出す。
提案手法は,従来の深部強化学習手法と比較して,AVによる障害物ミス検出確率を最大67%削減することを示す。
論文 参考訳(メタデータ) (2021-05-28T08:45:37Z) - Federated Learning on the Road: Autonomous Controller Design for
Connected and Autonomous Vehicles [109.71532364079711]
CAV(コネクテッド・アンド・自律車両)の自律制御設計のための新しい統合学習(FL)フレームワークの提案
CAVの移動性、無線フェーディングチャネル、および不均衡で非独立で同一に分散されたデータを考慮に入れた新しい動的フェデレーション・プロキシ(DFP)アルゴリズムが提案されている。
最適制御器を用いてCAVがどの程度の速度で収束するかを同定するために,提案アルゴリズムに対して厳密な収束解析を行う。
論文 参考訳(メタデータ) (2021-02-05T19:57:47Z) - Leveraging the Capabilities of Connected and Autonomous Vehicles and
Multi-Agent Reinforcement Learning to Mitigate Highway Bottleneck Congestion [2.0010674945048468]
RLをベースとしたマルチエージェントCAV制御モデルを提案する。
その結果、CAVのシェアが10%以下である場合でも、CAVはハイウェイ交通のボトルネックを著しく軽減することができることが示唆された。
論文 参考訳(メタデータ) (2020-10-12T03:52:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。