論文の概要: Multi-Agent Deep Reinforcement Learning for Safe Autonomous Driving with RICS-Assisted MEC
- arxiv url: http://arxiv.org/abs/2503.19418v1
- Date: Tue, 25 Mar 2025 07:53:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-26 16:54:33.531248
- Title: Multi-Agent Deep Reinforcement Learning for Safe Autonomous Driving with RICS-Assisted MEC
- Title(参考訳): RICS支援MECを用いた安全な自動運転のためのマルチエージェント深部強化学習
- Authors: Xueyao Zhang, Bo Yang, Xuelin Cao, Zhiwen Yu, George C. Alexandropoulos, Yan Zhang, Merouane Debbah, Chau Yuen,
- Abstract要約: 環境検知とオンボードセンサーによる融合は、将来の自律運転ネットワークに広く適用されることが想定されている。
スペクトル利用を改善するために、V2VリンクはV2Iリンクと同じ周波数スペクトルを再利用し、深刻な干渉を引き起こす可能性がある。
この問題に対処するために、再構成可能なインテリジェント・コンピューティング・サーフェス(RICS)を活用し、V2I反射型リンクを共同で有効化する。
- 参考スコア(独自算出の注目度): 36.36591743123764
- License:
- Abstract: Environment sensing and fusion via onboard sensors are envisioned to be widely applied in future autonomous driving networks. This paper considers a vehicular system with multiple self-driving vehicles that is assisted by multi-access edge computing (MEC), where image data collected by the sensors is offloaded from cellular vehicles to the MEC server using vehicle-to-infrastructure (V2I) links. Sensory data can also be shared among surrounding vehicles via vehicle-to-vehicle (V2V) communication links. To improve spectrum utilization, the V2V links may reuse the same frequency spectrum with V2I links, which may cause severe interference. To tackle this issue, we leverage reconfigurable intelligent computational surfaces (RICSs) to jointly enable V2I reflective links and mitigate interference appearing at the V2V links. Considering the limitations of traditional algorithms in addressing this problem, such as the assumption for quasi-static channel state information, which restricts their ability to adapt to dynamic environmental changes and leads to poor performance under frequently varying channel conditions, in this paper, we formulate the problem at hand as a Markov game. Our novel formulation is applied to time-varying channels subject to multi-user interference and introduces a collaborative learning mechanism among users. The considered optimization problem is solved via a driving safety-enabled multi-agent deep reinforcement learning (DS-MADRL) approach that capitalizes on the RICS presence. Our extensive numerical investigations showcase that the proposed reinforcement learning approach achieves faster convergence and significant enhancements in both data rate and driving safety, as compared to various state-of-the-art benchmarks.
- Abstract(参考訳): 環境検知とオンボードセンサーによる融合は、将来の自律運転ネットワークに広く適用されることが想定されている。
本稿では,マルチアクセスエッジコンピューティング(MEC)によって支援される複数の自動運転車を用いた車載システムについて考察し,センサが収集した画像データを車内構造(V2I)リンクを用いて,携帯電話車からMECサーバにオフロードする。
センサーデータは、車両間(V2V)通信リンクを介して、周囲の車両間で共有することもできる。
スペクトル利用を改善するために、V2VリンクはV2Iリンクと同じ周波数スペクトルを再利用し、深刻な干渉を引き起こす可能性がある。
この問題に対処するために、再構成可能なインテリジェント・コンピューティング・サーフェス(RICS)を活用して、V2I反射リンクとV2Vリンクに現れる干渉を緩和する。
この問題に対処する従来のアルゴリズムの限界を考えると、準静的チャネル状態情報の仮定は、動的環境変化への適応性を制限し、頻繁なチャネル条件下での性能の低下を招き、マルコフゲームとして手元で問題を定式化する。
本稿では,マルチユーザ干渉を受ける時間変化チャネルに適用し,ユーザ間の協調学習機構を導入する。
最適化問題は、RICSの存在を活かした運転安全対応多エージェント深部強化学習(DS-MADRL)アプローチによって解決される。
提案手法は,各種の最先端ベンチマークと比較して,データレートと運転安全性の両方において,より高速な収束と大幅な向上を実現していることを示す。
関連論文リスト
- Joint Adaptive OFDM and Reinforcement Learning Design for Autonomous Vehicles: Leveraging Age of Updates [2.607046313483251]
ミリ波を用いた周波数分割多重化(OFDM)は高分解能センシングと高速データ伝送に適した代替手段である。
本研究では,AVがキュー状態情報(QSI)とチャネル状態情報(CSI)を,通信とセンシングを管理するための強化学習技術とともに利用する自律走行車ネットワークについて考察する。
論文 参考訳(メタデータ) (2024-12-24T15:32:58Z) - Hybrid-Generative Diffusion Models for Attack-Oriented Twin Migration in Vehicular Metaverses [58.264499654343226]
Vehicle Twins (VTs) は、Vehicular Metaverse Users (VMUs) 向けに没入型仮想サービスを提供するデジタルツインである。
車両の高モビリティ、エッジサーバの不均一なデプロイ、潜在的なセキュリティ脅威は、効率的で信頼性の高いVTマイグレーションを実現する上での課題である。
車両メタバースにおけるセキュアで信頼性の高いVTマイグレーションフレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-05T11:11:33Z) - Deep-Reinforcement-Learning-Based AoI-Aware Resource Allocation for RIS-Aided IoV Networks [43.443526528832145]
車両間通信(V2X)方式を考慮したRIS支援車両インターネット(IoV)を提案する。
車両間リンク(V2I)のタイムラインと車両間リンク(V2V)の安定性を改善するため,情報量(AoI)モデルとペイロード伝達確率モデルを導入する。
論文 参考訳(メタデータ) (2024-06-17T06:16:07Z) - Enhancing Track Management Systems with Vehicle-To-Vehicle Enabled Sensor Fusion [0.0]
本稿では,新しいV2V対応トラック管理システムを提案する。
中心となるイノベーションは、V2V通信を通じて検証された融合検出からなる独立した優先度トラックリストの作成にある。
本システムでは,V2X信号のファルシフィケーションが,認識センサからの検知を用いて,初期車両識別プロセスを通じて発生することの意義を考察する。
論文 参考訳(メタデータ) (2024-04-26T20:54:44Z) - Deep Reinforcement Learning Algorithms for Hybrid V2X Communication: A
Benchmarking Study [39.214784277182304]
本稿では,Deep Reinforcement Learning (DRL)アルゴリズムを用いて,V2Xにおける垂直ハンドオーバ問題に対処する。
ベンチマークアルゴリズムは、V-VLCヘッドライトの冗長性と使用率の観点から、現在の最先端アプローチよりも優れている。
論文 参考訳(メタデータ) (2023-10-04T12:32:14Z) - Reinforcement Learning for Joint V2I Network Selection and Autonomous
Driving Policies [14.518558523319518]
自動運転車(AV)の信頼性向上に向けたV2I通信の重要性が高まっている
道路衝突を最小限に抑えるため,AVのネットワーク選択と運転ポリシーを同時に最適化することが重要である。
我々は,効率的なネットワーク選択と自律運転ポリシーを特徴付ける強化学習フレームワークを開発した。
論文 参考訳(メタデータ) (2022-08-03T04:33:02Z) - Learning energy-efficient driving behaviors by imitating experts [75.12960180185105]
本稿では,コミュニケーション・センシングにおける制御戦略と現実的限界のギャップを埋める上で,模倣学習が果たす役割について考察する。
擬似学習は、車両の5%に採用されれば、局地的な観測のみを用いて、交通条件の異なるネットワークのエネルギー効率を15%向上させる政策を導出できることを示す。
論文 参考訳(メタデータ) (2022-06-28T17:08:31Z) - Federated Deep Learning Meets Autonomous Vehicle Perception: Design and
Verification [168.67190934250868]
フェデレーテッド・ラーニング・パワード・コネクテッド・オートモービル(FLCAV)が提案されている。
FLCAVは通信とアノテーションのコストを削減しながらプライバシを保存する。
マルチステージトレーニングのためのネットワークリソースと道路センサのポーズを決定することは困難である。
論文 参考訳(メタデータ) (2022-06-03T23:55:45Z) - COOPERNAUT: End-to-End Driving with Cooperative Perception for Networked
Vehicles [54.61668577827041]
本稿では,車間認識を用いたエンドツーエンド学習モデルであるCOOPERNAUTを紹介する。
われわれのAutoCastSim実験は、我々の協調知覚駆動モデルが平均成功率を40%向上させることを示唆している。
論文 参考訳(メタデータ) (2022-05-04T17:55:12Z) - Transferable Deep Reinforcement Learning Framework for Autonomous
Vehicles with Joint Radar-Data Communications [69.24726496448713]
本稿では,AVの最適決定を支援するために,マルコフ決定プロセス(MDP)に基づくインテリジェントな最適化フレームワークを提案する。
そこで我々は,近年の深層強化学習技術を活用した効果的な学習アルゴリズムを開発し,AVの最適方針を見出す。
提案手法は,従来の深部強化学習手法と比較して,AVによる障害物ミス検出確率を最大67%削減することを示す。
論文 参考訳(メタデータ) (2021-05-28T08:45:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。