論文の概要: Multi-Agent Deep Reinforcement Learning for Cooperative Connected
Vehicles
- arxiv url: http://arxiv.org/abs/2001.02337v1
- Date: Wed, 8 Jan 2020 02:01:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-13 12:55:59.450967
- Title: Multi-Agent Deep Reinforcement Learning for Cooperative Connected
Vehicles
- Title(参考訳): 協調連結車両のマルチエージェント深部強化学習
- Authors: Dohyun Kwon and Joongheon Kim
- Abstract要約: ミリ波基地局は、接続された車両に対して豊富な高容量チャネル資源を提供することができる。
本稿では,多エージェント深部強化学習(DRL)を用いた3層車両ネットワーク(HetVNet)の課題を解決する。
マルチエージェント・ディープ決定性ポリシー (MADDPG) アプローチを導入し, 連続動作領域における最適ポリシを実現する。
- 参考スコア(独自算出の注目度): 14.82060545763333
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Millimeter-wave (mmWave) base station can offer abundant high capacity
channel resources toward connected vehicles so that quality-of-service (QoS) of
them in terms of downlink throughput can be highly improved. The mmWave base
station can operate among existing base stations (e.g., macro-cell base
station) on non-overlapped channels among them and the vehicles can make
decision what base station to associate, and what channel to utilize on
heterogeneous networks. Furthermore, because of the non-omni property of mmWave
communication, the vehicles decide how to align the beam direction toward
mmWave base station to associate with it. However, such joint problem requires
high computational cost, which is NP-hard and has combinatorial features. In
this paper, we solve the problem in 3-tier heterogeneous vehicular network
(HetVNet) with multi-agent deep reinforcement learning (DRL) in a way that
maximizes expected total reward (i.e., downlink throughput) of vehicles. The
multi-agent deep deterministic policy gradient (MADDPG) approach is introduced
to achieve optimal policy in continuous action domain.
- Abstract(参考訳): ミリ波(mmWave)基地局は、接続車両に対して豊富な高容量チャネル資源を提供することができ、ダウンリンクスループットの点でQoSの品質を向上させることができる。
mmWave基地局は、既設の基地局(例えばマクロセル基地局)間で運用でき、車両はどの基地局を関連づけるか、どのチャンネルを異種ネットワークで利用するかを決定することができる。
さらに、mm波通信の非omni特性により、車両はmm波基地局へのビーム方向の調整方法を決定する。
しかし、このような結合問題は計算コストが高く、NPハードであり、組合せ的特徴を持つ。
本稿では,車両の総報酬(ダウンリンクスループット)を最大化するために,多エージェント深部強化学習(DRL)を用いた3層不均一車両ネットワーク(HetVNet)の課題を解決する。
マルチエージェント・ディープ決定性ポリシー勾配 (MADDPG) アプローチを導入し, 連続動作領域における最適ポリシーを実現する。
関連論文リスト
- Deep-Reinforcement-Learning-Based AoI-Aware Resource Allocation for RIS-Aided IoV Networks [43.443526528832145]
車両間通信(V2X)方式を考慮したRIS支援車両インターネット(IoV)を提案する。
車両間リンク(V2I)のタイムラインと車両間リンク(V2V)の安定性を改善するため,情報量(AoI)モデルとペイロード伝達確率モデルを導入する。
論文 参考訳(メタデータ) (2024-06-17T06:16:07Z) - Collaborative Ground-Space Communications via Evolutionary Multi-objective Deep Reinforcement Learning [113.48727062141764]
地中直接通信を実現するために,分散コラボレーティブビームフォーミング(DCB)に基づくアップリンク通信パラダイムを提案する。
DCBは、低軌道(LEO)衛星と効率的な直接接続を確立することができない端末を分散アンテナとして扱う。
本稿では,進化的多目的深層強化学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-04-11T03:13:02Z) - Multi-Agent Context Learning Strategy for Interference-Aware Beam
Allocation in mmWave Vehicular Communications [8.29063749138322]
我々は,Multi-Agent Context Learning (MACOL) と呼ばれる新しい戦略を開発し,ネットワーク内の車両に対してmWaveビームを割り当てながら干渉を管理する。
提案手法は,近隣のビーム状態の知識を活用することで,機械学習エージェントが他の送信に干渉する可能性のある送信を識別・回避できることを実証する。
論文 参考訳(メタデータ) (2024-01-04T15:43:55Z) - HawkRover: An Autonomous mmWave Vehicular Communication Testbed with
Multi-sensor Fusion and Deep Learning [26.133092114053472]
接続された自動走行車(CAV)は、私たちの日常生活を変えるための変革的な技術になっています。
現在、ミリ波(mmWave)バンドは有望なCAV接続ソリューションとして認識されている。
高いデータレートを提供できるが、その実現には、mWave信号の伝搬やモビリティ管理の際の高減衰など、多くの課題に直面している。
本研究は,mmWave信号と他のセンサデータを収集し,車載通信を容易にする自律的かつ低コストなテストベッドを提案する。
論文 参考訳(メタデータ) (2024-01-03T16:38:56Z) - Deep Reinforcement Learning for Interference Management in UAV-based 3D
Networks: Potentials and Challenges [137.47736805685457]
チャネル情報を知らなくても干渉を効果的に軽減できることを示す。
干渉を利用することにより、提案された解決策は民間UAVの継続的な成長を可能にする。
論文 参考訳(メタデータ) (2023-05-11T18:06:46Z) - AI-aided Traffic Control Scheme for M2M Communications in the Internet
of Vehicles [61.21359293642559]
交通のダイナミクスと異なるIoVアプリケーションの異種要求は、既存のほとんどの研究では考慮されていない。
本稿では,ハイブリッド交通制御方式とPPO法を併用して検討する。
論文 参考訳(メタデータ) (2022-03-05T10:54:05Z) - Deep Reinforcement Learning Based Multi-Access Edge Computing Schedule
for Internet of Vehicle [16.619839349229437]
車両用インターネット(IoV)の最大品質(QoE)を維持した無線ネットワークサービスを実現するためのUAV支援手法を提案する。
本稿では,M-AGCDRL(Multi-Agent Graph Convolutional Deep Reinforcement Learning)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-02-15T17:14:58Z) - Optimal Power Allocation for Rate Splitting Communications with Deep
Reinforcement Learning [61.91604046990993]
このレターでは、レート分割多重アクセスネットワークにおいて、ユーザの電力割り当てを最適化するための新しいフレームワークを紹介します。
ネットワークでは、ユーザのために意図されたメッセージは、単一の共通部分と個々のプライベート部分に分割される。
論文 参考訳(メタデータ) (2021-07-01T06:32:49Z) - Multi-Agent Reinforcement Learning for Channel Assignment and Power
Allocation in Platoon-Based C-V2X Systems [15.511438222357489]
我々は,C-V2Xシステムにおける結合チャネル割り当てと電力配分の問題点を考察する。
提案する分散リソース割当アルゴリズムは,よく知られた網羅的探索アルゴリズムと比較して,近い性能を提供する。
論文 参考訳(メタデータ) (2020-11-09T16:55:09Z) - Deep Learning Optimized Sparse Antenna Activation for Reconfigurable
Intelligent Surface Assisted Communication [54.72880662623178]
再構成可能なインテリジェントサーフェス(RIS)は通常、パッシブモードで動作する。
カスケードチャネル構造と信号処理能力の欠如により、RISが個々のチャネル状態情報を取得することは困難である。
本稿では、RISのアンテナの一部に信号処理ユニットを追加し、チャネルを部分的に取得する。
論文 参考訳(メタデータ) (2020-09-03T12:27:22Z) - Reinforcement Learning Based Vehicle-cell Association Algorithm for
Highly Mobile Millimeter Wave Communication [53.47785498477648]
本稿では,ミリ波通信網における車とセルの関連性について検討する。
まず、ユーザ状態(VU)問題を離散的な非車両関連最適化問題として定式化する。
提案手法は,複数のベースライン設計と比較して,ユーザの複雑性とVUEの20%削減の合計で最大15%のゲインが得られる。
論文 参考訳(メタデータ) (2020-01-22T08:51:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。