論文の概要: Multi-Agent Deep Reinforcement Learning in Vehicular OCC
- arxiv url: http://arxiv.org/abs/2205.02672v1
- Date: Thu, 5 May 2022 14:25:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-06 15:58:22.920904
- Title: Multi-Agent Deep Reinforcement Learning in Vehicular OCC
- Title(参考訳): OCCにおけるマルチエージェント深部強化学習
- Authors: Amirul Islam, Leila Musavian and Nikolaos Thomos
- Abstract要約: 我々は車載OCCにおけるスペクトル効率最適化手法を提案する。
我々は最適化問題をマルコフ決定プロセス(MDP)としてモデル化し、オンラインで適用可能なソリューションの利用を可能にする。
提案手法の性能を広範囲なシミュレーションにより検証し,提案手法の様々な変種とランダムな手法との比較を行った。
- 参考スコア(独自算出の注目度): 14.685237010856953
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Optical camera communications (OCC) has emerged as a key enabling technology
for the seamless operation of future autonomous vehicles. In this paper, we
introduce a spectral efficiency optimization approach in vehicular OCC.
Specifically, we aim at optimally adapting the modulation order and the
relative speed while respecting bit error rate and latency constraints. As the
optimization problem is NP-hard problem, we model the optimization problem as a
Markov decision process (MDP) to enable the use of solutions that can be
applied online. We then relaxed the constrained problem by employing Lagrange
relaxation approach before solving it by multi-agent deep reinforcement
learning (DRL). We verify the performance of our proposed scheme through
extensive simulations and compare it with various variants of our approach and
a random method. The evaluation shows that our system achieves significantly
higher sum spectral efficiency compared to schemes under comparison.
- Abstract(参考訳): 光カメラ通信(OCC)は、将来の自動運転車のシームレスな運用を可能にする重要な技術として登場した。
本稿では,車載OCCにおけるスペクトル効率最適化手法を提案する。
具体的には,ビット誤り率と遅延制約を考慮しつつ,変調順序と相対速度を最適に適応することを目的とする。
最適化問題はNPハード問題であるため、最適化問題をマルコフ決定プロセス(MDP)としてモデル化し、オンラインで適用可能なソリューションの利用を可能にする。
そして,マルチエージェント深層強化学習(drl)により解く前に,ラグランジュ緩和法を用いて制約問題を緩和した。
提案手法の性能を広範囲なシミュレーションにより検証し,提案手法の様々なバリエーションとランダム手法との比較を行った。
評価の結果,本システムでは,比較対象のスキームに比べてスペクトルの総和効率が有意に高いことがわかった。
関連論文リスト
- SOMTP: Self-Supervised Learning-Based Optimizer for MPC-Based Safe Trajectory Planning Problems in Robotics [13.129654942805846]
モデル予測制御(MP)に基づく軌道計画が広く使われており、制御バリア(CBF)はその制約を改善することができる。
本稿では,CBF-MPC軌道計画のための自己教師付き学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-05-15T09:38:52Z) - Analyzing and Enhancing the Backward-Pass Convergence of Unrolled
Optimization [50.38518771642365]
ディープネットワークにおけるコンポーネントとしての制約付き最適化モデルの統合は、多くの専門的な学習タスクに有望な進歩をもたらした。
この設定における中心的な課題は最適化問題の解によるバックプロパゲーションであり、しばしば閉形式を欠いている。
本稿では, 非線形最適化の後方通過に関する理論的知見を提供し, 特定の反復法による線形システムの解と等価であることを示す。
Folded Optimizationと呼ばれるシステムが提案され、非ローリングなソルバ実装からより効率的なバックプロパゲーションルールを構築する。
論文 参考訳(メタデータ) (2023-12-28T23:15:18Z) - High-Speed Resource Allocation Algorithm Using a Coherent Ising Machine
for NOMA Systems [3.6406488220483326]
NOMA手法の有効性を十分に活用する上で重要な課題は、リソース割り当ての最適化である。
NOMAシステムにおけるチャネル割り当てのためのコヒーレントIsing Machine(CIM)に基づく最適化手法を提案する。
提案手法は, 高速化と最適解の両面において優れていることを示す。
論文 参考訳(メタデータ) (2022-12-03T09:22:54Z) - Learning Adaptive Evolutionary Computation for Solving Multi-Objective
Optimization Problems [3.3266268089678257]
本稿では, 深層強化学習(DRL)を用いた適応パラメータ制御とMOEAを統合したフレームワークを提案する。
DRLポリシは、最適化中のソリューションに対する突然変異の強度と確率を決定する値を適応的に設定するように訓練されている。
学習されたポリシーは転送可能であることを示す。つまり、単純なベンチマーク問題で訓練されたポリシーは、複雑な倉庫最適化問題を解決するために直接適用可能である。
論文 参考訳(メタデータ) (2022-11-01T22:08:34Z) - An Empirical Evaluation of Zeroth-Order Optimization Methods on
AI-driven Molecule Optimization [78.36413169647408]
分子目的を最適化するための様々なZO最適化手法の有効性について検討する。
ZO符号に基づく勾配降下(ZO-signGD)の利点を示す。
本稿では,Guurcamol スイートから広く使用されているベンチマークタスクに対して,ZO 最適化手法の有効性を示す。
論文 参考訳(メタデータ) (2022-10-27T01:58:10Z) - Adaptive pruning-based optimization of parameterized quantum circuits [62.997667081978825]
Variisyハイブリッド量子古典アルゴリズムは、ノイズ中間量子デバイスの使用を最大化する強力なツールである。
我々は、変分量子アルゴリズムで使用されるそのようなアンサーゼを「効率的な回路訓練」(PECT)と呼ぶ戦略を提案する。
すべてのアンサッツパラメータを一度に最適化する代わりに、PECTは一連の変分アルゴリズムを起動する。
論文 参考訳(メタデータ) (2020-10-01T18:14:11Z) - Uncertainty aware Search Framework for Multi-Objective Bayesian
Optimization with Constraints [44.25245545568633]
高価な関数評価を用いた制約付きマルチオブジェクト(MO)ブラックボックス最適化の問題点を考察する。
本稿では,制約付き多目的最適化のための不確実性認識検索フレームワークを提案する。
UeMOCは最適化回路の探索に必要なシミュレーション数を90%以上削減できることを示す。
論文 参考訳(メタデータ) (2020-08-16T23:34:09Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z) - Cross Entropy Hyperparameter Optimization for Constrained Problem
Hamiltonians Applied to QAOA [68.11912614360878]
QAOA(Quantum Approximate Optimization Algorithm)のようなハイブリッド量子古典アルゴリズムは、短期量子コンピュータを実用的に活用するための最も奨励的なアプローチの1つである。
このようなアルゴリズムは通常変分形式で実装され、古典的な最適化法と量子機械を組み合わせて最適化問題の優れた解を求める。
本研究では,クロスエントロピー法を用いてランドスケープを形作り,古典的パラメータがより容易により良いパラメータを発見でき,その結果,性能が向上することを示す。
論文 参考訳(メタデータ) (2020-03-11T13:52:41Z) - GACEM: Generalized Autoregressive Cross Entropy Method for Multi-Modal
Black Box Constraint Satisfaction [69.94831587339539]
本稿では,マスク付き自己回帰ニューラルネットワークを用いて解空間上の均一分布をモデル化するクロスエントロピー法(CEM)を提案する。
我々のアルゴリズムは複雑な解空間を表現でき、様々な異なる解領域を追跡できる。
論文 参考訳(メタデータ) (2020-02-17T20:21:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。