論文の概要: Deep Reinforcement Learning Control for Radar Detection and Tracking in
Congested Spectral Environments
- arxiv url: http://arxiv.org/abs/2006.13173v3
- Date: Thu, 27 Aug 2020 04:23:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-18 00:01:31.891618
- Title: Deep Reinforcement Learning Control for Radar Detection and Tracking in
Congested Spectral Environments
- Title(参考訳): 集束スペクトル環境におけるレーダー検出と追跡のための深層強化学習制御
- Authors: Charles E. Thornton, Mark A. Kozy, R. Michael Buehrer, Anthony F.
Martone, Kelly D. Sherbondy
- Abstract要約: レーダは、他のシステムとの相互干渉を軽減するために、その線形周波数変調(LFM)波形の帯域幅と中心周波数を変化させることを学ぶ。
DQLベースのアプローチを拡張して、ダブルQ-ラーニングとリカレントニューラルネットワークを組み込んで、ダブルディープリカレントQ-ネットワークを形成する。
実験結果から,提案手法は集束スペクトル環境におけるレーダ検出性能を大幅に向上させることが示された。
- 参考スコア(独自算出の注目度): 8.103366584285645
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, dynamic non-cooperative coexistence between a cognitive pulsed
radar and a nearby communications system is addressed by applying nonlinear
value function approximation via deep reinforcement learning (Deep RL) to
develop a policy for optimal radar performance. The radar learns to vary the
bandwidth and center frequency of its linear frequency modulated (LFM)
waveforms to mitigate mutual interference with other systems and improve target
detection performance while also maintaining sufficient utilization of the
available frequency bands required for a fine range resolution. We demonstrate
that our approach, based on the Deep Q-Learning (DQL) algorithm, enhances
important radar metrics, including SINR and bandwidth utilization, more
effectively than policy iteration or sense-and-avoid (SAA) approaches in a
variety of realistic coexistence environments. We also extend the DQL-based
approach to incorporate Double Q-learning and a recurrent neural network to
form a Double Deep Recurrent Q-Network (DDRQN). We demonstrate the DDRQN
results in favorable performance and stability compared to DQL and policy
iteration. Finally, we demonstrate the practicality of our proposed approach
through a discussion of experiments performed on a software defined radar
(SDRadar) prototype system. Our experimental results indicate that the proposed
Deep RL approach significantly improves radar detection performance in
congested spectral environments when compared to policy iteration and SAA.
- Abstract(参考訳): 本稿では, ディープ強化学習(Deep RL)による非線形値関数近似を適用し, 最適レーダ性能向上のためのポリシを開発することにより, 認識パルスレーダと近接通信システムとの動的非協調的共存に対処する。
レーダは、その線形周波数変調(LFM)波形の帯域幅と中心周波数の変化を学習し、他のシステムとの相互干渉を緩和し、目標検出性能を向上させるとともに、細域分解に必要な周波数帯域を十分に活用する。
我々は,Deep Q-Learning(DQL)アルゴリズムに基づくアプローチにより,SINRや帯域幅利用といった重要なレーダメトリクスが,さまざまな現実的共存環境における政策イテレーションやSAAアプローチよりも効果的に向上することが実証された。
また、DQLベースのアプローチを拡張して、ダブルQラーニングとリカレントニューラルネットワークを導入し、ダブルディープQネットワーク(DDRQN)を構築します。
DDRQNの結果は、DQLやポリシーイテレーションと比較して、良好なパフォーマンスと安定性を示す。
最後に,ソフトウェア定義レーダ(SDRadar)の試作システムで実施した実験の議論を通じて,提案手法の実用性を実証する。
実験結果から,提案手法は,政策イテレーションやSAAと比較して,集束スペクトル環境におけるレーダ検出性能を著しく向上することが示された。
関連論文リスト
- Multi-stage Learning for Radar Pulse Activity Segmentation [51.781832424705094]
無線信号認識は電子戦において重要な機能である。
電子戦システムでは、レーダパルス活動の正確な識別と位置決めが要求される。
ディープラーニングに基づくレーダーパルス活動認識法は、ほとんど未検討のままである。
論文 参考訳(メタデータ) (2023-12-15T01:56:27Z) - Enhancing Reliability in Federated mmWave Networks: A Practical and
Scalable Solution using Radar-Aided Dynamic Blockage Recognition [14.18507067281377]
本稿では,ミリ波(mmWave)およびテラヘルツ(THz)ネットワークサービスの動的屋外環境における信頼性向上のための新しい手法を提案する。
これらの設定では、人や車などの障害物を動かすことで、視線接続(LoS)が簡単に中断される。
提案手法はRadar-Aided Blockage Dynamic Recognition (RaDaR)と呼ばれ、レーダー計測とフェデレートラーニング(FL)を活用して、二重出力ニューラルネットワーク(NN)モデルをトレーニングする。
論文 参考訳(メタデータ) (2023-06-22T10:10:25Z) - Semantic Segmentation of Radar Detections using Convolutions on Point
Clouds [59.45414406974091]
本稿では,レーダ検出を点雲に展開する深層学習手法を提案する。
このアルゴリズムは、距離依存クラスタリングと入力点雲の事前処理により、レーダ固有の特性に適応する。
我々のネットワークは、レーダポイント雲のセマンティックセグメンテーションのタスクにおいて、PointNet++に基づく最先端のアプローチよりも優れています。
論文 参考訳(メタデータ) (2023-05-22T07:09:35Z) - Model-based Deep Learning Receiver Design for Rate-Splitting Multiple
Access [65.21117658030235]
本研究では,モデルベース深層学習(MBDL)に基づく実用的なRSMA受信機の設計を提案する。
MBDL受信機は、符号なしシンボル誤り率(SER)、リンクレベルシミュレーション(LLS)によるスループット性能、平均トレーニングオーバーヘッドの観点から評価される。
その結果,MBDLはCSIRが不完全なSIC受信機よりも優れていた。
論文 参考訳(メタデータ) (2022-05-02T12:23:55Z) - Transferable Deep Reinforcement Learning Framework for Autonomous
Vehicles with Joint Radar-Data Communications [69.24726496448713]
本稿では,AVの最適決定を支援するために,マルコフ決定プロセス(MDP)に基づくインテリジェントな最適化フレームワークを提案する。
そこで我々は,近年の深層強化学習技術を活用した効果的な学習アルゴリズムを開発し,AVの最適方針を見出す。
提案手法は,従来の深部強化学習手法と比較して,AVによる障害物ミス検出確率を最大67%削減することを示す。
論文 参考訳(メタデータ) (2021-05-28T08:45:37Z) - Distributional Reinforcement Learning for mmWave Communications with
Intelligent Reflectors on a UAV [119.97450366894718]
無人航空機(UAV)搭載のインテリジェントリフレクタ(IR)を用いた新しい通信フレームワークを提案する。
ダウンリンク和率を最大化するために、最適プリコーディング行列(基地局)と反射係数(IR)を共同で導出する。
論文 参考訳(メタデータ) (2020-11-03T16:50:37Z) - Efficient Online Learning for Cognitive Radar-Cellular Coexistence via
Contextual Thompson Sampling [9.805913930878]
本稿では,適応型レーダ伝送における逐次的,あるいはオンライン学習方式について述べる。
レーダの振舞いを駆動するために、線形コンテキスト帯域学習(CB)フレームワークが適用される。
提案したThompson Smpling (TS)アルゴリズムはより複雑なディープQ-Network (DQN) と競合する性能を維持していることを示す。
論文 参考訳(メタデータ) (2020-08-24T01:20:58Z) - Optimization-driven Deep Reinforcement Learning for Robust Beamforming
in IRS-assisted Wireless Communications [54.610318402371185]
Intelligent Reflecting Surface (IRS)は、マルチアンテナアクセスポイント(AP)から受信機へのダウンリンク情報伝達を支援する有望な技術である。
我々は、APのアクティブビームフォーミングとIRSのパッシブビームフォーミングを共同最適化することで、APの送信電力を最小化する。
過去の経験からビームフォーミング戦略に適応できる深層強化学習(DRL)手法を提案する。
論文 参考訳(メタデータ) (2020-05-25T01:42:55Z) - A Reinforcement Learning based approach for Multi-target Detection in
Massive MIMO radar [12.982044791524494]
本稿では,MMIMO(Multiple input Multiple output)認知レーダ(CR)におけるマルチターゲット検出の問題点について考察する。
本稿では,未知の外乱統計の存在下での認知的マルチターゲット検出のための強化学習(RL)に基づくアルゴリズムを提案する。
定常環境と動的環境の両方において提案したRLアルゴリズムの性能を評価するため, 数値シミュレーションを行った。
論文 参考訳(メタデータ) (2020-05-10T16:29:06Z) - Experimental Analysis of Reinforcement Learning Techniques for Spectrum
Sharing Radar [8.852345851445829]
本稿では,RL(Reinforcement Reinforcement)制御を,集束したスペクトル環境で動作するレーダシステムに適用するためのフレームワークについて述べる。
市販オフ・ザ・シェルフ(COTS)ハードウェアで実施した実験から,いくつかのRLアルゴリズムの有用性を比較した。
各RL技術は, 集束スペクトル環境において達成された収束性, レーダ検出性能, および100MHzスペクトルを非協調通信システムと共有する能力の観点から評価する。
論文 参考訳(メタデータ) (2020-01-06T22:32:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。