論文の概要: Efficient Online Learning for Cognitive Radar-Cellular Coexistence via
Contextual Thompson Sampling
- arxiv url: http://arxiv.org/abs/2008.10149v1
- Date: Mon, 24 Aug 2020 01:20:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 12:42:59.024044
- Title: Efficient Online Learning for Cognitive Radar-Cellular Coexistence via
Contextual Thompson Sampling
- Title(参考訳): コンテクストトンプソンサンプリングによる認知的レーダー・細胞共存のための効率的なオンライン学習
- Authors: Charles E. Thornton, R. Michael Buehrer, Anthony F. Martone
- Abstract要約: 本稿では,適応型レーダ伝送における逐次的,あるいはオンライン学習方式について述べる。
レーダの振舞いを駆動するために、線形コンテキスト帯域学習(CB)フレームワークが適用される。
提案したThompson Smpling (TS)アルゴリズムはより複雑なディープQ-Network (DQN) と競合する性能を維持していることを示す。
- 参考スコア(独自算出の注目度): 9.805913930878
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper describes a sequential, or online, learning scheme for adaptive
radar transmissions that facilitate spectrum sharing with a non-cooperative
cellular network. First, the interference channel between the radar and a
spatially distant cellular network is modeled. Then, a linear Contextual Bandit
(CB) learning framework is applied to drive the radar's behavior. The
fundamental trade-off between exploration and exploitation is balanced by a
proposed Thompson Sampling (TS) algorithm, a pseudo-Bayesian approach which
selects waveform parameters based on the posterior probability that a specific
waveform is optimal, given discounted channel information as context. It is
shown that the contextual TS approach converges more rapidly to behavior that
minimizes mutual interference and maximizes spectrum utilization than
comparable contextual bandit algorithms. Additionally, we show that the TS
learning scheme results in a favorable SINR distribution compared to other
online learning algorithms. Finally, the proposed TS algorithm is compared to a
deep reinforcement learning model. We show that the TS algorithm maintains
competitive performance with a more complex Deep Q-Network (DQN).
- Abstract(参考訳): 本稿では,非協調的なセルネットワークとのスペクトル共有を容易にする適応型レーダ伝送の逐次的学習手法について述べる。
まず、レーダと空間的に離れたセルネットワークとの間の干渉チャネルをモデル化する。
次に、レーダの動作を駆動するために線形文脈バンディット(cb)学習フレームワークを適用する。
探索と利用の基本的なトレードオフは、特定の波形が最適である確率に基づいて波形パラメータを文脈として選択する擬ベイズ的手法であるトンプソンサンプリング(TS)アルゴリズムによってバランスされる。
文脈的TSアプローチは、相互干渉を最小限に抑え、コンテクスト的帯域幅アルゴリズムよりもスペクトル利用を最大化する振る舞いにより早く収束する。
また,ts学習方式は,他のオンライン学習アルゴリズムと比較して,sinr分布が良好であることを示す。
最後に,提案するtsアルゴリズムを深層強化学習モデルと比較する。
TSアルゴリズムはより複雑なディープQ-Network (DQN) と競合する性能を維持する。
関連論文リスト
- Online Network Source Optimization with Graph-Kernel MAB [62.6067511147939]
大規模ネットワークにおける最適なソース配置をオンラインで学習するためのグラフカーネルマルチアームバンディットアルゴリズムであるGrab-UCBを提案する。
適応グラフ辞書モデルを用いて,ネットワークプロセスを記述する。
我々は、ネットワークパラメータに依存する性能保証を導出し、シーケンシャルな意思決定戦略の学習曲線にさらに影響を及ぼす。
論文 参考訳(メタデータ) (2023-07-07T15:03:42Z) - Deep Learning-Based Synchronization for Uplink NB-IoT [72.86843435313048]
狭帯域モノのインターネット(NB-IoT)における狭帯域物理ランダムアクセスチャネル(NPRACH)のデバイス検出と到着時刻推定のためのニューラルネットワーク(NN)に基づくアルゴリズムを提案する。
導入されたNNアーキテクチャは、残余の畳み込みネットワークと、5Gニューラジオ(5G NR)仕様のプリアンブル構造に関する知識を利用する。
論文 参考訳(メタデータ) (2022-05-22T12:16:43Z) - Learning Optimal Antenna Tilt Control Policies: A Contextual Linear
Bandit Approach [65.27783264330711]
セルラーネットワークにおけるアンテナ傾きの制御は、ネットワークのカバレッジとキャパシティの間の効率的なトレードオフに到達するために不可欠である。
既存のデータから最適な傾き制御ポリシーを学習するアルゴリズムを考案する。
従来のルールベースの学習アルゴリズムよりもはるかに少ないデータサンプルを用いて最適な傾き更新ポリシーを作成できることを示す。
論文 参考訳(メタデータ) (2022-01-06T18:24:30Z) - Reinforcement Learning Algorithm for Traffic Steering in Heterogeneous
Network [0.609170287691728]
本稿では,HetNetsにおける新しいトラフィックステアリングアルゴリズムを提案する。
提案アルゴリズムは,ネットワークシミュレーション結果を用いた2つの参照アルゴリズムと比較した。
論文 参考訳(メタデータ) (2021-11-29T23:56:18Z) - Learning to Estimate RIS-Aided mmWave Channels [50.15279409856091]
そこでは,観測観測のために,既知の基地局とRIS位相制御行列を併用したアップリンクチャネル推定手法を提案する。
推定性能を向上し, トレーニングオーバーヘッドを低減するため, 深部展開法において, mmWaveチャネルの固有チャネル幅を生かした。
提案したディープ・アンフォールディング・ネットワーク・アーキテクチャは,トレーニングオーバーヘッドが比較的小さく,オンライン計算の複雑さも比較的小さく,最小二乗法(LS)法より優れていることが確認された。
論文 参考訳(メタデータ) (2021-07-27T06:57:56Z) - Jamming-Resilient Path Planning for Multiple UAVs via Deep Reinforcement
Learning [1.2330326247154968]
無人航空機(UAV)は無線ネットワークの不可欠な部分であると期待されている。
本論文では,複数のセルコネクテッドUAVの衝突のない経路を探索する。
本稿では,オンライン信号対干渉+雑音比マッピングを用いたオフライン時間差学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-04-09T16:52:33Z) - Fast Convergence Algorithm for Analog Federated Learning [30.399830943617772]
無線チャネル上での効率的なアナログフェデレーション学習のためのAirCompベースのFedSplitアルゴリズムを提案する。
提案アルゴリズムは, 目的関数が強く凸かつ滑らかであるという仮定の下で, 最適解に線形収束することを示す。
我々のアルゴリズムは、他のベンチマークFLアルゴリズムと比較して、より高速な収束を伴う不条件問題に対して、より堅牢であることが理論的および実験的に検証されている。
論文 参考訳(メタデータ) (2020-10-30T10:59:49Z) - AIN: Fast and Accurate Sequence Labeling with Approximate Inference
Network [75.44925576268052]
線形鎖条件ランダム場(CRF)モデルは最も広く使われているニューラルネットワークラベリング手法の1つである。
厳密な確率的推論アルゴリズムは典型的にはCRFモデルの訓練と予測段階に適用される。
CRFモデルに対して並列化可能な近似変分推論アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-09-17T12:18:43Z) - Deep Reinforcement Learning Control for Radar Detection and Tracking in
Congested Spectral Environments [8.103366584285645]
レーダは、他のシステムとの相互干渉を軽減するために、その線形周波数変調(LFM)波形の帯域幅と中心周波数を変化させることを学ぶ。
DQLベースのアプローチを拡張して、ダブルQ-ラーニングとリカレントニューラルネットワークを組み込んで、ダブルディープリカレントQ-ネットワークを形成する。
実験結果から,提案手法は集束スペクトル環境におけるレーダ検出性能を大幅に向上させることが示された。
論文 参考訳(メタデータ) (2020-06-23T17:21:28Z) - Communication-Efficient Distributed Stochastic AUC Maximization with
Deep Neural Networks [50.42141893913188]
本稿では,ニューラルネットワークを用いた大規模AUCのための分散変数について検討する。
我々のモデルは通信ラウンドをはるかに少なくし、理論上はまだ多くの通信ラウンドを必要としています。
いくつかのデータセットに対する実験は、我々の理論の有効性を示し、我々の理論を裏付けるものである。
論文 参考訳(メタデータ) (2020-05-05T18:08:23Z) - Deep Learning for Frame Error Prediction using a DARPA Spectrum
Collaboration Challenge (SC2) Dataset [4.855663359344748]
本稿では,SC2チャレンジの最終シナリオに参加する際に収集したデータセットを用いて,CIRN(Collaborative Intelligent Radio Network)のフレームエラーの予測にディープラーニングを用いた最初の例を示す。
4つのシナリオは、帯域幅とチャネル割り当ての戦略をランダム化または修正することに基づいて検討され、異なるリンクでトレーニングとテストを行うか、ディープニューラルネットワークをトレーニングするために各リンクにパイロットフェーズを使用する。
得られた知見は,大規模な異種ネットワークにスケーラブルで,多様な無線環境に一般化可能な深層学習型戦略を実現するための扉を開く。
論文 参考訳(メタデータ) (2020-03-22T04:53:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。