論文の概要: Active Sensing with Meta-Reinforcement Learning for Emitter Localization from RF Observations
- arxiv url: http://arxiv.org/abs/2605.12569v1
- Date: Tue, 12 May 2026 10:03:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:27.584831
- Title: Active Sensing with Meta-Reinforcement Learning for Emitter Localization from RF Observations
- Title(参考訳): RF観測からの放射像定位のためのメタ強化学習を用いたアクティブセンシング
- Authors: M. Shamail J. Khan, Nisha L. Raichur, Lucas Heublein, Christian Wielenberg, Alexander Mattick, Tobias Feigl, Christopher Mutschler, Felix Ott,
- Abstract要約: グローバルナビゲーション衛星システム(GNSS)の干渉は、信頼性の高い位置決めに深刻な脅威をもたらす。
本稿では,アクティブセンシング問題として干渉局所化を定式化する。
本研究では,エージェントが環境を逐次探索し,エミッタ源の位置を推定する強化学習フレームワークを提案する。
- 参考スコア(独自算出の注目度): 34.91678998140352
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Global navigation satellite system (GNSS) interference poses a serious threat to reliable positioning, especially in indoor and multipath-rich environments where source localization is highly challenging. In this paper, we formulate GNSS interference localization as an active sensing problem and propose a reinforcement learning (RL) framework in which an agent sequentially explores the environment to infer the position of an emitter source from radio frequency (RF) observations acquired with a 2x2 patch antenna. The localization task is modeled as a partially observable decision process, since single-snapshot measurements are often ambiguous under multipath propagation and changing channel conditions. To address this, the proposed framework combines high-dimensional RF sensing with deep RL and recurrent policy learning. We investigate both value-based and policy-based approaches, namely Deep Q-Networks (DQN) and Proximal Policy Optimization (PPO), and study their behavior under domain shift. The approach is evaluated on a simulated dataset generated with the Sionna ray-tracing module, which provides realistic propagation effects and diverse environment configurations. Experimental results show that the proposed method achieves a localization success rate of 80.1%, demonstrating the potential of RL for adaptive GNSS interference localization. Overall, the results highlight simulation-assisted training as a promising direction for robust interference localization in challenging propagation environments.
- Abstract(参考訳): グローバルナビゲーション衛星システム(GNSS)の干渉は、特にソースローカライゼーションが極めて困難である屋内およびマルチパス環境において、信頼性の高い位置決めに深刻な脅威をもたらす。
本稿では,GNSS干渉の局所化をアクティブセンシング問題として定式化し,エージェントが2x2パッチアンテナで取得した電波(RF)観測からエミッタ源の位置を推測する環境を逐次探索する強化学習(RL)フレームワークを提案する。
ローカライゼーションタスクは部分観測可能な決定プロセスとしてモデル化されている。
これを解決するために,提案フレームワークは,高次元RFセンシングと深部RLと繰り返しポリシー学習を組み合わせる。
本稿では、DQN(Deep Q-Networks)とPPO(Proximal Policy Optimization)という、価値に基づくアプローチとポリシーに基づくアプローチについて検討し、ドメインシフト下での振る舞いについて検討する。
この手法は、シオンナ線追跡モジュールで生成されたシミュレーションデータセットに基づいて評価され、現実的な伝搬効果と多様な環境構成を提供する。
実験の結果,提案手法は80.1%のローカライゼーション成功率を実現し,適応型GNSS干渉ローカライゼーションにおけるRLの可能性を示した。
その結果, シミュレーション支援トレーニングが, 困難な伝搬環境下でのロバストな干渉局所化の有望な方向として強調された。
関連論文リスト
- RSGround-R1: Rethinking Remote Sensing Visual Grounding through Spatial Reasoning [61.84363374647606]
リモートセンシングビジュアルグラウンドディング(RSVG)は、自然言語記述に基づく大規模空中画像における対象物体のローカライズを目的としている。
これらの記述はしばしば位置的手がかりに大きく依存しており、空間的推論においてMLLM(Multimodal Large Language Models)に固有の課題を提起している。
空間理解の高度化を図るために,textbfRSGround-R1 と呼ばれる推論誘導型位置認識後学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-29T12:35:57Z) - Grounded Test-Time Adaptation for LLM Agents [75.62784644919803]
大規模言語モデル(LLM)ベースのエージェントは、新規で複雑な環境への一般化に苦慮している。
環境特化情報を活用することで, LLMエージェントを適応するための2つの戦略を提案する。
論文 参考訳(メタデータ) (2025-11-06T22:24:35Z) - RL-Aided Cognitive ISAC: Robust Detection and Sensing-Communication Trade-offs [4.7199341867016456]
本稿では,統合型センシングとコミュニケーションのための強化学習支援型認知フレームワークを提案する。
ウォルド型検出器は非ガウス的クラッタ下でのロバストな目標検出に使用される。
SARSAに基づくRLアルゴリズムは、事前の環境知識を使わずに目標位置の適応的推定を可能にする。
論文 参考訳(メタデータ) (2025-11-04T15:49:51Z) - RadioDiff-Loc: Diffusion Model Enhanced Scattering Congnition for NLoS Localization with Sparse Radio Map Estimation [24.71314779247058]
本稿では条件拡散モデルに基づくNLoSローカライゼーションのための新しい生成推論フレームワークを提案する。
回折された電磁エネルギーが建物縁付近に集中する物理的知見を活用することにより,サンプリング戦略を開発する。
我々は、最大観測強度に対して全サンプルRSS値を正規化し、パワー不変の無線マップの構築を可能にした。
論文 参考訳(メタデータ) (2025-09-02T01:43:23Z) - Backscatter Device-aided Integrated Sensing and Communication: A Pareto Optimization Framework [59.30060797118097]
統合センシング・通信(ISAC)システムは、密集した都市非視線シナリオにおいて大きな性能劣化に遭遇する可能性がある。
本稿では,自然環境に分散した受動的BDを利用した後方散乱近似(BD)支援ISACシステムを提案する。
論文 参考訳(メタデータ) (2025-07-12T17:11:06Z) - EHGCN: Hierarchical Euclidean-Hyperbolic Fusion via Motion-Aware GCN for Hybrid Event Stream Perception [57.54227977352417]
イベントカメラは、知覚タスクのための高速なイベントストリームを出力する。
ユークリッド空間と双曲空間の両方においてイベントストリームを知覚するためのEHGCNという新しい手法を提案する。
論文 参考訳(メタデータ) (2025-04-23T11:01:03Z) - Sensor Control for Information Gain in Dynamic, Sparse and Partially
Observed Environments [1.5402666674186938]
本研究では,部分観測可能,動的,疎密なサンプル環境下での情報収集のための自律型センサ制御手法を提案する。
本研究は,(1)新しい情報獲得報酬を用いて,未開の非定常環境における探索を改善することで,DAN強化学習フレームワークを拡張した。
また、目的のRFスペクトル/フィールドからのサンプリングが限定された状況にまで拡張し、制限されたフィールドサンプリングから反復的に改善されたモデルを介してコントローラを微調整するオリジナルのRLアルゴリズムのモデルベースバージョンを提案する。
論文 参考訳(メタデータ) (2022-11-03T00:03:14Z) - Deep Reinforcement Learning for IRS Phase Shift Design in
Spatiotemporally Correlated Environments [93.30657979626858]
本稿では,チャネル相関と目的地動きを考慮したディープアクター批判アルゴリズムを提案する。
チャネルが時間的に相関している場合、コンバージェンスを抑制する方法において、関数近似を伴う状態表現にSNRを組み込むことが示される。
論文 参考訳(メタデータ) (2022-11-02T22:07:36Z) - Reinforcement Learning for Low-Thrust Trajectory Design of
Interplanetary Missions [77.34726150561087]
本稿では, 惑星間軌道のロバスト設計における強化学習の適用について検討する。
最先端アルゴリズムのオープンソース実装が採用されている。
その結果得られた誘導制御ネットワークは、堅牢な名目的軌道と関連する閉ループ誘導法の両方を提供する。
論文 参考訳(メタデータ) (2020-08-19T15:22:15Z) - A Reinforcement Learning based approach for Multi-target Detection in
Massive MIMO radar [12.982044791524494]
本稿では,MMIMO(Multiple input Multiple output)認知レーダ(CR)におけるマルチターゲット検出の問題点について考察する。
本稿では,未知の外乱統計の存在下での認知的マルチターゲット検出のための強化学習(RL)に基づくアルゴリズムを提案する。
定常環境と動的環境の両方において提案したRLアルゴリズムの性能を評価するため, 数値シミュレーションを行った。
論文 参考訳(メタデータ) (2020-05-10T16:29:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。