論文の概要: SEArch: Optimistic Policy Selection Between Scene Noise and Drift for UAV Radar Search
- arxiv url: http://arxiv.org/abs/2606.01325v1
- Date: Sun, 31 May 2026 16:21:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:29.587532
- Title: SEArch: Optimistic Policy Selection Between Scene Noise and Drift for UAV Radar Search
- Title(参考訳): SEArch:UAVレーダ探索のためのシーンノイズとドリフトの最適政策選択
- Authors: Noor Khial, Naram Mhaisen, Loay Ismail, Amr Mohamed,
- Abstract要約: レーダーセンサーを装備した無人航空機(UAV)は、多様な環境での捜索任務のために配備される。
基本的な課題は、UAVが動的かつ潜在的に静止しない環境を通過するときのレーダー統計の変化から生じる。
特定検出器ライブラリー上でのオンラインポリシー選択問題として,マルチ政治パラダイムを採用し,UAVターゲット探索を定式化する。
実験では、非定常的な設定の範囲で、適応的でないベースラインと比較して、最大30%の後悔の削減が示される。
- 参考スコア(独自算出の注目度): 3.121398783448697
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Unmanned Aerial Vehicles (UAVs) equipped with radar sensors are deployed for target search missions in diverse environments, where targets exhibit characteristic signatures (e.g., respiration micro-motion in human search) detectable through occlusions. A fundamental challenge arises from shifts in radar statistics as the UAV moves through a dynamic and potentially non-stationary environment, rendering any fixed signal-processing strategy suboptimal; yet perception and adaptation must run onboard a resource-constrained aerial node in real time. Since no single detector performs well across all conditions, we adopt a multi-policy paradigm and formulate UAV target search as an online policy selection problem over a library of specialized detectors, with performance measured by regret, the cumulative loss gap relative to the best policy in each scene. The setting couples in-scene stochastic noise with inter-scene shifts. Whereas prior methods capture only one regime, we account for both through the Stochastically Extended Adversary (SEA) framework, without requiring oracle knowledge of scene dynamics. Because adaptation must run at the UAV, we instantiate SEA through \textsc{SEArch}, a lightweight optimistic Follow the Regularized Leader (OFTRL) selector with an adaptive learning rate, achieving regret $O(\barσ_T \sqrt{T} + \sqrt{J})$, where $\barσ_T$ captures radar measurement noise and $J$ is the number of scene transitions over the mission horizon $T$. To enable rapid adaptation under frequent scene changes, we further introduce \textsc{W-SEArch}, a windowed variant that restarts every $w$ rounds and achieves regret $O(\barσ_I \sqrt{w})$ under at most one transition per window. Experiments show up to 30\% regret reduction compared to non-adaptive baselines across a range of non-stationary settings.
- Abstract(参考訳): レーダーセンサーを装備した無人航空機(UAV)は、様々な環境における目標探索ミッションに配備され、標的は閉塞によって検出可能な特徴的シグネチャ(例えば、人間の捜索における呼吸マイクロモーション)を示す。
基本的な課題は、UAVが動的かつ潜在的に静止しない環境を通り抜け、固定信号処理戦略を準最適にすることによるレーダー統計の変化である。
一つの検出器が全ての条件で良好に機能するわけではないため、我々は多政パラダイムを採用し、特殊な検出器のライブラリ上でのUAVターゲット探索をオンラインポリシー選択問題として定式化する。
舞台間シフトを伴う舞台内確率的雑音のカップル。
従来の手法は1つのレシエーションのみをキャプチャするが,Stochastically Extended Adversary (SEA) フレームワークを介し,シーンダイナミクスのオラクル知識を必要としない。
適応はUAVで実行されなければならないので、軽量で楽観的な、正規化リーダ(OFTRL)セレクタを適応学習レートでフォローし、後悔の$O(\barσ_T \sqrt{T} + \sqrt{J})$を達成します。
頻繁なシーン変更による迅速な適応を可能にするため,ウィンドウ毎に少なくとも1回の遷移で,$w$ラウンド毎に再起動し,後悔する$O(\barσ_I \sqrt{w})$を達成するウィンドウ付き変種である \textsc{W-SEArch} も導入する。
実験では、非定常的な設定の範囲で、適応的でないベースラインと比較して、最大で30\%の後悔の減少を示す。
関連論文リスト
- FU-MPC: Frontier- and Uncertainty-Aware Model Predictive Control for Efficient and Accurate UAV Exploration with Motorized LiDAR [29.924596251375892]
我々は独立に回転するLiDARを備えたUAVプラットフォームを開発し、階層的な探索フレームワークを提案する。
Fu-MPCは、予測された飛行軌道に沿ってLiDAR回転を最適化する局所後退水平走査コントローラとして機能する。
複雑な環境下での実験では、ロバストなローカライゼーション性能を維持しつつ、探索効率を向上させることが示されている。
論文 参考訳(メタデータ) (2026-05-14T14:54:29Z) - Adaptive Capacity Allocation for Vision Language Action Fine-tuning [30.782665306687992]
視覚言語アクションモデル(VLA)は、物理AIにますます使われているが、未確認環境に事前訓練されたVLAモデルをデプロイするには、まだ適応が必要である。
固定ランク更新を入力および層単位のキャパシティに置き換えるランク適応微調整法であるLoRA-SPを提案する。
目に見えないAgileX PiPERのアームで収集された4つの実ロボット操作タスクでは、LoRA-SPはトレーニング可能なパラメータがはるかに少ない完全な微調整にマッチするか、超える。
論文 参考訳(メタデータ) (2026-03-08T01:33:01Z) - NOVA: Navigation via Object-Centric Visual Autonomy for High-Speed Target Tracking in Unstructured GPS-Denied Environments [56.35569661650558]
我々はNOVAというオブジェクト中心のフレームワークを導入し、ロバストな目標追跡と衝突認識ナビゲーションを可能にした。
グローバルマップを構築するのではなく、NOVAはターゲットの参照フレーム内での知覚、推定、制御を定式化する。
我々は,都市迷路や森林の小道,間欠的なGPS損失を伴う建物内の繰り返し遷移など,現実の挑戦的なシナリオにまたがってNOVAを検証する。
論文 参考訳(メタデータ) (2025-06-23T14:28:30Z) - Learning to Explore in Diverse Reward Settings via Temporal-Difference-Error Maximization [10.377833496772665]
本研究では,密度,疎度,探索-逆報酬設定に対して頑健な,新しい探索手法である安定誤差探索(SEE)を提案する。
本手法では,遠方政治学習による不安定性の軽減,累積的TDエラーをエピソード設定で最大化する関心の対立,TDエラーの非定常的性質の3つの設計選択を導入する。
論文 参考訳(メタデータ) (2025-06-16T10:36:24Z) - SRRT: Exploring Search Region Regulation for Visual Object Tracking [58.68120400180216]
探索領域規則追跡(SRRT)と呼ばれる新しい追跡パラダイムを提案する。
SRRTでは,各フレームに対して最適な探索領域を動的に推定するために,提案された探索領域レギュレータを適用している。
大規模なLaSOTベンチマークでは、SRRTはSiamRPN++とTransTをAUCの4.6%と3.1%で改善した。
論文 参考訳(メタデータ) (2022-07-10T11:18:26Z) - Ad2Attack: Adaptive Adversarial Attack on Real-Time UAV Tracking [15.38386172273694]
本研究は,UAVオブジェクト追跡に対する新たな適応的対角攻撃手法,すなわちAd$2$Attackを提案する。
攻撃の非受容性と効率のバランスをとるために, 新たな最適化関数を提案する。
いくつかのよく知られたベンチマーク実験と実世界の条件実験により,攻撃手法の有効性が示された。
論文 参考訳(メタデータ) (2022-03-03T05:00:32Z) - A Flow Base Bi-path Network for Cross-scene Video Crowd Understanding in
Aerial View [93.23947591795897]
本稿では,これらの課題に対処し,ドローンから収集した視覚的データから参加者を自動的に理解する。
クロスシーンテストで発生する背景雑音を軽減するために, 二重ストリーム群カウントモデルを提案する。
極暗環境下での集団密度推定問題に対処するために,ゲームグランドセフトオートV(GTAV)によって生成された合成データを導入する。
論文 参考訳(メタデータ) (2020-09-29T01:48:24Z) - SADet: Learning An Efficient and Accurate Pedestrian Detector [68.66857832440897]
本稿では,一段検出器の検出パイプラインに対する一連の最適化手法を提案する。
効率的な歩行者検出のための単発アンカーベース検出器(SADet)を形成する。
構造的には単純だが、VGA解像度の画像に対して最先端の結果と20ドルFPSのリアルタイム速度を示す。
論文 参考訳(メタデータ) (2020-07-26T12:32:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。