論文の概要: Exploiting Gaussian Agnostic Representation Learning with Diffusion Priors for Enhanced Infrared Small Target Detection
- arxiv url: http://arxiv.org/abs/2507.18260v1
- Date: Thu, 24 Jul 2025 10:03:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-25 15:10:43.344473
- Title: Exploiting Gaussian Agnostic Representation Learning with Diffusion Priors for Enhanced Infrared Small Target Detection
- Title(参考訳): 拡張赤外小ターゲット検出のための拡散前処理によるガウス非依存表現学習
- Authors: Junyao Li, Yahao Lu, Xingyuan Guo, Xiaoyu Xian, Tiantian Wang, Yukai Shi,
- Abstract要約: 赤外線小目標検出(ISTD)は多くの実用化において重要な役割を担っている。
性能境界を決定するために、研究者は大規模で高価な手動ラベルデータを用いて表現学習を行う。
このアプローチは、最先端のISTDメソッドが現実世界の課題において非常に脆弱であることを示す。
- 参考スコア(独自算出の注目度): 7.396538084901484
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Infrared small target detection (ISTD) plays a vital role in numerous practical applications. In pursuit of determining the performance boundaries, researchers employ large and expensive manual-labeling data for representation learning. Nevertheless, this approach renders the state-of-the-art ISTD methods highly fragile in real-world challenges. In this paper, we first study the variation in detection performance across several mainstream methods under various scarcity -- namely, the absence of high-quality infrared data -- that challenge the prevailing theories about practical ISTD. To address this concern, we introduce the Gaussian Agnostic Representation Learning. Specifically, we propose the Gaussian Group Squeezer, leveraging Gaussian sampling and compression for non-uniform quantization. By exploiting a diverse array of training samples, we enhance the resilience of ISTD models against various challenges. Then, we introduce two-stage diffusion models for real-world reconstruction. By aligning quantized signals closely with real-world distributions, we significantly elevate the quality and fidelity of the synthetic samples. Comparative evaluations against state-of-the-art detection methods in various scarcity scenarios demonstrate the efficacy of the proposed approach.
- Abstract(参考訳): 赤外線小目標検出(ISTD)は多くの実用化において重要な役割を担っている。
性能境界を決定するために、研究者は大規模で高価な手動ラベルデータを用いて表現学習を行う。
それでもこのアプローチは、最先端のISTDメソッドが現実世界の課題において非常に脆弱であることを示している。
本稿では,多種多様な希少な手法,すなわち高品質な赤外線データがない場合における検出性能の変動について検討し,実用的ISTDに関する一般的な理論に挑戦する。
この問題に対処するため,ガウス的表現学習(Gaussian Agnostic Representation Learning)を導入する。
具体的には、非一様量子化にガウスサンプリングと圧縮を利用するガウス群スキーザーを提案する。
多様なトレーニングサンプルを活用することで、さまざまな課題に対してISTDモデルのレジリエンスを高めることができる。
次に,実世界再構築のための2段階拡散モデルを提案する。
量子化された信号と実世界の分布を密に整合させることにより,合成試料の品質と忠実度を著しく高める。
種々の希少なシナリオにおける最先端検出手法の比較評価により,提案手法の有効性が示された。
関連論文リスト
- CLIP Meets Diffusion: A Synergistic Approach to Anomaly Detection [54.85000884785013]
異常検出は、異常の定義の曖昧さ、異常型の多様性、トレーニングデータの不足による複雑な問題である。
識別的基盤モデルと生成的基礎モデルの両方を活用するCLIPfusionを提案する。
本手法は, 異常検出の多面的課題に対処する上で, マルチモーダル・マルチモデル融合の有効性を裏付けるものである。
論文 参考訳(メタデータ) (2025-06-13T13:30:15Z) - Research on Anomaly Detection Methods Based on Diffusion Models [4.979627412142658]
異常検出は機械学習とデータマイニングの基本的な課題であり、サイバーセキュリティ、産業障害診断、臨床疾患モニタリングに重要な応用がある。
統計モデリングや機械学習ベースのアプローチといった従来の手法は、複雑で高次元のデータ分散を扱う際の課題に直面することが多い。
本稿では,拡散確率モデル(DPM)の長所を利用して,画像および音声データの異常を効果的に識別するフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-08T11:19:08Z) - Rethinking Generalizable Infrared Small Target Detection: A Real-scene Benchmark and Cross-view Representation Learning [46.60262602072635]
赤外線小目標検出 (ISTD) は, センサタイプ, 観測条件, 標的の固有特性に非常に敏感である。
本稿では,ドメイン適応により拡張されたISTDフレームワークを提案する。
我々はまた、専用の赤外線小ターゲットデータセットであるRealScene-ISTDを開発した。
論文 参考訳(メタデータ) (2025-04-23T07:58:15Z) - Anomaly detection using Diffusion-based methods [15.049468347670421]
本稿では,拡散モデルによる異常検出の有用性について検討する。
コンパクトデータセットと高解像度データセットの両方における偏差を識別する効果に重点を置いている。
論文 参考訳(メタデータ) (2024-12-10T14:17:23Z) - Optimizing Multispectral Object Detection: A Bag of Tricks and Comprehensive Benchmarks [49.84182981950623]
RGBおよびTIR(熱赤外)変調を利用したマルチスペクトル物体検出は,課題として広く認識されている。
モダリティと堅牢な融合戦略の両方から特徴を効果的に抽出するだけでなく、スペクトルの相違といった問題に対処する能力も必要である。
本稿では,高パフォーマンス単一モードモデルのシームレスな最適化が可能な,効率的かつ容易にデプロイ可能なマルチスペクトルオブジェクト検出フレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-27T12:18:39Z) - Inverse-RLignment: Large Language Model Alignment from Demonstrations through Inverse Reinforcement Learning [62.05713042908654]
本稿では,これらの課題を克服するために,高品質な実演データを活用する新しいアプローチであるAlignment from Demonstrations (AfD)を紹介する。
AfDをシーケンシャルな意思決定フレームワークで形式化し、報酬信号の欠如というユニークな課題を強調します。
そこで本研究では,AfD に適した報酬モデル上で補間を行う計算効率のよいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-05-24T15:13:53Z) - Improved off-policy training of diffusion samplers [93.66433483772055]
本研究では,非正規化密度やエネルギー関数を持つ分布からサンプルを抽出する拡散モデルの訓練問題について検討する。
シミュレーションに基づく変分法や非政治手法など,拡散構造推論手法のベンチマークを行った。
我々の結果は、過去の研究の主張に疑問を投げかけながら、既存のアルゴリズムの相対的な利点を浮き彫りにした。
論文 参考訳(メタデータ) (2024-02-07T18:51:49Z) - Ensemble Kalman Filtering Meets Gaussian Process SSM for Non-Mean-Field and Online Inference [47.460898983429374]
我々は,非平均場(NMF)変動推定フレームワークにアンサンブルカルマンフィルタ(EnKF)を導入し,潜在状態の後方分布を近似する。
EnKFとGPSSMのこの新しい結婚は、変分分布の学習における広範なパラメータ化の必要性をなくすだけでなく、エビデンスの下限(ELBO)の解釈可能でクローズドな近似を可能にする。
得られたEnKF支援オンラインアルゴリズムは、データ適合精度を確保しつつ、モデル正規化を組み込んで過度適合を緩和し、目的関数を具現化する。
論文 参考訳(メタデータ) (2023-12-10T15:22:30Z) - CamoDiffusion: Camouflaged Object Detection via Conditional Diffusion
Models [72.93652777646233]
カモフラーゲ型物体検出(COD)は、カモフラーゲ型物体とその周囲の類似性が高いため、コンピュータビジョンにおいて難しい課題である。
本研究では,CODを拡散モデルを利用した条件付きマスク生成タスクとして扱う新しいパラダイムを提案する。
カモ拡散(CamoDiffusion)と呼ばれる本手法では,拡散モデルのデノナイズプロセスを用いてマスクの雑音を反復的に低減する。
論文 参考訳(メタデータ) (2023-05-29T07:49:44Z) - SUOD: Accelerating Large-Scale Unsupervised Heterogeneous Outlier
Detection [63.253850875265115]
外乱検出(OD)は、一般的なサンプルから異常物体を識別するための機械学習(ML)タスクである。
そこで我々は,SUODと呼ばれるモジュール型加速度システムを提案する。
論文 参考訳(メタデータ) (2020-03-11T00:22:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。