論文の概要: Unlocking Optical Prior: Spectrum-Guided Knowledge Transfer for SAR Generalized Category Discovery
- arxiv url: http://arxiv.org/abs/2604.22174v1
- Date: Fri, 24 Apr 2026 02:54:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-27 15:36:26.318085
- Title: Unlocking Optical Prior: Spectrum-Guided Knowledge Transfer for SAR Generalized Category Discovery
- Title(参考訳): アンロック光優先:SAR一般化カテゴリー発見のためのスペクトル誘導知識伝達
- Authors: Jingyuan Xia, Ruikang Hu, Ye Li, Zhixiong Yang, Xu Lan, Zhejun Lu,
- Abstract要約: Generalized Category Discovery (GCD)は、SAR(Scarce Synthetic Aperture Radar)ドメインに対して大きな約束を持っている。
これは、LVM(Large Vision Models)とSAR(SAR)画像の本質的にの光学的先行性の間のクロスモーダル不整合性によって制約される。
既存の領域適応法は、しばしばイメージング特性を反映する誘導バイアスを欠いている。
- 参考スコア(独自算出の注目度): 13.869293041418176
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generalized Category Discovery (GCD) holds significant promise for the label-scarce Synthetic Aperture Radar (SAR) domain, yet its efficacy is severely constrained by the cross-modal incompatibility between the inherent optical prior of the Large Vision Models (LVMs) and SAR imagery. Existing domain adaptation methods often lack an inductive bias that reflects imaging characteristics, consequently failing to effectively transfer optical prior into the SAR domain. To address this issue, the Modal Discrepancy Curve (MDC) is introduced to model cross-modal discrepancy as a structured frequency-domain descriptor derived from spectral energy distributions. Leveraging this formulation, we propose the MDC-guided Cross-modal Prior Transfer (MCPT) framework, a pre-training paradigm that operates on paired optical-SAR data. Within this framework, Adaptive Frequency Tokenization (AFT) converts the MDC into learnable tokens, and Frequency-aware Expert Refinement (FER) performs band-wise discrepancy-aware feature refinement using these tokens. Based on the refined representations, contrastive learning aligns refined embeddings across modalities and internalizes the adaptation pattern. Ultimately, the superior SAR feature representation capability learned during paired pre-training is applied to downstream single-modal SAR-GCD tasks. Extensive experiments demonstrate state-of-the-art performance across multiple mainstream datasets, indicating that frequency-domain discrepancy modeling enables more effective adaptation of optical prior to SAR imagery.
- Abstract(参考訳): Generalized Category Discovery (GCD) は、ラベルスカース合成開口レーダ(SAR)ドメインに対して重要な保証を持っているが、その有効性は、LVM(Large Vision Models)とSAR(SAR)画像の固有の光学的先行の相互非互換性によって厳しく制約されている。
既存の領域適応法は、撮像特性を反映する誘導バイアスを欠くことが多く、その結果、光学先行をSAR領域に効果的に転送することができない。
この問題に対処するために、スペクトルエネルギー分布から導かれる構造的周波数領域記述子として、モーダル離散曲線(MDC)がクロスモーダル離散をモデル化するために導入された。
この定式化を活用し,光SARデータを用いた事前学習パラダイムであるMCPT(MCPT)フレームワークを提案する。
このフレームワーク内では、適応周波数トークン化(AFT)はMDCを学習可能なトークンに変換し、FER(周波数対応エキスパートリファインメント)はこれらのトークンを使用して帯域単位の離散性を考慮した特徴改善を行う。
洗練された表現に基づいて、対照的な学習はモダリティにまたがって洗練された埋め込みを調整し、適応パターンを内部化する。
最終的に、ペアプレトレーニング中に学習した優れたSAR特徴表現能力が、下流シングルモーダルSAR-GCDタスクに適用される。
広汎な実験により、複数の主流データセットにまたがる最先端のパフォーマンスが実証され、周波数領域差のモデリングにより、SAR画像に先立ってより効果的な光の適応が可能になることが示されている。
関連論文リスト
- WaveSeg: Enhancing Segmentation Precision via High-Frequency Prior and Mamba-Driven Spectrum Decomposition [61.3530659856013]
本稿では,空間およびウェーブレット領域の機能改善を共同で最適化する新しいデコーダアーキテクチャであるWaveSegを提案する。
高周波成分は、まず入力画像から、境界の詳細を強化するために明示的な先行として学習される。
標準ベンチマークの実験では、Mambaベースの注目に先立ってウェーブレット-ドメイン周波数を利用するWaveSegが、常に最先端のアプローチより優れていることが示されている。
論文 参考訳(メタデータ) (2025-10-24T01:41:31Z) - Domain Adaptive SAR Wake Detection: Leveraging Similarity Filtering and Memory Guidance [5.026771815351906]
そこで本稿では,非教師付きドメイン適応型船舶起動検出のためのSimisity-Guided and Memory-Guided Domain Adap-tation (Termed SimMemDA) フレームワークを提案する。
まず、WakeGANを用いて光学画像のスタイル転送を行い、SARスタイルに近い擬似画像を生成する。
次に、インスタンスレベルの特徴類似度フィルタリング機構を設計し、ソースサンプルをターゲットライクなディストリビューションで識別し、優先順位付けする。
論文 参考訳(メタデータ) (2025-09-14T08:35:39Z) - SpectrumFM: Redefining Spectrum Cognition via Foundation Modeling [65.65474629224558]
本稿ではスペクトル認識のための新しいパラダイムを提供するスペクトルFMと呼ばれるスペクトル基盤モデルを提案する。
畳み込みニューラルネットワークを利用した革新的なスペクトルエンコーダを提案し、スペクトルデータにおける微細な局所信号構造と高レベルのグローバルな依存関係の両方を効果的に捕捉する。
2つの新しい自己教師型学習タスク、すなわちマスク付き再構成と次のスロット信号予測が、SpectrumFMの事前学習のために開発され、モデルがリッチで伝達可能な表現を学習できるようにする。
論文 参考訳(メタデータ) (2025-08-02T14:40:50Z) - Frequency Domain-Based Diffusion Model for Unpaired Image Dehazing [92.61216319417208]
そこで本稿では,未確認データにおける有益な知識を十分に活用するための,新しい周波数領域ベース拡散モデルを提案する。
拡散モデル(DM)が示す強い生成能力に着想を得て,周波数領域再構成の観点からデハージング課題に取り組む。
論文 参考訳(メタデータ) (2025-07-02T01:22:46Z) - Latent Diffusion Model Based Denoising Receiver for 6G Semantic Communication: From Stochastic Differential Theory to Application [11.385703484113552]
生成人工知能(GAI)を利用した新しい意味コミュニケーションフレームワークを提案する。
意味的特徴抽出のための変分オートエンコーダを組み合わせた潜在拡散モデル(LDM)に基づくセマンティックコミュニケーションフレームワークを提案する。
提案システムはゼロショットの一般化をサポートし,低SNRおよびアウト・オブ・ディストリビューション条件下での優れた性能を実現する訓練自由フレームワークである。
論文 参考訳(メタデータ) (2025-06-06T03:20:32Z) - AuxDet: Auxiliary Metadata Matters for Omni-Domain Infrared Small Target Detection [49.81255045696323]
補助メタデータ駆動型赤外小型ターゲット検出器(AuxDet)について述べる。
AuxDetはメタデータセマンティクスと視覚的特徴を統合し、各サンプルに対する適応表現学習を導く。
挑戦的なWideIRSTD-Fullベンチマークの実験は、AuxDetが一貫して最先端のメソッドより優れていることを示した。
論文 参考訳(メタデータ) (2025-05-21T07:02:05Z) - SpINR: Neural Volumetric Reconstruction for FMCW Radars [0.15193212081459279]
本稿では、周波数変調連続波(FMCW)レーダデータを用いたボリューム再構成のための新しいフレームワークSpINRを紹介する。
従来のバックプロジェクション手法や既存の学習ベースアプローチよりも,SpINRの方が優れていることを示す。
論文 参考訳(メタデータ) (2025-03-30T04:44:57Z) - PromptMID: Modal Invariant Descriptors Based on Diffusion and Vision Foundation Models for Optical-SAR Image Matching [15.840638449527399]
本稿では,テキストプロンプトを用いたモダリティ不変記述子構築手法であるPromptMIDを提案する。
PromptMIDは、事前訓練された拡散モデルと視覚基礎モデルを活用することで、マルチスケールのモダリティ不変の特徴を抽出する。
4つの異なる領域の光学SAR画像データセットの実験により、PromptMIDは最先端のマッチング方法より優れていることが示された。
論文 参考訳(メタデータ) (2025-02-25T11:19:26Z) - Generalizable Non-Line-of-Sight Imaging with Learnable Physical Priors [52.195637608631955]
非視線画像(NLOS)は、その潜在的な応用により注目されている。
既存のNLOS再構成アプローチは、経験的物理的前提に依存して制約される。
本稿では,Learningable Path Compensation(LPC)とAdaptive Phasor Field(APF)の2つの主要な設計を含む,学習に基づく新しいソリューションを提案する。
論文 参考訳(メタデータ) (2024-09-21T04:39:45Z) - Adaptive Diffusion Priors for Accelerated MRI Reconstruction [0.9895793818721335]
ディープMRI再構成は、完全にサンプリングされたデータと整合したイメージを復元するために、アンサンプされた取得をデエイリアス化する条件付きモデルで一般的に行われる。
非条件モデルは、画像演算子に関連する領域シフトに対する信頼性を向上させるために、演算子から切り離された生成画像の事前を学習する。
本稿では,MRI 再構成に先立つ適応拡散 AdaDiff を提案する。
論文 参考訳(メタデータ) (2022-07-12T22:45:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。