論文の概要: SWIFT: A General Sensitive Weight Identification Framework for Fast Sensor-Transfer Pansharpening
- arxiv url: http://arxiv.org/abs/2507.20311v1
- Date: Sun, 27 Jul 2025 15:06:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-29 16:23:57.377715
- Title: SWIFT: A General Sensitive Weight Identification Framework for Fast Sensor-Transfer Pansharpening
- Title(参考訳): SWIFT:高速センサ・トランスファー・パンシャーピングのための汎用重み同定フレームワーク
- Authors: Zeyu Xia, Chenxi Sun, Tianyu Xin, Yubo Zeng, Haoyu Chen, Liang-Jian Deng,
- Abstract要約: Pansharpeningは、高分解能パノクロマトグラフィ(PAN)画像と低分解能マルチスペクトル(LRMS)画像を融合して高分解能マルチスペクトル(HRMS)画像を生成することを目的としている。
深層学習に基づく手法は有望な性能を達成したが、通常、目に見えないセンサーのデータに適用すると、厳しい性能劣化に悩まされる。
クロスセンサ適応のための高速かつ汎用的なフレームワークSWIFTを提案する。
- 参考スコア(独自算出の注目度): 16.578857961692716
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Pansharpening aims to fuse high-resolution panchromatic (PAN) images with low-resolution multispectral (LRMS) images to generate high-resolution multispectral (HRMS) images. Although deep learning-based methods have achieved promising performance, they generally suffer from severe performance degradation when applied to data from unseen sensors. Adapting these models through full-scale retraining or designing more complex architectures is often prohibitively expensive and impractical for real-world deployment. To address this critical challenge, we propose a fast and general-purpose framework for cross-sensor adaptation, SWIFT (Sensitive Weight Identification for Fast Transfer). Specifically, SWIFT employs an unsupervised sampling strategy based on data manifold structures to balance sample selection while mitigating the bias of traditional Farthest Point Sampling, efficiently selecting only 3\% of the most informative samples from the target domain. This subset is then used to probe a source-domain pre-trained model by analyzing the gradient behavior of its parameters, allowing for the quick identification and subsequent update of only the weight subset most sensitive to the domain shift. As a plug-and-play framework, SWIFT can be applied to various existing pansharpening models. Extensive experiments demonstrate that SWIFT reduces the adaptation time from hours to approximately one minute on a single NVIDIA RTX 4090 GPU. The adapted models not only substantially outperform direct-transfer baselines but also achieve performance competitive with, and in some cases superior to, full retraining, establishing a new state-of-the-art on cross-sensor pansharpening tasks for the WorldView-2 and QuickBird datasets.
- Abstract(参考訳): Pansharpeningは、高分解能パノクロマトグラフィ(PAN)画像と低分解能マルチスペクトル(LRMS)画像を融合して高分解能マルチスペクトル(HRMS)画像を生成することを目的としている。
深層学習に基づく手法は有望な性能を達成したが、通常、目に見えないセンサーのデータに適用すると、深刻な性能劣化に悩まされる。
これらのモデルを大規模に再トレーニングしたり、より複雑なアーキテクチャを設計したりすることで適応することは、現実のデプロイメントでは違法に高価で実用的ではないことが多い。
この重要な課題に対処するために、クロスセンサ適応のための高速で汎用的なフレームワークSWIFT(Sensitive Weight Identification for Fast Transfer)を提案する。
具体的には、SWIFTは、データ多様体構造に基づく教師なしサンプリング戦略を用いて、従来のFarthest Point Smplingのバイアスを緩和しつつサンプル選択のバランスを保ち、ターゲットドメインから最も情報性の高いサンプルの3倍の効率で選択する。
このサブセットは、パラメータの勾配挙動を分析して、ソースドメイン事前訓練されたモデルを探索するために使用され、ドメインシフトに最も敏感な重み部分集合のみを素早く同定し、その後の更新を可能にする。
プラグアンドプレイのフレームワークとして、SWIFTは様々な既存のパンシャーピングモデルに適用できる。
大規模な実験により、SWIFTは1つのNVIDIA RTX 4090 GPU上で、適応時間を数時間から約1分に短縮することを示した。
適応されたモデルは、直接転送ベースラインを大幅に上回るだけでなく、パフォーマンスの競争力も達成し、場合によっては完全な再トレーニングに勝り、WorldView-2とQuickBirdデータセットのクロスセンサー・パンシャーピングタスクに新たな最先端のタスクを確立する。
関連論文リスト
- Progressive Alignment Degradation Learning for Pansharpening [3.7939736380306552]
深層学習に基づくパンシャーピングにより,高分解能マルチスペクトル画像(HRMS)を効果的に生成できることが示されている。
Waldプロトコルは、人工低解像度データで訓練されたネットワークが、高解像度データでも同じように機能すると仮定する。
本稿では,PAlignNetとPDegradeNetという2つのサブネットワーク間の相互イテレーションを用いて,正確な劣化過程を適応的に学習するPADMを提案する。
論文 参考訳(メタデータ) (2025-06-25T07:07:32Z) - AuxDet: Auxiliary Metadata Matters for Omni-Domain Infrared Small Target Detection [58.67129770371016]
シーン認識最適化のためのテキストメタデータを組み込むことにより、IRSTDパラダイムを再定義する新しいIRSTDフレームワークを提案する。
AuxDetは最先端の手法を一貫して上回り、堅牢性と正確性を改善する上で補助情報の重要な役割を検証している。
論文 参考訳(メタデータ) (2025-05-21T07:02:05Z) - CAT: A Conditional Adaptation Tailor for Efficient and Effective Instance-Specific Pansharpening on Real-World Data [7.471505633354803]
本稿では、特定の入力インスタンスに適応し、トレーニングと推論の両方を短時間で完了する効率的なフレームワークを提案する。
本手法は,512times512$イメージのトレーニングと推論の両方を,textit0.4 seconds$で実現する。
論文 参考訳(メタデータ) (2025-04-14T14:04:55Z) - Visual Fourier Prompt Tuning [63.66866445034855]
本稿では,大規模なトランスフォーマーモデルに適用するための汎用的で効果的な方法として,Visual Fourier Prompt Tuning (VFPT)法を提案する。
提案手法では,高速フーリエ変換を即時埋め込みに取り入れ,空間領域情報と周波数領域情報の両方を調和的に検討する。
提案手法は,2つのベンチマークにおいて,現状のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2024-11-02T18:18:35Z) - Open-Set Deepfake Detection: A Parameter-Efficient Adaptation Method with Forgery Style Mixture [58.60915132222421]
本稿では,顔偽造検出に汎用的かつパラメータ効率の高い手法を提案する。
フォージェリー・ソース・ドメインの多様性を増大させるフォージェリー・ミックス・フォーミュレーションを設計する。
設計したモデルは、トレーニング可能なパラメータを著しく減らし、最先端の一般化性を実現する。
論文 参考訳(メタデータ) (2024-08-23T01:53:36Z) - MoE-FFD: Mixture of Experts for Generalized and Parameter-Efficient Face Forgery Detection [54.545054873239295]
ディープフェイクは、最近、国民の間で重大な信頼問題とセキュリティ上の懸念を提起した。
ViT法はトランスの表現性を生かし,優れた検出性能を実現する。
この研究は、汎用的でパラメータ効率のよいViTベースのアプローチであるFace Forgery Detection (MoE-FFD)のためのMixture-of-Expertsモジュールを導入する。
論文 参考訳(メタデータ) (2024-04-12T13:02:08Z) - InstantSplat: Sparse-view Gaussian Splatting in Seconds [91.77050739918037]
InstantSplatは,光速でスパークビュー3Dシーンを再現する新しい手法である。
InstantSplatでは,3Dシーン表現とカメラポーズを最適化する,自己管理フレームワークを採用している。
3D-GSの従来のSfMと比較して、30倍以上の再現を達成し、視覚的品質(SSIM)を0.3755から0.7624に改善する。
論文 参考訳(メタデータ) (2024-03-29T17:29:58Z) - Few-shot Online Anomaly Detection and Segmentation [29.693357653538474]
本稿では,難易度の高いオンライン異常検出・セグメンテーション(FOADS)の課題に対処することに焦点を当てる。
FOADSフレームワークでは、モデルを数ショットの通常のデータセットでトレーニングし、その後、正常サンプルと異常サンプルの両方を含む未ラベルのストリーミングデータを活用することで、その能力の検査と改善を行う。
限られたトレーニングサンプルを用いた性能向上のために,ImageNetで事前学習したCNNから抽出したマルチスケール特徴埋め込みを用いて,ロバストな表現を得る。
論文 参考訳(メタデータ) (2024-03-27T02:24:00Z) - Exploring Dynamic Transformer for Efficient Object Tracking [58.120191254379854]
効率的なトラッキングのための動的トランスフォーマーフレームワークであるDyTrackを提案する。
DyTrackは、様々な入力に対して適切な推論ルートを設定することを学習し、利用可能な計算予算をより活用する。
複数のベンチマークの実験では、DyTrackは単一のモデルで有望な速度精度のトレードオフを実現している。
論文 参考訳(メタデータ) (2024-03-26T12:31:58Z) - Exploring Learning Complexity for Efficient Downstream Dataset Pruning [8.990878450631596]
既存のデータセットプルーニングメソッドでは、データセット全体のトレーニングが必要になる。
本稿では、DLC(Distorting-based Learning Complexity)という、単純で、新規で、トレーニング不要な難易度スコアを提案する。
本手法は,より高速に学習できるサンプルを少ないパラメータで学習できるという観察結果に動機付けられている。
論文 参考訳(メタデータ) (2024-02-08T02:29:33Z) - Adaptive Sparse Convolutional Networks with Global Context Enhancement
for Faster Object Detection on Drone Images [26.51970603200391]
本稿では,スパース畳み込みに基づく検出ヘッドの最適化について検討する。
これは、小さなオブジェクトのコンテキスト情報の不十分な統合に悩まされる。
本稿では,グローバルな文脈拡張型適応スパース畳み込みネットワークを提案する。
論文 参考訳(メタデータ) (2023-03-25T14:42:50Z) - Iterative Soft Shrinkage Learning for Efficient Image Super-Resolution [91.3781512926942]
画像超解像(SR)は、CNNからトランスフォーマーアーキテクチャへの広範なニューラルネットワーク設計を目撃している。
本研究は,市販のネットワーク設計を生かし,基礎となる計算オーバーヘッドを低減するため,超高解像度イテレーションにおけるネットワークプルーニングの可能性について検討する。
本研究では, ランダムネットワークのスパース構造を最適化し, 重要でない重みを小さめに微調整することにより, 反復型軟収縮率(ISS-P)法を提案する。
論文 参考訳(メタデータ) (2023-03-16T21:06:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。