論文の概要: Fast Model-guided Instance-wise Adaptation Framework for Real-world Pansharpening with Fidelity Constraints
- arxiv url: http://arxiv.org/abs/2604.08903v1
- Date: Fri, 10 Apr 2026 03:12:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.658201
- Title: Fast Model-guided Instance-wise Adaptation Framework for Real-world Pansharpening with Fidelity Constraints
- Title(参考訳): 忠実度制約付き実世界のパンシャルペンのための高速モデル誘導型インスタンスワイズ適応フレームワーク
- Authors: Zhiqi Yang, Jin-Liang Xiao, Shan Yin, Liang-Jian Deng, Gemine Vivone,
- Abstract要約: Pansharpeningは、低分解能マルチスペクトル(LRMS)と高分解能パンクロマティック(PAN)画像を融合して高分解能マルチスペクトル(HRMS)画像を生成することを目的としている。
ディープラーニング(DL)ベースのパンシャーピング手法は、優れたパフォーマンスを実現するが、高いトレーニングコストと大規模なデータセットを必要とする。
最近のゼロショット法は、単一のPAN/LRMSペアで訓練されており、強いが、核融合品質、高い計算オーバーヘッド、遅い収束に悩まされている。
- 参考スコア(独自算出の注目度): 23.251053308622186
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pansharpening aims to generate high-resolution multispectral (HRMS) images by fusing low-resolution multispectral (LRMS) and high-resolution panchromatic (PAN) images while preserving both spectral and spatial information. Although deep learning (DL)-based pansharpening methods achieve impressive performance, they require high training cost and large datasets, and often degrade when the test distribution differs from training, limiting generalization. Recent zero-shot methods, trained on a single PAN/LRMS pair, offer strong generalization but suffer from limited fusion quality, high computational overhead, and slow convergence. To address these issues, we propose FMG-Pan, a fast and generalizable model-guided instance-wise adaptation framework for real-world pansharpening, achieving both cross-sensor generality and rapid training-inference. The framework leverages a pretrained model to guide a lightweight adaptive network through joint optimization with spectral and physical fidelity constraints. We further design a novel physical fidelity term to enhance spatial detail preservation. Extensive experiments on real-world datasets under both intra- and cross-sensor settings demonstrate state-of-the-art performance. On the WorldView-3 dataset, FMG-Pan completes training and inference for a 512x512x8 image within 3 seconds on an RTX 3090 GPU, significantly faster than existing zero-shot methods, making it suitable for practical deployment.
- Abstract(参考訳): Pansharpeningは、低分解能マルチスペクトル(LRMS)と高分解能パンクロマティック(PAN)画像を融合させて高分解能マルチスペクトル(HRMS)画像を生成することを目的としており、スペクトル情報と空間情報の両方を保存している。
ディープラーニング(DL)ベースのパンシャーピング手法は優れたパフォーマンスを実現するが、高いトレーニングコストと大規模なデータセットが必要であり、テスト分布がトレーニングと異なる場合にしばしば劣化し、一般化が制限される。
最近のゼロショット法は、単一のPAN/LRMSペアで訓練され、強力な一般化を提供するが、融合品質の制限、高い計算オーバーヘッド、緩やかな収束に悩まされている。
これらの問題に対処するために,FMG-Panを提案する。FMG-Panは実世界のパンシャーピングのための高速で一般化可能なモデル誘導型インスタンス適応フレームワークであり,クロスセンサの汎用性と迅速なトレーニング推論の両方を実現する。
このフレームワークは、事前訓練されたモデルを利用して、スペクトルおよび物理的忠実度制約を伴う共同最適化を通じて、軽量適応ネットワークを誘導する。
さらに,空間的細部保存を高めるために,新しい物理忠実度項を設計する。
センサー内およびクロスセンサー設定下の実世界のデータセットに対する大規模な実験は、最先端のパフォーマンスを示している。
WorldView-3データセットで、FMG-PanはRTX 3090 GPU上で3秒以内に512x512x8イメージのトレーニングと推論を完了し、既存のゼロショットメソッドよりも大幅に高速である。
関連論文リスト
- TIMI: Training-Free Image-to-3D Multi-Instance Generation with Spatial Fidelity [126.89088014048001]
本研究では,高空間忠実度を実現する画像から3次元のマルチインスタンス生成のためのトレーニングフリーフレームワークを提案する。
具体的には、まずインスタンス認識分離誘導(ISG)モジュールを導入し、インスタンスのアンタングル化を容易にする。
次に、空間適応型幾何安定化更新(SGU)モジュールを考案し、インスタンスの幾何学的特性の保存を促進する。
論文 参考訳(メタデータ) (2026-03-02T02:10:28Z) - Scaling Text-to-Image Diffusion Transformers with Representation Autoencoders [74.72147962028265]
表現オートエンコーダ(RAE)は、ImageNet上で拡散モデリングにおいて明確な利点を示している。
本稿では,このフレームワークが大規模でフリーフォームなテキスト・ツー・イメージ(T2I)生成に拡張できるかどうかを検討する。
論文 参考訳(メタデータ) (2026-01-22T18:58:16Z) - API: Empowering Generalizable Real-World Image Dehazing via Adaptive Patch Importance Learning [12.516890497421203]
本稿では,現実のデハジングを一般化するための新しいアダプティブ・パッチ・コンパタンス・アウェア(API)フレームワークを提案する。
具体的には,自動ヘイズ生成(AHG)モジュールと密度認識ヘイズ除去(DHR)モジュールから構成される。
さらに,デハズド画像の曖昧さを軽減するために,MNCD(Multi-Negative Contrastive Dehazing)を新たに導入する。
論文 参考訳(メタデータ) (2026-01-05T10:53:41Z) - MuSASplat: Efficient Sparse-View 3D Gaussian Splats via Lightweight Multi-Scale Adaptation [92.57609195819647]
MuSASplatは、ポーズなしフィードフォワード3Dガウスモデルの計算負担を劇的に削減する新しいフレームワークである。
我々のアプローチの中心は、ほんのわずかなトレーニングパラメータだけで、ViTベースのアーキテクチャを効率的に微調整できる軽量なマルチスケールアダプタである。
論文 参考訳(メタデータ) (2025-12-08T04:56:46Z) - SWIFT: A General Sensitive Weight Identification Framework for Fast Sensor-Transfer Pansharpening [16.578857961692716]
Pansharpeningは、高分解能パノクロマトグラフィ(PAN)画像と低分解能マルチスペクトル(LRMS)画像を融合して高分解能マルチスペクトル(HRMS)画像を生成することを目的としている。
深層学習に基づく手法は有望な性能を達成したが、通常、目に見えないセンサーのデータに適用すると、厳しい性能劣化に悩まされる。
クロスセンサ適応のための高速かつ汎用的なフレームワークSWIFTを提案する。
論文 参考訳(メタデータ) (2025-07-27T15:06:05Z) - Improving Progressive Generation with Decomposable Flow Matching [50.63174319509629]
Decomposable Flow Matching (DFM)は、ビジュアルメディアのプログレッシブな生成のためのシンプルで効果的なフレームワークである。
Imagenet-1k 512pxでは、DFMはベースアーキテクチャよりも35.2%改善され、ベースラインは26.4%向上した。
論文 参考訳(メタデータ) (2025-06-24T17:58:02Z) - Two-Stage Random Alternation Framework for One-Shot Pansharpening [12.385955231193675]
本稿では,任意のマルチスペクトル(MS)/パンクロマティック(PAN)ペアに対して,インスタンス固有の最適化を行う2段階ランダム交互化フレームワーク(TRA-PAN)を提案する。
TRA-PANは、縮小解像度画像からの強い監督制約とフル解像度画像の物理的特性を効果的に統合する。
実験の結果,TRA-PANは実世界のシナリオにおいて,定量的な測定値と視覚的品質において,最先端(SOTA)手法よりも優れていた。
論文 参考訳(メタデータ) (2025-05-10T09:26:22Z) - CAT: A Conditional Adaptation Tailor for Efficient and Effective Instance-Specific Pansharpening on Real-World Data [7.471505633354803]
本稿では、特定の入力インスタンスに適応し、トレーニングと推論の両方を短時間で完了する効率的なフレームワークを提案する。
本手法は,512times512$イメージのトレーニングと推論の両方を,textit0.4 seconds$で実現する。
論文 参考訳(メタデータ) (2025-04-14T14:04:55Z) - Efficient-3DiM: Learning a Generalizable Single-image Novel-view
Synthesizer in One Day [63.96075838322437]
シングルイメージのノベルビューシンセサイザーを学習するためのフレームワークを提案する。
当社のフレームワークは,トレーニング時間を10日以内から1日未満に短縮することが可能です。
論文 参考訳(メタデータ) (2023-10-04T17:57:07Z) - Learning Deformable Image Registration from Optimization: Perspective,
Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。
我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文 参考訳(メタデータ) (2020-04-30T03:23:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。