論文の概要: Two-Stage Random Alternation Framework for Zero-Shot Pansharpening
- arxiv url: http://arxiv.org/abs/2505.06576v1
- Date: Sat, 10 May 2025 09:26:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-13 20:21:48.920914
- Title: Two-Stage Random Alternation Framework for Zero-Shot Pansharpening
- Title(参考訳): ゼロショットパンシャーピングのための2段階ランダム交換フレームワーク
- Authors: Haorui Chen, Zeyu Ren, Jiaxuan Ren, Ran Ran, Jinliang Shao, Jie Huang, Liangjian Deng,
- Abstract要約: 縮小解像度画像からの強い監督制約をフル解像度画像の物理的特性と統合する2段階ランダム交互化フレームワーク(TRA-PAN)を提案する。
フル解像度の画像を頼りにすることで、単一の画像ペアでゼロショットトレーニングが可能となり、大規模なデータセットの必要性を回避できる。
- 参考スコア(独自算出の注目度): 12.385955231193675
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, pansharpening has seen rapid advancements with deep learning methods, which have demonstrated impressive fusion quality. However, the challenge of acquiring real high-resolution images limits the practical applicability of these methods. To address this, we propose a two-stage random alternating framework (TRA-PAN) that effectively integrates strong supervision constraints from reduced-resolution images with the physical characteristics of full-resolution images. The first stage introduces a pre-training procedure, which includes Degradation-Aware Modeling (DAM) to capture spatial-spectral degradation mappings, alongside a warm-up procedure designed to reduce training time and mitigate the negative effects of reduced-resolution data. In the second stage, Random Alternation Optimization (RAO) is employed, where random alternating training leverages the strengths of both reduced- and full-resolution images, further optimizing the fusion model. By primarily relying on full-resolution images, our method enables zero-shot training with just a single image pair, obviating the need for large datasets. Experimental results demonstrate that TRA-PAN outperforms state-of-the-art (SOTA) methods in both quantitative metrics and visual quality in real-world scenarios, highlighting its strong practical applicability.
- Abstract(参考訳): 近年,パンシャーペニングは深層学習法によって急速に進歩し,融合品質が著しく向上している。
しかし、実際の高解像度画像を取得するという課題は、これらの手法の適用性を制限している。
そこで本研究では,高解像度画像からの強い監督制約をフル解像度画像の物理的特性と効果的に統合する2段階ランダム交互化フレームワーク(TRA-PAN)を提案する。
第1ステージでは、空間スペクトル分解マッピングをキャプチャするための劣化認識モデリング(DAM)を含む事前トレーニング手順と、トレーニング時間を短縮し、解像度の低下したデータの負の効果を軽減するように設計されたウォームアップ手順が導入されている。
第2段階ではランダム交互最適化(RAO)が採用され、ランダム交互トレーニングは縮小画像とフル解像度画像の両方の強度を活用し、融合モデルをさらに最適化する。
本手法は,主にフル解像度の画像に頼っているため,単一の画像ペアでゼロショットトレーニングが可能であり,大規模なデータセットの必要性を回避できる。
実験結果から,TRA-PANは実世界のシナリオにおける定量的指標と視覚的品質の両方において,最先端(SOTA)手法よりも優れており,実用性が高いことが示された。
関連論文リスト
- Enhanced Semantic Extraction and Guidance for UGC Image Super Resolution [18.058473238611725]
本稿では,拡散フレームワークにセマンティックガイダンスを組み込むことにより,画像超解像に対する新しいアプローチを提案する。
本手法は,野生データセットと合成データセットの劣化の矛盾に対処する。
我々のモデルは、CVIRE 2025Short-form Image Super-Resolution Challengeで2位を獲得した。
論文 参考訳(メタデータ) (2025-04-14T05:26:24Z) - AP-LDM: Attentive and Progressive Latent Diffusion Model for Training-Free High-Resolution Image Generation [12.564266865237343]
遅延拡散モデル(LDM)は、しばしば高分解能(HR)画像を直接生成する際に重要な構造歪みを経験する。
生成プロセスの高速化を図り,HR画像の品質向上を目的とした注意・進歩型LDM(Attentive and Progressive LDM)を提案する。
AP-LDM は LDM の分解過程を, (i) 注意的訓練分解性脱ノイズ, (ii) 進行性高分解能脱ノイズの2段階に分解する。
論文 参考訳(メタデータ) (2024-10-08T13:56:28Z) - Degradation-Guided One-Step Image Super-Resolution with Diffusion Priors [75.24313405671433]
拡散に基づく画像超解像法 (SR) は、事前訓練された大規模なテキスト・画像拡散モデルを先行として活用することにより、顕著な成功を収めた。
本稿では,拡散型SR手法の効率問題に対処する新しい一段階SRモデルを提案する。
既存の微調整戦略とは異なり、SR専用の劣化誘導低ランク適応 (LoRA) モジュールを設計した。
論文 参考訳(メタデータ) (2024-09-25T16:15:21Z) - One Step Diffusion-based Super-Resolution with Time-Aware Distillation [60.262651082672235]
拡散に基づく画像超解像(SR)法は,低解像度画像から細部まで細部まで,高解像度画像の再構成に有望であることを示す。
近年,拡散型SRモデルの知識蒸留によるサンプリング効率の向上が試みられている。
我々は,効率的な画像超解像を実現するため,TAD-SRというタイムアウェア拡散蒸留法を提案する。
論文 参考訳(メタデータ) (2024-08-14T11:47:22Z) - OmniSSR: Zero-shot Omnidirectional Image Super-Resolution using Stable Diffusion Model [6.83367289911244]
ODI(Omnidirectional Image)は、現実世界の視覚タスクで一般的に使われ、高解像度のODIは関連する視覚タスクのパフォーマンス向上に役立つ。
ODIの既存の超解像法のほとんどはエンドツーエンドの学習戦略を用いており、結果として生成された画像の劣る現実性をもたらす。
論文 参考訳(メタデータ) (2024-04-16T06:39:37Z) - Noise-free Optimization in Early Training Steps for Image
Super-Resolution [20.169700745745462]
本研究では,対象のHR画像を2つのサブコンポーネントに分解することで,基礎となる構成要素をよりよく理解することを目的とする。
本研究は, SISRの誤った性質を把握できないことを示唆するものである。
本研究では,バニラ訓練の初期段階において,固有雑音項を効果的に除去できる新しい最適化手法を提案する。
論文 参考訳(メタデータ) (2023-12-29T09:13:09Z) - Gradient constrained sharpness-aware prompt learning for vision-language
models [99.74832984957025]
本稿では,視覚言語モデル(VLM)の一般化可能な即時学習における新たなトレードオフ問題を提案する。
最先端手法のロスランドスケープとSAMに基づくバニラシャープネス認識最小化法を解析することにより、トレードオフ性能は損失値と損失シャープネスの両方に相関していると結論付けた。
本稿では,GCSCoOp (Gradient Constrained Sharpness-Aware Context Optimization) と表記される,素早い学習のためのSAMベースの新しい手法を提案する。
論文 参考訳(メタデータ) (2023-09-14T17:13:54Z) - Real-World Image Super-Resolution by Exclusionary Dual-Learning [98.36096041099906]
実世界の画像超解像は,高品質な画像を得るための実用的な画像復元問題である。
深層学習に基づく手法は、現実世界の超解像データセットの復元に期待できる品質を実現している。
本稿では,RWSR-EDL(Real-World Image Super-Resolution by Exclusionary Dual-Learning)を提案する。
論文 参考訳(メタデータ) (2022-06-06T13:28:15Z) - Towards Bidirectional Arbitrary Image Rescaling: Joint Optimization and
Cycle Idempotence [76.93002743194974]
本稿では、任意の再スケーリング(アップスケーリングとダウンスケーリングの両方)を統一プロセスとして扱う方法を提案する。
提案モデルでは、アップスケーリングとダウンスケーリングを同時に学習し、双方向の任意のイメージ再スケーリングを実現する。
繰り返しにダウンスケーリング・アップスケーリング・サイクルが適用された場合, 復元精度が著しく低下することなく, サイクルイデオポテンス試験において堅牢であることが確認された。
論文 参考訳(メタデータ) (2022-03-02T07:42:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。