Fugu-MT 論文翻訳(概要): Two-Stage Random Alternation Framework for One-Shot Pansharpening

論文の概要: Two-Stage Random Alternation Framework for One-Shot Pansharpening

arxiv url: http://arxiv.org/abs/2505.06576v2
Date: Fri, 16 May 2025 10:39:40 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-19 12:32:17.863372
Title: Two-Stage Random Alternation Framework for One-Shot Pansharpening
Title（参考訳）: ワンショットパンシャーピングのための2段階ランダム交換フレームワーク
Authors: Haorui Chen, Zeyu Ren, Jiaxuan Ren, Ran Ran, Jinliang Shao, Jie Huang, Liangjian Deng,
Abstract要約: 本稿では,任意のマルチスペクトル(MS)/パンクロマティック(PAN)ペアに対して,インスタンス固有の最適化を行う2段階ランダム交互化フレームワーク(TRA-PAN)を提案する。 TRA-PANは、縮小解像度画像からの強い監督制約とフル解像度画像の物理的特性を効果的に統合する。実験の結果,TRA-PANは実世界のシナリオにおいて,定量的な測定値と視覚的品質において,最先端(SOTA)手法よりも優れていた。
参考スコア（独自算出の注目度）: 12.385955231193675
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Deep learning has substantially advanced pansharpening, achieving impressive fusion quality. However, a prevalent limitation is that conventional deep learning models, which typically rely on training datasets, often exhibit suboptimal generalization to unseen real-world image pairs. This restricts their practical utility when faced with real-world scenarios not included in the training datasets. To overcome this, we introduce a two-stage random alternating framework (TRA-PAN) that performs instance-specific optimization for any given Multispectral(MS)/Panchromatic(PAN) pair, ensuring robust and high-quality fusion. TRA-PAN effectively integrates strong supervision constraints from reduced-resolution images with the physical characteristics of the full-resolution images. The first stage introduces a pre-training procedure, which includes Degradation-Aware Modeling (DAM) to capture spectral degradation mappings, alongside a warm-up procedure designed to reduce training time and mitigate the adverse effects of reduced-resolution data. The second stage employs Random Alternation Optimization (RAO), randomly alternating between reduced- and full-resolution images to refine the fusion model progressively. This adaptive, per-instance optimization strategy, operating in a one-shot manner for each MS/PAN pair, yields superior high-resolution multispectral images. Experimental results demonstrate that TRA-PAN outperforms state-of-the-art (SOTA) methods in quantitative metrics and visual quality in real-world scenarios, underscoring its enhanced practical applicability and robustness.
Abstract（参考訳）: 深層学習はパンシャーペンが大幅に進歩し、優れた融合品質を実現している。しかし、一般的な訓練データセットに依存する従来のディープラーニングモデルは、実世界の画像対に最適でない一般化を示すことが多い。これにより、トレーニングデータセットに含まれない実世界のシナリオに直面した場合、実用性が制限される。そこで本研究では,任意のMultispectral(MS)/Panchromatic(PAN)ペアに対して,インスタンス固有の最適化を行う2段階ランダム交互化フレームワーク(TRA-PAN)を導入し,堅牢かつ高品質な融合を実現する。 TRA-PANは、縮小解像度画像からの強い監督制約とフル解像度画像の物理的特性を効果的に統合する。第1ステージでは、スペクトル劣化マッピングを捉えるための劣化認識モデリング(DAM)を含む事前トレーニング手順と、トレーニング時間を短縮し、解像度の低下したデータの悪影響を軽減するために設計されたウォームアップ手順が導入されている。第2段階ではランダム交代最適化(RAO)を採用し、縮小像とフル解像度像をランダムに交互に交互に交互に融合モデルを改良する。この適応型/インスタンスごとの最適化戦略は、各MS/PAN対に対してワンショットで動作し、高分解能マルチスペクトル画像を得る。実験結果から,TRA-PANは実世界のシナリオにおける計測値と視覚的品質において,最先端(SOTA)手法よりも優れており,実用性と堅牢性の向上が示されている。

関連論文リスト

CHROMA: Consistent Harmonization of Multi-View Appearance via Bilateral Grid Prediction [30.088316989385106]
カメラパイプラインは、露光調整、ホワイトバランス、色補正など、デバイス上の広範な処理を適用する。外観の変化は複数ビューの一貫性に反し、新しいビュー合成を劣化させる。多視点一貫した方法で測光変動を補正するために、空間適応型二元格子を予測できる一般化可能なフィードフォワード手法を提案する。
論文参考訳（メタデータ） (2025-07-21T16:03:58Z)
Progressive Alignment Degradation Learning for Pansharpening [3.7939736380306552]
深層学習に基づくパンシャーピングにより,高分解能マルチスペクトル画像(HRMS)を効果的に生成できることが示されている。 Waldプロトコルは、人工低解像度データで訓練されたネットワークが、高解像度データでも同じように機能すると仮定する。本稿では,PAlignNetとPDegradeNetという2つのサブネットワーク間の相互イテレーションを用いて,正確な劣化過程を適応的に学習するPADMを提案する。
論文参考訳（メタデータ） (2025-06-25T07:07:32Z)
Enhanced Semantic Extraction and Guidance for UGC Image Super Resolution [18.058473238611725]
本稿では,拡散フレームワークにセマンティックガイダンスを組み込むことにより,画像超解像に対する新しいアプローチを提案する。本手法は,野生データセットと合成データセットの劣化の矛盾に対処する。我々のモデルは、CVIRE 2025Short-form Image Super-Resolution Challengeで2位を獲得した。
論文参考訳（メタデータ） (2025-04-14T05:26:24Z)
CTSR: Controllable Fidelity-Realness Trade-off Distillation for Real-World Image Super Resolution [52.93785843453579]
実世界の画像超解像は、2つの重要な評価基準が元の画像への忠実さと生成された結果の視覚的現実性である、重要な画像処理タスクである。本稿では,複数の教師モデルの性能上の利点とともに,忠実度と現実性の両方を幾何学的に分解する蒸留方式を提案する。いくつかの実世界の画像超解像ベンチマークで行った実験により,本手法が既存の最先端手法を超越していることが証明された。
論文参考訳（メタデータ） (2025-03-18T14:06:39Z)
FoundIR: Unleashing Million-scale Training Data to Advance Foundation Models for Image Restoration [66.61201445650323]
既存の手法は現実のシナリオにおける一般化ボトルネックに悩まされる。既存のトレーニングデータに対して,2つの大きなメリットがある,100万規模のデータセットをコントリビュートしています。実世界のシナリオにおいて,より広範囲の復元作業に対処するために,ロバストなモデルFoundIRを提案する。
論文参考訳（メタデータ） (2024-12-02T12:08:40Z)
AP-LDM: Attentive and Progressive Latent Diffusion Model for Training-Free High-Resolution Image Generation [12.564266865237343]
遅延拡散モデル(LDM)は、しばしば高分解能(HR)画像を直接生成する際に重要な構造歪みを経験する。生成プロセスの高速化を図り,HR画像の品質向上を目的とした注意・進歩型LDM(Attentive and Progressive LDM)を提案する。 AP-LDM は LDM の分解過程を, (i) 注意的訓練分解性脱ノイズ, (ii) 進行性高分解能脱ノイズの2段階に分解する。
論文参考訳（メタデータ） (2024-10-08T13:56:28Z)
Degradation-Guided One-Step Image Super-Resolution with Diffusion Priors [75.24313405671433]
拡散に基づく画像超解像法 (SR) は、事前訓練された大規模なテキスト・画像拡散モデルを先行として活用することにより、顕著な成功を収めた。本稿では,拡散型SR手法の効率問題に対処する新しい一段階SRモデルを提案する。既存の微調整戦略とは異なり、SR専用の劣化誘導低ランク適応 (LoRA) モジュールを設計した。
論文参考訳（メタデータ） (2024-09-25T16:15:21Z)
Efficient One-Step Diffusion Refinement for Snapshot Compressive Imaging [8.819370643243012]
Coded Aperture Snapshot Spectral Imaging (CASSI)は3次元マルチスペクトル画像(MSI)を撮影するための重要な技術である現在の最先端の手法は、主にエンドツーエンドであり、高周波の詳細を再構築する際の制限に直面している。本稿では,Snapshot Compressive Imagingのための自己教師型適応フレームワークにおいて,新しい1段階拡散確率モデルを提案する。
論文参考訳（メタデータ） (2024-09-11T17:02:10Z)
One Step Diffusion-based Super-Resolution with Time-Aware Distillation [60.262651082672235]
拡散に基づく画像超解像(SR)法は,低解像度画像から細部まで細部まで,高解像度画像の再構成に有望であることを示す。近年,拡散型SRモデルの知識蒸留によるサンプリング効率の向上が試みられている。我々は,効率的な画像超解像を実現するため,TAD-SRというタイムアウェア拡散蒸留法を提案する。
論文参考訳（メタデータ） (2024-08-14T11:47:22Z)
Inter-slice Super-resolution of Magnetic Resonance Images by Pre-training and Self-supervised Fine-tuning [49.197385954021456]
臨床実践では、2次元磁気共鳴(MR)シーケンスが広く採用されている。個々の2次元スライスを積み重ねて3次元ボリュームを形成できるが、比較的大きなスライスススペーシングは可視化とその後の解析タスクに課題をもたらす可能性がある。スライス間隔を低減するため,ディープラーニングに基づく超解像技術が広く研究されている。現在のほとんどのソリューションは、教師付きトレーニングのために、かなりの数の高解像度と低解像度の画像を必要とするが、通常は現実のシナリオでは利用できない。
論文参考訳（メタデータ） (2024-06-10T02:20:26Z)
OmniSSR: Zero-shot Omnidirectional Image Super-Resolution using Stable Diffusion Model [6.83367289911244]
ODI(Omnidirectional Image)は、現実世界の視覚タスクで一般的に使われ、高解像度のODIは関連する視覚タスクのパフォーマンス向上に役立つ。 ODIの既存の超解像法のほとんどはエンドツーエンドの学習戦略を用いており、結果として生成された画像の劣る現実性をもたらす。
論文参考訳（メタデータ） (2024-04-16T06:39:37Z)
Noise-free Optimization in Early Training Steps for Image Super-Resolution [20.169700745745462]
本研究では,対象のHR画像を2つのサブコンポーネントに分解することで,基礎となる構成要素をよりよく理解することを目的とする。本研究は, SISRの誤った性質を把握できないことを示唆するものである。本研究では,バニラ訓練の初期段階において,固有雑音項を効果的に除去できる新しい最適化手法を提案する。
論文参考訳（メタデータ） (2023-12-29T09:13:09Z)
Gradient constrained sharpness-aware prompt learning for vision-language models [99.74832984957025]
本稿では,視覚言語モデル(VLM)の一般化可能な即時学習における新たなトレードオフ問題を提案する。最先端手法のロスランドスケープとSAMに基づくバニラシャープネス認識最小化法を解析することにより、トレードオフ性能は損失値と損失シャープネスの両方に相関していると結論付けた。本稿では,GCSCoOp (Gradient Constrained Sharpness-Aware Context Optimization) と表記される,素早い学習のためのSAMベースの新しい手法を提案する。
論文参考訳（メタデータ） (2023-09-14T17:13:54Z)
Hybrid-Supervised Dual-Search: Leveraging Automatic Learning for Loss-free Multi-Exposure Image Fusion [60.221404321514086]
マルチ露光画像融合(MEF)は、様々な露光レベルを表すデジタルイメージングの限界に対処するための重要な解決策である。本稿では、ネットワーク構造と損失関数の両方を自動設計するための二段階最適化探索方式であるHSDS-MEFと呼ばれるMEFのためのハイブリッドスーパービジョンデュアルサーチ手法を提案する。
論文参考訳（メタデータ） (2023-09-03T08:07:26Z)
Real-World Image Super-Resolution by Exclusionary Dual-Learning [98.36096041099906]
実世界の画像超解像は,高品質な画像を得るための実用的な画像復元問題である。深層学習に基づく手法は、現実世界の超解像データセットの復元に期待できる品質を実現している。本稿では,RWSR-EDL(Real-World Image Super-Resolution by Exclusionary Dual-Learning)を提案する。
論文参考訳（メタデータ） (2022-06-06T13:28:15Z)
Towards Bidirectional Arbitrary Image Rescaling: Joint Optimization and Cycle Idempotence [76.93002743194974]
本稿では、任意の再スケーリング(アップスケーリングとダウンスケーリングの両方)を統一プロセスとして扱う方法を提案する。提案モデルでは、アップスケーリングとダウンスケーリングを同時に学習し、双方向の任意のイメージ再スケーリングを実現する。繰り返しにダウンスケーリング・アップスケーリング・サイクルが適用された場合, 復元精度が著しく低下することなく, サイクルイデオポテンス試験において堅牢であることが確認された。
論文参考訳（メタデータ） (2022-03-02T07:42:15Z)
Characteristic Regularisation for Super-Resolving Face Images [81.84939112201377]
既存の顔画像超解像法(SR)は、主に人工的にダウンサンプリングされた低解像度(LR)画像の改善に焦点を当てている。従来の非教師なしドメイン適応(UDA)手法は、未ペアの真のLRとHRデータを用いてモデルをトレーニングすることでこの問題に対処する。これにより、視覚的特徴を構成することと、画像の解像度を高めることの2つのタスクで、モデルをオーバーストレッチする。従来のSRモデルとUDAモデルの利点を結合する手法を定式化する。
論文参考訳（メタデータ） (2019-12-30T16:27:24Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。