Fugu-MT 論文翻訳(概要): Learning to Balance: Decoupled Siamese Diffusion Transformer for Reference-Based Remote Sensing Image Super-Resolution

論文の概要: Learning to Balance: Decoupled Siamese Diffusion Transformer for Reference-Based Remote Sensing Image Super-Resolution

arxiv url: http://arxiv.org/abs/2605.17980v1
Date: Mon, 18 May 2026 07:35:21 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-19 17:57:48.999009
Title: Learning to Balance: Decoupled Siamese Diffusion Transformer for Reference-Based Remote Sensing Image Super-Resolution
Title（参考訳）: 参照型リモートセンシング画像スーパーリゾリューションのための分離されたシームズ拡散変圧器のバランス学習
Authors: Bin Luo, Runmin Dong, Zhaoyang Luo, Jinxiao Zhang, Jiyao Zhao, Fan Wei, Haohuan Fu,
Abstract要約: 本稿では,低分解能・参照相互作用をアテンションレベルで分離するDS-DiT法を提案する。低解像度の構造先行と参照テクスチャ情報を独立して相互作用させることで、このフレームワークはソース間の競合を効果的に軽減する。複数のデータセットとスケーリング要因にわたる実験結果から、DS-DiTは、定量的な測定値と視覚的忠実度の両方において、既存の手法よりも優れていることが示された。
参考スコア（独自算出の注目度）: 11.927644372248047
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Diffusion-based methods demonstrate significant potential for remote sensing image super-resolution at large scaling factors, particularly in reference-based super-resolution (RefSR) where high-resolution reference images provide critical fine-grained texture priors. However, existing methods often suffer from a trade-off between over-reliance on reference information, which leads to texture artifacts, and underutilization, which results in insufficient detail recovery. To address these issues, we propose DS-DiT, a Decoupled Siamese Diffusion Transformer method that decouples low-resolution and reference interactions at the attention level. By enabling low-resolution structural priors and reference texture information to interact independently with the noisy latent, the framework effectively mitigates inter-source competition. Furthermore, to compensate for the limited local modeling ability of global attention, we introduce a Patch-Level Weights (PLW) module that adaptively modulates the fusion of conditional sources. In addition, this siamese architecture facilitates an autoguidance strategy during inference, which enhances reconstruction by exploiting the prediction discrepancy between strong and weak reference conditions. This approach boosts generation quality without additional training. Experimental results across multiple datasets and scaling factors demonstrate that DS-DiT outperforms existing methods in both quantitative metrics and visual fidelity.
Abstract（参考訳）: 拡散法に基づく手法は、特にレファレンス・ベース・スーパーレゾリューション(RefSR)において、特に高解像度の参照画像が重要な微細なテクスチャ前駆体となるリモートセンシング画像の超解像の可能性を示す。しかし、既存の手法は、テクスチャのアーティファクトに繋がる参照情報への過度な信頼と、未利用との間にあるトレードオフに悩まされることが多く、詳細回復が不十分である。これらの問題に対処するため,低分解能・参照相互作用を注意レベルで分離するDS-DiT法を提案する。低分解能な構造先行と参照テクスチャ情報をノイズの少ない遅延と独立に相互作用させることで、このフレームワークはソース間の競合を効果的に軽減する。さらに、グローバルアテンションの限られた局所モデリング能力を補うために、条件付きソースの融合を適応的に調節するパッチレベルウェイト(PLW)モジュールを導入する。さらに、このシアムアーキテクチャは、推論中の自己誘導戦略を容易にし、強い参照条件と弱い参照条件との予測不一致を利用して再構築を促進する。このアプローチは、追加のトレーニングなしで生成品質を高める。複数のデータセットとスケーリング要因にわたる実験結果から、DS-DiTは、定量的な測定値と視覚的忠実度の両方において、既存の手法よりも優れていることが示された。

関連論文リスト

Rethinking Diffusion Model-Based Video Super-Resolution: Leveraging Dense Guidance from Aligned Features [51.5076190312734]
ビデオ超解法アプローチは、エラーの蓄積、空間的アーティファクト、知覚的品質と忠実さのトレードオフに悩まされる。ビデオ超解像(DGAF-VSR)に適した特徴を持つ新しい誘導拡散モデルを提案する。合成および実世界のデータセットの実験では、DGAF-VSRがVSRの重要な側面において最先端の手法を超越していることが示されている。
論文参考訳（メタデータ） (2025-11-21T03:40:45Z)
Controllable Reference Guided Diffusion with Local Global Fusion for Real World Remote Sensing Image Super Resolution [9.658727475375565]
超解像技術は、リモートセンシング画像の空間分解能を高め、より効率的な大規模な地球観測アプリケーションを可能にする。既存のRefSR手法は、クロスセンサーの解像度ギャップや重要な土地被覆の変化など、現実世界の複雑さに苦しむ。実世界リモートセンシング画像SRのための新しい制御可能な参照誘導拡散モデルであるCRefDiffを提案する。
論文参考訳（メタデータ） (2025-06-30T12:45:28Z)
Federated Low-Rank Tensor Estimation for Multimodal Image Reconstruction [9.075990246977891]
本研究では,大規模マルチモーダルデータを管理するために,タッカー分解を適用し,共同分解とランダムなスケッチ処理を取り入れたフェデレーション画像再構成手法を提案する。提案手法は,既存手法と比較して,再現性や通信圧縮に優れることを示す。
論文参考訳（メタデータ） (2025-02-04T23:02:46Z)
Detail-Enhancing Framework for Reference-Based Image Super-Resolution [8.899312174844725]
参照型超解像のためのDEF(Detail-Enhancing Framework)を提案する。提案手法は,比較した数値結果を維持しながら,優れた視覚的結果が得られる。
論文参考訳（メタデータ） (2024-05-01T10:27:22Z)
Building Bridges across Spatial and Temporal Resolutions: Reference-Based Super-Resolution via Change Priors and Conditional Diffusion Model [13.368558322546784]
RefSRは、リモートセンシング画像の空間的および時間的解像度にまたがる橋を構築する可能性がある。条件付き拡散モデルにより、現実的な高解像度画像を生成する新たな機会が開かれた。本稿では,RefSRに対するRef-Diffを提案する。
論文参考訳（メタデータ） (2024-03-26T07:48:49Z)
Reti-Diff: Illumination Degradation Image Restoration with Retinex-based Latent Diffusion Model [59.08821399652483]
照明劣化画像復元(IDIR)技術は、劣化した画像の視認性を改善し、劣化した照明の悪影響を軽減することを目的としている。これらのアルゴリズムのうち、拡散モデル(DM)に基づく手法は期待できる性能を示しているが、画像レベルの分布を予測する際に、重い計算要求や画素の不一致の問題に悩まされることが多い。我々は、コンパクトな潜在空間内でDMを活用して、簡潔な指導先を生成することを提案し、IDIRタスクのためのReti-Diffと呼ばれる新しいソリューションを提案する。 Reti-Diff は Retinex-based Latent DM (RLDM) と Retinex-Guided Transformer (RG) の2つの鍵成分からなる。
論文参考訳（メタデータ） (2023-11-20T09:55:06Z)
ESSAformer: Efficient Transformer for Hyperspectral Image Super-resolution [76.7408734079706]
単一ハイパースペクトル像超解像(単一HSI-SR)は、低分解能観測から高分解能ハイパースペクトル像を復元することを目的としている。本稿では,1つのHSI-SRの繰り返し精製構造を持つESSA注目組込みトランスフォーマネットワークであるESSAformerを提案する。
論文参考訳（メタデータ） (2023-07-26T07:45:14Z)
Hierarchical Similarity Learning for Aliasing Suppression Image Super-Resolution [64.15915577164894]
エイリアスの影響を抑制するために階層画像超解像ネットワーク(HSRNet)を提案する。 HSRNetは、他の作品よりも定量的かつ視覚的なパフォーマンスを向上し、エイリアスをより効果的に再送信する。
論文参考訳（メタデータ） (2022-06-07T14:55:32Z)
DepthFormer: Exploiting Long-Range Correlation and Local Information for Accurate Monocular Depth Estimation [50.08080424613603]
高精度な単分子深度推定には長距離相関が不可欠である。我々は,このグローバルコンテキストを効果的な注意機構でモデル化するためにTransformerを活用することを提案する。提案したモデルであるDepthFormerは、最先端のモノクル深度推定手法をはるかに超えている。
論文参考訳（メタデータ） (2022-03-27T05:03:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。