論文の概要: InstanceRSR: Real-World Super-Resolution via Instance-Aware Representation Alignment
- arxiv url: http://arxiv.org/abs/2603.24240v1
- Date: Wed, 25 Mar 2026 12:27:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 21:06:11.285063
- Title: InstanceRSR: Real-World Super-Resolution via Instance-Aware Representation Alignment
- Title(参考訳): インスタンスRSR:インスタンス認識表現アライメントによる現実世界のスーパーリゾリューション
- Authors: Zixin Guo, Kai Zhao, Luyan Zhang,
- Abstract要約: 生成前の手法に基づく超解像法は、高品質で一貫した再構成を創出する際、顕著な進歩を遂げた。
しかし、複雑な現実世界のシーンにおいて、さまざまなオブジェクトインスタンスの詳細な詳細を回復するのに苦労することが多い。
この制限は主に、一般的に採用されているデノナイジング損失(例えば、MSE)が、インスタンスレベルの認識と回復を無視しながら、本質的にグローバルな一貫性を好んでいるためである。
- 参考スコア(独自算出の注目度): 6.761263337778605
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing real-world super-resolution (RSR) methods based on generative priors have achieved remarkable progress in producing high-quality and globally consistent reconstructions. However, they often struggle to recover fine-grained details of diverse object instances in complex real-world scenes. This limitation primarily arises because commonly adopted denoising losses (e.g., MSE) inherently favor global consistency while neglecting instance-level perception and restoration. To address this issue, we propose InstanceRSR, a novel RSR framework that jointly models semantic information and introduces instance-level feature alignment. Specifically, we employ low-resolution (LR) images as global consistency guidance while jointly modeling image data and semantic segmentation maps to enforce semantic relevance during sampling. Moreover, we design an instance representation learning module to align the diffusion latent space with the instance latent space, enabling instance-aware feature alignment, and further incorporate a scale alignment mechanism to enhance fine-grained perception and detail recovery. Benefiting from these designs, our approach not only generates photorealistic details but also preserves semantic consistency at the instance level. Extensive experiments on multiple real-world benchmarks demonstrate that InstanceRSR significantly outperforms existing methods in both quantitative metrics and visual quality, achieving new state-of-the-art (SOTA) performance.
- Abstract(参考訳): 既存の実世界のスーパーレゾリューション(RSR)手法は,高品質で一貫した再構築を実現する上で,顕著な進歩を遂げている。
しかし、複雑な現実世界のシーンにおいて、さまざまなオブジェクトインスタンスの詳細な詳細を回復するのに苦労することが多い。
この制限は主に、一般的に採用されている分極損失(例えば、MSE)が、インスタンスレベルの認識と復元を無視しながら、本質的にグローバルな一貫性を優先しているためである。
この問題に対処するため,セマンティック情報を共同でモデル化し,インスタンスレベルの特徴アライメントを導入する新しいRSRフレームワークであるInstanceRSRを提案する。
具体的には,画像データとセマンティックセグメンテーションマップを共同でモデル化し,サンプリング中に意味関係を強制しながら,低解像度(LR)画像を大域的整合性ガイダンスとして利用する。
さらに、拡散潜時空間をインスタンス潜時空間に整合させ、インスタンス認識機能アライメントを可能にするインスタンス表現学習モジュールを設計し、さらにスケールアライメント機構を組み込み、きめ細かい知覚と詳細回復を向上する。
これらの設計に適合して、我々のアプローチはフォトリアリスティックな詳細を生成するだけでなく、インスタンスレベルでの意味的一貫性も維持する。
複数の実世界のベンチマークに関する大規模な実験によると、インスタンスRSRは、定量的メトリクスと視覚的品質の両方において既存のメソッドを著しく上回り、新しい最先端(SOTA)パフォーマンスを実現している。
関連論文リスト
- API: Empowering Generalizable Real-World Image Dehazing via Adaptive Patch Importance Learning [12.516890497421203]
本稿では,現実のデハジングを一般化するための新しいアダプティブ・パッチ・コンパタンス・アウェア(API)フレームワークを提案する。
具体的には,自動ヘイズ生成(AHG)モジュールと密度認識ヘイズ除去(DHR)モジュールから構成される。
さらに,デハズド画像の曖昧さを軽減するために,MNCD(Multi-Negative Contrastive Dehazing)を新たに導入する。
論文 参考訳(メタデータ) (2026-01-05T10:53:41Z) - RS-ISRefiner: Towards Better Adapting Vision Foundation Models for Interactive Segmentation of Remote Sensing Images [17.648922817109224]
RS-ISRefinerは、リモートセンシング画像に適したクリックベースのIISフレームワークである。
セグメンテーション精度、効率、相互作用コストの点で、最先端IIS法を一貫して上回っている。
論文 参考訳(メタデータ) (2025-11-30T04:12:43Z) - Instance-Level Generation for Representation Learning [20.97048848139392]
インスタンスレベルの認識(ILR)は、幅広いカテゴリではなく個々のオブジェクトを特定することに焦点を当てている。
本稿では,複数のドメインから多様なオブジェクトインスタンスを合成的に生成する新しいアプローチを提案する。
本手法は,実画像に頼らずにILR固有の課題に最初に対処する手法である。
論文 参考訳(メタデータ) (2025-10-10T09:14:33Z) - Rotation Equivariant Arbitrary-scale Image Super-Resolution [62.41329042683779]
任意のスケールの超解像(ASISR)は、低解像度の入力画像から任意のスケールの高分解能回復を実現することを目的としている。
本研究では, 回転同変ASISR法の構築に尽力する。
論文 参考訳(メタデータ) (2025-08-07T08:51:03Z) - Unsupervised Image Super-Resolution Reconstruction Based on Real-World Degradation Patterns [4.977925450373957]
超解像再構成モデルのトレーニングのための新しいTripleGANフレームワークを提案する。
このフレームワークは、LR観測から実世界の劣化パターンを学習し、対応する劣化特性を持つデータセットを合成する。
本手法は, 過スムーズなアーティファクトを伴わずに, 鋭い復元を維持しながら, 定量的な測定値に明らかな利点を示す。
論文 参考訳(メタデータ) (2025-06-20T14:24:48Z) - From Controlled Scenarios to Real-World: Cross-Domain Degradation Pattern Matching for All-in-One Image Restoration [2.997052569698842]
All-in-One Image Restoration (AiOIR) は、統一されたパラメータを持つ単一モデルを用いて、複数の劣化パターンによる画像復元を実現することを目的としている。
UDAIRフレームワークは、ソースドメインからターゲットドメインへの学習知識を活用することにより、AiOIRを効果的に実現するために提案されている。
10のオープンソースデータセットの実験結果は、UDAIRがAiOIRタスクのための新しい最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2025-05-28T12:22:00Z) - Feature Alignment with Equivariant Convolutions for Burst Image Super-Resolution [52.55429225242423]
本稿では,同変畳み込みに基づくアライメントを特徴とするBurst Image Super-Resolution (BISR) のための新しいフレームワークを提案する。
これにより、アライメント変換は画像領域の明示的な監督を通じて学習でき、特徴領域に容易に適用できる。
BISRベンチマークの実験は、定量的メトリクスと視覚的品質の両方において、我々のアプローチの優れた性能を示している。
論文 参考訳(メタデータ) (2025-03-11T11:13:10Z) - Towards Realistic Data Generation for Real-World Super-Resolution [58.99206459754721]
RealDGenは、現実世界の超解像のために設計された教師なし学習データ生成フレームワークである。
我々は,コンテンツ分解脱結合拡散モデルに統合されたコンテンツと劣化抽出戦略を開発する。
実験により、RealDGenは、現実世界の劣化を反映する大規模で高品質なペアデータを生成するのに優れていることが示された。
論文 参考訳(メタデータ) (2024-06-11T13:34:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。