論文の概要: Restoration Adaptation for Semantic Segmentation on Low Quality Images
- arxiv url: http://arxiv.org/abs/2602.14042v1
- Date: Sun, 15 Feb 2026 08:13:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-17 14:17:28.620606
- Title: Restoration Adaptation for Semantic Segmentation on Low Quality Images
- Title(参考訳): 低画質画像におけるセマンティックセグメンテーションの復元適応
- Authors: Kai Guan, Rongyuan Wu, Shuai Li, Wentao Zhu, Wenjun Zeng, Lei Zhang,
- Abstract要約: 実世界のシナリオでは、低品質(LQ)画像を処理する際にセマンティックセグメンテーションのパフォーマンスが劣化することが多い。
本稿では,セグメンテーション先行を復元モデルに注入するセマンティック・トレーニング・リカバリ(SCR)モデルを提案する。
そして、RASSは意味回復の知識をLoRAベースのモジュールマージとタスク固有の微調整を通じてセグメンテーションに転送する。
- 参考スコア(独自算出の注目度): 29.60165376603045
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In real-world scenarios, the performance of semantic segmentation often deteriorates when processing low-quality (LQ) images, which may lack clear semantic structures and high-frequency details. Although image restoration techniques offer a promising direction for enhancing degraded visual content, conventional real-world image restoration (Real-IR) models primarily focus on pixel-level fidelity and often fail to recover task-relevant semantic cues, limiting their effectiveness when directly applied to downstream vision tasks. Conversely, existing segmentation models trained on high-quality data lack robustness under real-world degradations. In this paper, we propose Restoration Adaptation for Semantic Segmentation (RASS), which effectively integrates semantic image restoration into the segmentation process, enabling high-quality semantic segmentation on the LQ images directly. Specifically, we first propose a Semantic-Constrained Restoration (SCR) model, which injects segmentation priors into the restoration model by aligning its cross-attention maps with segmentation masks, encouraging semantically faithful image reconstruction. Then, RASS transfers semantic restoration knowledge into segmentation through LoRA-based module merging and task-specific fine-tuning, thereby enhancing the model's robustness to LQ images. To validate the effectiveness of our framework, we construct a real-world LQ image segmentation dataset with high-quality annotations, and conduct extensive experiments on both synthetic and real-world LQ benchmarks. The results show that SCR and RASS significantly outperform state-of-the-art methods in segmentation and restoration tasks. Code, models, and datasets will be available at https://github.com/Ka1Guan/RASS.git.
- Abstract(参考訳): 実世界のシナリオでは、セマンティックセグメンテーションの性能は低品質(LQ)の画像を処理する際に劣化することが多く、明確なセマンティック構造や高周波の詳細が欠如している。
画像復元技術は、劣化した視覚コンテンツを向上するための有望な方向を提供するが、従来の実世界の画像復元(Real-IR)モデルは、主にピクセルレベルの忠実さに焦点を当てており、しばしばタスク関連セマンティックキューの回復に失敗し、下流の視覚タスクに直接適用した場合の有効性を制限している。
逆に、高品質なデータに基づいてトレーニングされた既存のセグメンテーションモデルは、現実世界の劣化の下で堅牢さを欠いている。
本稿では,意味的イメージ復元をセグメント化プロセスに効果的に統合し,LQ画像の高品質なセマンティックセマンティックセマンティックセマンティックセマンティクスを可能にするRASS(Reaform Adaptation for Semantic Segmentation)を提案する。
具体的には、まず、セマンティック・制約付き復元(SCR)モデルを提案する。これは、セマンティック・制約付き復元(SCR)モデルにおいて、セマンティック・アテンション・マップをセマンティック・アテンション・マスクに整列させ、セマンティック・アテンション・イメージ・再構成を促進することで、セマンティック・アテンション・マップを復元モデルに注入する。
そして、RASSは意味復元知識をLoRAベースのモジュールマージとタスク固有の微調整を通じてセグメンテーションに変換し、LQ画像に対するモデルの堅牢性を高める。
フレームワークの有効性を検証するため,高品質なアノテーションを用いた実世界のLQ画像セグメンテーションデータセットを構築し,合成LQベンチマークと実世界のLQベンチマークの両方で広範な実験を行った。
その結果, SCRとRASSは, セグメンテーションや修復作業において, 最先端の手法よりも優れていた。
コード、モデル、データセットはhttps://github.com/Ka1Guan/RASS.git.comで入手できる。
関連論文リスト
- Pruning Overparameterized Multi-Task Networks for Degraded Web Image Restoration [1.9336815376402718]
マルチタスク画像復元モデルを圧縮する手法を提案する。
提案手法は,低マグニチュード重みを除去する反復的プルーニング戦略を用いて,MIR-Lモデルを提案する。
テストの結果、MIR-Lはトレーニング可能なパラメータの10%しか保持せず、高い画像復元性能を維持していることがわかった。
論文 参考訳(メタデータ) (2025-10-16T09:04:05Z) - No time to train! Training-Free Reference-Based Instance Segmentation [15.061599989448867]
本研究は,少数の参照画像のみを備える場合のオブジェクトセグメンテーションの課題について検討する。
我々の重要な洞察は、ファンデーションモデルによって学習された強力なセマンティック・プライドを活用して、参照とターゲット画像の間の対応する領域を特定することである。
対応によって、下流タスクのためのインスタンスレベルのセグメンテーションマスクの自動生成が可能になり、マルチステージのトレーニング不要な方法でアイデアをインスタンス化する。
論文 参考訳(メタデータ) (2025-07-03T16:59:01Z) - SSP-IR: Semantic and Structure Priors for Diffusion-based Realistic Image Restoration [20.873676111265656]
SSP-IRは、低画質の画像からセマンティックと構造をフル活用することを目的としている。
提案手法は,合成および実世界のデータセットにおいて,他の最先端手法よりも優れる。
論文 参考訳(メタデータ) (2024-07-04T04:55:14Z) - CoSeR: Bridging Image and Language for Cognitive Super-Resolution [74.24752388179992]
本稿では,低解像度画像の理解能力を備えたSRモデルを実現するCoSeR(Cognitive Super-Resolution)フレームワークを提案する。
画像の外観と言語理解を組み合わせることで、認知的な埋め込みを生成する。
画像の忠実度をさらに向上させるため、「オール・イン・アテンション」と呼ばれる新しい条件注入方式を提案する。
論文 参考訳(メタデータ) (2023-11-27T16:33:29Z) - MixReorg: Cross-Modal Mixed Patch Reorganization is a Good Mask Learner
for Open-World Semantic Segmentation [110.09800389100599]
セマンティックセグメンテーションのための新鮮で簡単な事前学習パラダイムであるMixReorgを提案する。
我々のアプローチは、パッチとテキストの対応を保ちながら、画像パッチを混合することで、きめ細かいパッチテキストペアデータを生成することである。
マスク学習者としてMixReorgを使用することで、従来のテキスト教師付きセマンティックセマンティックセマンティックモデルは、非常に一般化可能なピクセル・セマンティックアライメントを実現することができる。
論文 参考訳(メタデータ) (2023-08-09T09:35:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。