論文の概要: Training-Free Model Ensemble for Single-Image Super-Resolution via Strong-Branch Compensation
- arxiv url: http://arxiv.org/abs/2604.11564v1
- Date: Mon, 13 Apr 2026 14:48:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.625884
- Title: Training-Free Model Ensemble for Single-Image Super-Resolution via Strong-Branch Compensation
- Title(参考訳): ストロングブランチ補償による単一画像超解像のための学習自由モデルアンサンブル
- Authors: Gengjia Chang, Xining Ge, Weijun Yuan, Zhan Li, Qiurong Song, Luen Zhu, Shuhong Liu,
- Abstract要約: シングルイメージのスーパーレゾリューションは、深い畳み込みベースラインから、より強力なTransformerとステートスペースアーキテクチャへと進歩した。
対応するパフォーマンス向上には、通常、より高いトレーニングコスト、より長いエンジニアリング、より重いデプロイメント負荷が伴う。
本稿では,学習不要な出力レベルアンサンブルフレームワークを提案する。
- 参考スコア(独自算出の注目度): 7.344881114730842
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Single-image super-resolution has progressed from deep convolutional baselines to stronger Transformer and state-space architectures, yet the corresponding performance gains typically come with higher training cost, longer engineering iteration, and heavier deployment burden. In many practical settings, multiple pretrained models with partially complementary behaviors are already available, and the binding constraint is no longer architectural capacity but how effectively their outputs can be combined without additional training. Rather than pursuing further architectural redesign, this paper proposes a training-free output-level ensemble framework. A dual-branch pipeline is constructed in which a Hybrid attention network with TLC inference provides stable main reconstruction, while a MambaIRv2 branch with geometric self-ensemble supplies strong compensation for high-frequency detail recovery. The two branches process the same low-resolution input independently and are fused in the image space via a lightweight weighted combination, without updating any model parameters or introducing an additional trainable module. As our solution to the NTIRE 2026 Image Super-Resolution ($\times 4$) Challenge, the proposed design consistently improves over the base branch and slightly exceeds the pure strong branch in PSNR at the best operating point under a unified DIV2K bicubic $\times 4$ evaluation protocol. Ablation studies confirm that output-level compensation provides a low-overhead and practically accessible upgrade path for existing super-resolution systems.
- Abstract(参考訳): シングルイメージのスーパーレゾリューションは、深い畳み込みベースラインから、より強力なTransformerとステートスペースアーキテクチャへと進歩した。
多くの実践的な環境では、部分的に補完的な振る舞いを持つ複数の事前訓練済みモデルがすでに利用可能であり、バインディング制約はもはやアーキテクチャ上の能力ではなく、追加のトレーニングなしでアウトプットを効果的に組み合わせることができる。
アーキテクチャのさらなる再設計を追求する代わりに、トレーニング不要な出力レベルのアンサンブルフレームワークを提案する。
TLC推論を持つハイブリッドアテンションネットワークが安定な主再構成を提供するのに対し、幾何学的自己アンサンブルを持つMambaIRv2ブランチは高周波ディテールリカバリのための強力な補償を提供する。
2つのブランチは同じ低解像度入力を独立して処理し、モデルパラメータを更新したり、追加のトレーニング可能なモジュールを導入することなく、軽量な重み付けの組み合わせによってイメージ空間内で融合する。
NTIRE 2026 Image Super-Resolution (\times 4$) Challengeの解決策として、提案された設計は、ベースブランチよりも一貫して改善され、統一されたDIV2Kバイキュビック$\times 4$評価プロトコルの下で、PSNRの純粋な強い分岐よりもわずかに高い。
アブレーション研究は、既存の超解像システムに対して、出力レベルの補償が低オーバーヘッドで実用的なアップグレードパスを提供することを確認した。
関連論文リスト
- Divide and Restore: A Modular Task-Decoupled Framework for Universal Image Restoration [0.0]
様々な種類の劣化によって影響を受ける画像の復元は、コンピュータビジョンにおいて重要な課題である。
本稿では,明示的な診断ルーティング機構に基づくモジュール型タスク分離型画像復元フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-30T16:45:16Z) - FlexRank: Nested Low-Rank Knowledge Decomposition for Adaptive Model Deployment [20.331469310989956]
重要順序付きネスト成分は事前訓練されたモデルから抽出でき、利用可能な計算予算に基づいて選択的に活性化される。
このアプローチは、各予算のスクラッチからトレーニングすることなく、コストとパフォーマンスの間の優雅なトレードオフを提供する"トレインオンス、デプロイ、どこでも"のパラダイムを可能にします。
論文 参考訳(メタデータ) (2026-02-02T19:01:40Z) - PT$^2$-LLM: Post-Training Ternarization for Large Language Models [52.4629647715623]
大きな言語モデル(LLM)は、様々なタスクにまたがる印象的な機能を示しているが、その大きなメモリと計算能力は、デプロイメントを妨げている。
PT$2$-LLMを提案する。
その中核は2段精製パイプラインを備えた非対称3次量子化器である。
論文 参考訳(メタデータ) (2025-09-27T03:01:48Z) - InvFussion: Bridging Supervised and Zero-shot Diffusion for Inverse Problems [76.39776789410088]
この研究は、教師付きアプローチの強いパフォーマンスとゼロショットメソッドの柔軟性を組み合わせたフレームワークを導入している。
新規なアーキテクチャ設計では、分解演算子を直接デノイザにシームレスに統合する。
FFHQとImageNetデータセットの実験結果は、最先端の後方サンプリング性能を示している。
論文 参考訳(メタデータ) (2025-04-02T12:40:57Z) - Exploring Real&Synthetic Dataset and Linear Attention in Image Restoration [47.26304397935705]
画像復元は、劣化した入力から高品質な画像を復元することを目的としている。
既存のメソッドにはイテレーションと設定のための統一的なトレーニングベンチマークがない。
本稿では,画像複雑性に基づいた新しい画像フィルタリング手法であるReSynという大規模IRデータセットを提案する。
論文 参考訳(メタデータ) (2024-12-05T02:11:51Z) - LoRA-IR: Taming Low-Rank Experts for Efficient All-in-One Image Restoration [62.3751291442432]
高速なオールインワン画像復元を実現するために,コンパクトな低ランクの専門家を動的に活用する,フレキシブルなフレームワークであるLoRA-IRを提案する。
LoRA-IRは、劣化誘導前訓練とパラメータ効率の良い微調整の2つの訓練段階で構成されている。
実験により、LoRA-IRは計算効率を維持しつつ、14のIRタスクと29のベンチマークでSOTA性能を達成することが示された。
論文 参考訳(メタデータ) (2024-10-20T13:00:24Z) - Dynamic Pre-training: Towards Efficient and Scalable All-in-One Image Restoration [100.54419875604721]
オールインワン画像復元は、各分解に対してタスク固有の非ジェネリックモデルを持たずに、統一されたモデルで異なるタイプの劣化に対処する。
我々は、オールインワン画像復元タスクのためのエンコーダデコーダ方式で設計されたネットワークの動的ファミリであるDyNetを提案する。
我々のDyNetは、よりバルク化と軽量化をシームレスに切り替えることができるので、効率的なモデルデプロイメントのための柔軟性を提供します。
論文 参考訳(メタデータ) (2024-04-02T17:58:49Z) - Effective Invertible Arbitrary Image Rescaling [77.46732646918936]
Invertible Neural Networks (INN)は、ダウンスケーリングとアップスケーリングのサイクルを共同で最適化することにより、アップスケーリングの精度を大幅に向上させることができる。
本研究の1つのモデルのみをトレーニングすることにより、任意の画像再スケーリングを実現するために、単純で効果的な非可逆的再スケーリングネットワーク(IARN)を提案する。
LR出力の知覚品質を損なうことなく、双方向任意再スケーリングにおいて最先端(SOTA)性能を実現する。
論文 参考訳(メタデータ) (2022-09-26T22:22:30Z) - CompOFA: Compound Once-For-All Networks for Faster Multi-Platform
Deployment [1.433758865948252]
CompOFAは、精度レイテンシフロンティアに近いモデルに対する検索を制限します。
簡単な実験であっても、トレーニング時間の2倍の短縮とモデル探索/抽出時間の216倍の高速化を実現できることを実証する。
論文 参考訳(メタデータ) (2021-04-26T15:10:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。