論文の概要: MiM-DiT: MoE in MoE with Diffusion Transformers for All-in-One Image Restoration
- arxiv url: http://arxiv.org/abs/2603.02710v1
- Date: Tue, 03 Mar 2026 08:00:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-04 21:38:10.699669
- Title: MiM-DiT: MoE in MoE with Diffusion Transformers for All-in-One Image Restoration
- Title(参考訳): MiM-DiT:MOE in MoE with Diffusion Transformers for All-in-One Image Restoration (特集:MEとバイオサイバネティックス)
- Authors: Lingshun Kong, Jiawei Zhang, Zhengpeng Duan, Xiaohe Wu, Yueqi Yang, Xiaotao Wang, Dongqing Zou, Lei Lei, Jinshan Pan,
- Abstract要約: 本稿では,Mixture-of-Experts(MoE)アーキテクチャを事前学習した拡散モデルと統合した統合画像復元フレームワークを提案する。
フレームワークは2つのレベルで動作する: Inter-MoE層はエキスパートグループを適応的に組み合わせて大きな劣化タイプを処理する。
この設計により、モデルは多種多様な劣化カテゴリにまたがる粗粒度適応を可能とし、特定のクラス内変動に対して微粒度変調を行い、複雑で現実的な汚職に対処する際の高度な特殊化を確保することができる。
- 参考スコア(独自算出の注目度): 47.38878532518223
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: All-in-one image restoration is challenging because different degradation types, such as haze, blur, noise, and low-light, impose diverse requirements on restoration strategies, making it difficult for a single model to handle them effectively. In this paper, we propose a unified image restoration framework that integrates a dual-level Mixture-of-Experts (MoE) architecture with a pretrained diffusion model. The framework operates at two levels: the Inter-MoE layer adaptively combines expert groups to handle major degradation types, while the Intra-MoE layer further selects specialized sub-experts to address fine-grained variations within each type. This design enables the model to achieve coarse-grained adaptation across diverse degradation categories while performing fine-grained modulation for specific intra-class variations, ensuring both high specialization in handling complex, real-world corruptions. Extensive experiments demonstrate that the proposed method performs favorably against the state-of-the-art approaches on multiple image restoration task.
- Abstract(参考訳): オールインワンのイメージ復元は、ヘイズ、ぼかし、ノイズ、低照度といった様々な劣化タイプが復元戦略に多様な要件を課しているため、単一のモデルで効果的に処理することが難しくなるため、難しい。
本稿では,Mixture-of-Experts(MoE)アーキテクチャを事前学習した拡散モデルと統合した統合画像復元フレームワークを提案する。
フレームワークは2つのレベルで動作する: Inter-MoE層はエキスパートグループを適応的に組み合わせて大きな劣化タイプを処理する。
この設計により、モデルは多種多様な劣化カテゴリにまたがる粗粒度適応を可能とし、特定のクラス内変動に対して微粒度変調を行い、複雑で現実的な汚職に対処する際の高度な特殊化を確保することができる。
複数の画像復元作業における最先端手法に対して,提案手法が好適に動作することを示す。
関連論文リスト
- Rectification Reimagined: A Unified Mamba Model for Image Correction and Rectangling with Prompts [7.136884388888679]
我々は、一貫した歪み補正の観点からこれらの実用的なタスクに対処する包括的アプローチUnified Rectification Framework(UniRect)を紹介する。
提案手法は,様々な種類のレンズをシミュレートすることにより,様々なタスク固有の逆問題を一般的な歪みモデルに組み込む。
我々のモデルは、他の最新手法と比較して最先端の性能を達成した。
論文 参考訳(メタデータ) (2025-12-21T12:33:44Z) - ClusIR: Towards Cluster-Guided All-in-One Image Restoration [72.16989784735796]
ClusIRは、統一されたフレームワーク内でさまざまな劣化から高品質なイメージを復元することを目的としている。
ClusIRは、確率的クラスタ誘導ルーティング機構(PCGRM)と劣化対応周波数変調モジュール(DAFMM)の2つの重要なコンポーネントから構成される。
論文 参考訳(メタデータ) (2025-12-11T18:59:47Z) - UniLDiff: Unlocking the Power of Diffusion Priors for All-in-One Image Restoration [16.493990086330985]
UniLDiffは、デグレッションとディテールを意識したメカニズムで強化された統合フレームワークである。
劣化認識機能融合(DAFF:Degradation-Aware Feature Fusion)を導入し,低品質機能を各段階に動的に注入する。
また,Detail-Aware Expert Module (DAEM) をデコーダ内に設計し,テクスチャと微細構造の回復性を高める。
論文 参考訳(メタデータ) (2025-07-31T16:02:00Z) - UniRes: Universal Image Restoration for Complex Degradations [53.74404005987783]
実世界のイメージ復元は、様々なキャプチャ条件、キャプチャデバイス、後処理パイプラインから生じるさまざまな劣化によって妨げられている。
UniResという名前の、シンプルで柔軟な拡散ベースのフレームワークは、このような劣化をエンドツーエンドで解決するために提案されている。
提案手法は, 複合劣化画像復元データセットと単分解画像復元データセットの両方を用いて評価する。
論文 参考訳(メタデータ) (2025-06-05T21:25:39Z) - DPMambaIR: All-in-One Image Restoration via Degradation-Aware Prompt State Space Model [52.44931846016603]
DPMambaIRは新しいオールインワン画像復元フレームワークで、微細な分解抽出器と劣化を意識した状態空間モデルを導入している。
DPMambaIRは、PSNRとSSIMでそれぞれ27.69dBと0.893の最高性能を達成している。
論文 参考訳(メタデータ) (2025-04-24T16:46:32Z) - Mixed Degradation Image Restoration via Local Dynamic Optimization and Conditional Embedding [67.57487747508179]
マルチインワン画像復元 (IR) は, 一つのモデルで全ての種類の劣化画像復元を処理し, 大幅な進歩を遂げている。
本稿では,単一と混合の分解で画像を効果的に復元できる新しいマルチインワンIRモデルを提案する。
論文 参考訳(メタデータ) (2024-11-25T09:26:34Z) - Training-Free Large Model Priors for Multiple-in-One Image Restoration [24.230376300759573]
大型モデル駆動画像復元フレームワーク(LMDIR)
我々のアーキテクチャは、グローバルな劣化知識を注入するクエリベースのプロンプトエンコーダ、分解対応トランスフォーマーブロックで構成されている。
この設計は、自動修復とユーザガイド修復の両方をサポートしながら、様々な劣化に対処するためのシングルステージトレーニングパラダイムを促進する。
論文 参考訳(メタデータ) (2024-07-18T05:40:32Z) - Hybrid-Supervised Dual-Search: Leveraging Automatic Learning for
Loss-free Multi-Exposure Image Fusion [60.221404321514086]
マルチ露光画像融合(MEF)は、様々な露光レベルを表すデジタルイメージングの限界に対処するための重要な解決策である。
本稿では、ネットワーク構造と損失関数の両方を自動設計するための二段階最適化探索方式であるHSDS-MEFと呼ばれるMEFのためのハイブリッドスーパービジョンデュアルサーチ手法を提案する。
論文 参考訳(メタデータ) (2023-09-03T08:07:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。