論文の概要: Distribution-aware Dataset Distillation for Efficient Image Restoration
- arxiv url: http://arxiv.org/abs/2504.14826v1
- Date: Mon, 21 Apr 2025 03:00:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-29 19:49:39.986741
- Title: Distribution-aware Dataset Distillation for Efficient Image Restoration
- Title(参考訳): 効率的な画像復元のための分布認識型データセット蒸留法
- Authors: Zhuoran Zheng, Xin Su, Chen Wu, Xiuyi Jia,
- Abstract要約: TripleDは、データセット蒸留の原理を画像復元に拡張する新しいフレームワークである。
提案手法は,マルチタスク画像復元,オールインワン画像復元,超高精細画像復元など,複数の画像復元タスクにおいて有望な性能を実現する。
- 参考スコア(独自算出の注目度): 13.93334711809017
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the exponential increase in image data, training an image restoration model is laborious. Dataset distillation is a potential solution to this problem, yet current distillation techniques are a blank canvas in the field of image restoration. To fill this gap, we propose the Distribution-aware Dataset Distillation method (TripleD), a new framework that extends the principles of dataset distillation to image restoration. Specifically, TripleD uses a pre-trained vision Transformer to extract features from images for complexity evaluation, and the subset (the number of samples is much smaller than the original training set) is selected based on complexity. The selected subset is then fed through a lightweight CNN that fine-tunes the image distribution to align with the distribution of the original dataset at the feature level. To efficiently condense knowledge, the training is divided into two stages. Early stages focus on simpler, low-complexity samples to build foundational knowledge, while later stages select more complex and uncertain samples as the model matures. Our method achieves promising performance on multiple image restoration tasks, including multi-task image restoration, all-in-one image restoration, and ultra-high-definition image restoration tasks. Note that we can train a state-of-the-art image restoration model on an ultra-high-definition (4K resolution) dataset using only one consumer-grade GPU in less than 8 hours (500 savings in computing resources and immeasurable training time).
- Abstract(参考訳): 画像データの指数的な増加により、画像復元モデルのトレーニングは困難である。
データセットの蒸留はこの問題に対する潜在的な解決策であるが、現在の蒸留技術は画像復元の分野では空白のキャンバスである。
このギャップを埋めるために、データセット蒸留の原理を画像復元に拡張する新しいフレームワークである分散対応データセット蒸留法(TripleD)を提案する。
具体的には、TripleDは、事前トレーニングされた視覚変換器を使用して、複雑性評価のために画像から特徴を抽出し、そのサブセット(サンプルの数は元のトレーニングセットよりもはるかに小さい)を複雑さに基づいて選択する。
選択されたサブセットは軽量のCNNを通じて供給され、画像の分布を微調整して、特徴レベルでの元のデータセットの分布と整合する。
知識を効率的に理解するために、訓練は2つの段階に分けられる。
初期の段階は、基礎知識を構築するための単純で低複雑さのサンプルに焦点を当て、後期段階はモデルが成熟するにつれてより複雑で不確実なサンプルを選択する。
提案手法は,マルチタスク画像復元,オールインワン画像復元,超高精細画像復元など,複数の画像復元タスクにおいて有望な性能を実現する。
超高解像度(4K解像度)データセット上で,8時間未満で1つのコンシューマグレードGPU(計算リソースの500セーブと測定不可能なトレーニング時間)を使用して,最先端の画像復元モデルをトレーニングできることに注意が必要だ。
関連論文リスト
- UniCoRN: Latent Diffusion-based Unified Controllable Image Restoration Network across Multiple Degradations [4.892790389883125]
複数種類の劣化を同時に処理できる統一画像復元手法UniCoRNを提案する。
具体的には、制御可能な拡散モデルを導く際に、画像から抽出した低レベルの視覚的手がかりの可能性を明らかにする。
MetaRestoreも導入しています。MetaRestoreは、複数の劣化やアーティファクトの画像を含むメタレンスイメージングベンチマークです。
論文 参考訳(メタデータ) (2025-03-20T05:42:13Z) - FoundIR: Unleashing Million-scale Training Data to Advance Foundation Models for Image Restoration [66.61201445650323]
既存の手法は現実のシナリオにおける一般化ボトルネックに悩まされる。
既存のトレーニングデータに対して,2つの大きなメリットがある,100万規模のデータセットをコントリビュートしています。
実世界のシナリオにおいて,より広範囲の復元作業に対処するために,ロバストなモデルFoundIRを提案する。
論文 参考訳(メタデータ) (2024-12-02T12:08:40Z) - Timestep-Aware Diffusion Model for Extreme Image Rescaling [47.89362819768323]
本稿では,時間認識拡散モデル(TADM)と呼ばれる,画像再スケーリングのための新しいフレームワークを提案する。
TADMは、事前訓練されたオートエンコーダの潜在空間で再スケーリング操作を行う。
これは、事前訓練されたテキスト・ツー・イメージ拡散モデルによって学習された強力な自然画像の先行を効果的に活用する。
論文 参考訳(メタデータ) (2024-08-17T09:51:42Z) - Review Learning: Advancing All-in-One Ultra-High-Definition Image Restoration Training Method [7.487270862599671]
本稿では,bfReview Learning という一般画像復元モデルの学習パラダイムを提案する。
このアプローチは、いくつかの劣化したデータセット上のイメージ復元モデルのシーケンシャルなトレーニングと、レビューメカニズムの組み合わせから始まります。
コンシューマグレードのGPU上で4K解像度で画像の劣化を効率的に推論できる軽量な全目的画像復元ネットワークを設計する。
論文 参考訳(メタデータ) (2024-08-13T08:08:45Z) - Improved Distribution Matching Distillation for Fast Image Synthesis [54.72356560597428]
この制限を解除し、MDDトレーニングを改善する一連の技術であるMDD2を紹介する。
まず、回帰損失と高価なデータセット構築の必要性を排除します。
第2に, GAN損失を蒸留工程に統合し, 生成した試料と実画像との識別を行う。
論文 参考訳(メタデータ) (2024-05-23T17:59:49Z) - Photo-Realistic Image Restoration in the Wild with Controlled Vision-Language Models [14.25759541950917]
この研究は、能動的視覚言語モデルと合成分解パイプラインを活用して、野生(ワイルドIR)における画像復元を学習する。
我々の基底拡散モデルは画像復元SDE(IR-SDE)である。
論文 参考訳(メタデータ) (2024-04-15T12:34:21Z) - Exposure Bracketing Is All You Need For A High-Quality Image [50.822601495422916]
マルチ露光画像は、デノイング、デブロアリング、高ダイナミックレンジイメージング、超解像において相補的である。
本研究では,これらの課題を組み合わせ,高品質な画像を得るために露光ブラケット写真を活用することを提案する。
特に時間変調リカレントネットワーク(TMRNet)と自己教師あり適応手法を提案する。
論文 参考訳(メタデータ) (2024-01-01T14:14:35Z) - Prompt-based Ingredient-Oriented All-in-One Image Restoration [0.0]
複数の画像劣化課題に対処する新しいデータ成分指向手法を提案する。
具体的には、エンコーダを用いて特徴をキャプチャし、デコーダを誘導するための劣化情報を含むプロンプトを導入する。
我々の手法は最先端技術と競争的に機能する。
論文 参考訳(メタデータ) (2023-09-06T15:05:04Z) - Vision-Language Dataset Distillation [26.886260846439612]
トラジェクトリマッチングのアイデアに基づいて,最初の視覚言語によるデータセット蒸留法を設計する。
重要な課題は、ビジョン言語データセットが独立したクラスのセットを持っていないことだ。
提案手法は, コントラスト式で画像とテキストのペアを共同蒸留する。
論文 参考訳(メタデータ) (2023-08-15T03:22:40Z) - CropMix: Sampling a Rich Input Distribution via Multi-Scale Cropping [97.05377757299672]
そこで本研究では,元のデータセット分布からリッチな入力分布を生成するための簡単なCropMixを提案する。
CropMixは、分類タスクを実行するトレーニングレシピやニューラルネットワークアーキテクチャにシームレスに適用することができる。
CropMixは、より強力な表現に向けて、対照的な学習とマスクされた画像モデリングの両方に利益があることを示す。
論文 参考訳(メタデータ) (2022-05-31T16:57:28Z) - Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-04-19T17:59:45Z) - SVBRDF Recovery From a Single Image With Highlights using a Pretrained
Generative Adversarial Network [25.14140648820334]
本稿では,教師なし生成逆向ニューラルネットワーク(GAN)を用いて,SVBRDFsマップを入力として復元する。
SVBRDFを初期化するために訓練されたモデルを再利用し、入力画像に基づいて微調整する。
提案手法は,1枚の入力画像から高品質なSVBRDFマップを生成し,従来よりも鮮明なレンダリング結果を提供する。
論文 参考訳(メタデータ) (2021-10-29T10:39:06Z) - Multi-Stage Progressive Image Restoration [167.6852235432918]
本稿では、これらの競合する目標を最適にバランスできる新しい相乗的設計を提案する。
本提案では, 劣化した入力の復元関数を段階的に学習する多段階アーキテクチャを提案する。
MPRNetという名前の密接な相互接続型マルチステージアーキテクチャは、10のデータセットに対して強力なパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2021-02-04T18:57:07Z) - Plug-and-Play Image Restoration with Deep Denoiser Prior [186.84724418955054]
モデルに基づく手法では,デノイザが暗黙的に画像として機能し,多くの逆問題に対処できることを示す。
非常に柔軟で効果的なCNNデノイザをトレーニングする前に、ベンチマークディープデノイザを設定しました。
次に, 2次分割に基づくイテレーティブアルゴリズムを用いて, 画像復元問題の解法を提案する。
論文 参考訳(メタデータ) (2020-08-31T17:18:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。