論文の概要: LENS: Low-Frequency Eigen Noise Shaping for Efficient Diffusion Sampling
- arxiv url: http://arxiv.org/abs/2605.07253v1
- Date: Fri, 08 May 2026 05:22:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.814494
- Title: LENS: Low-Frequency Eigen Noise Shaping for Efficient Diffusion Sampling
- Title(参考訳): LENS:高効率拡散サンプリングのための低周波固有ノイズ整形
- Authors: Haewon Jeon, Si-Hyeon Lee,
- Abstract要約: 蒸留拡散モデルはデノナイジングステップの数を減らすことで画像生成を加速するが、しばしば劣化した画像品質に悩まされる。
最近のハイパーネットワークベースのアプローチは、トレーニング中にこのプロセスを改善させるが、高次元の潜伏空間においてコストのかかるノイズ変調を必要とする。
低次元部分空間で動作する効率的な雑音変調フレームワーク LENS (Low- frequency Eigen Noise Shaping) を提案する。
- 参考スコア(独自算出の注目度): 10.887547857646942
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Distilled diffusion models accelerate image generation by reducing the number of denoising steps, but often suffer from degraded image quality. To mitigate this trade-off, test-time optimization methods improve quality, yet their iterative nature incurs substantial computational overhead and leads to slow inference, limiting practical usability. Recent hypernetwork-based approaches amortize this process during training, but still require costly noise modulation in high-dimensional latent spaces. In this work, we propose LENS (Low-frequency Eigen Noise Shaping), an efficient noise modulation framework that operates in a low-dimensional subspace. Our approach is motivated by the observation that low-frequency components of the noise largely determine the global structure and visual fidelity of generated images. Based on this observation, we provide a theoretical justification for restricting modulation to the low-frequency subspace and derive a principled training objective. Building on this, LENS employs a lightweight, standalone network to selectively modulate these components, enabling efficient and targeted noise modulation. Extensive experiments demonstrate that LENS achieves competitive image quality while reducing FLOPs by 400-700$\times$, model parameters by 25-75$\times$, and inference-time overhead by 10-20$\times$ compared to prior methods.
- Abstract(参考訳): 蒸留拡散モデルはデノナイジングステップの数を減らすことで画像生成を加速するが、しばしば劣化した画像品質に悩まされる。
このトレードオフを緩和するため、テスト時の最適化手法は品質を改善するが、反復的な性質はかなりの計算オーバーヘッドを発生させ、推論が遅くなり、実用的なユーザビリティが制限される。
最近のハイパーネットワークベースのアプローチは、トレーニング中にこのプロセスを改善させるが、高次元の潜伏空間においてコストのかかるノイズ変調を必要とする。
本研究では,低次元部分空間で動作する効率的な雑音変調フレームワークであるLENS(Low- frequency Eigen Noise Shaping)を提案する。
提案手法は, ノイズの低周波成分が生成した画像の大域的構造と視覚的忠実度を決定づけていることに動機づけられる。
この観測に基づいて、低周波部分空間への変調を制限し、原則化された訓練目標を導出するための理論的正当性を提供する。
LENSは軽量でスタンドアロンのネットワークを使用してこれらのコンポーネントを選択的に変調し、効率よく目標とするノイズ変調を可能にする。
LENSは、FLOPを400-700$\times$に、モデルパラメータを25-75$\times$に、推論時間オーバーヘッドを10-20$\times$に減らし、競争力のある画像品質を実現することを示した。
関連論文リスト
- Spatial-Spectral Adaptive Fidelity and Noise Prior Reduction Guided Hyperspectral Image Denoising [11.513560890234864]
本稿では,雑音事前低減と空間-スペクトル適応忠実度項を統合する枠組みを提案する。
本枠組みでは,高速かつ堅牢な画素ワイドモデルと,代表係数の総変分正規化器を併用したモデルを構築した。
シミュレーションおよび実世界のデータセットの実験は、提案モデルが優れた騒音性能を達成することを示す。
論文 参考訳(メタデータ) (2026-04-14T11:27:23Z) - Single-Stage Signal Attenuation Diffusion Model for Low-Light Image Enhancement and Denoising [4.397450561168298]
拡散モデルは、前方雑音付加と逆雑音の確率論的モデリングによる画像復元において優れる。
主ストリーム拡散に基づく低光画像強調法 (LLIE) は、U-Net出力を洗練させるために、2段パイプラインまたは補助補正ネットワークを採用する。
本稿では,信号減衰機構を拡散パイプラインに統合する新しい拡散過程である信号減衰拡散モデル(SADM)を提案する。
論文 参考訳(メタデータ) (2026-04-07T11:33:04Z) - BADiff: Bandwidth Adaptive Diffusion Model [55.10134744772338]
従来の拡散モデルは、下流の伝送制限によらず、一定数のデノナイジングステップを実行することで、高忠実度画像を生成する。
実際のクラウド・ツー・デバイス・シナリオでは、帯域幅の制限はしばしば重い圧縮を必要とし、微妙なテクスチャや無駄な計算が失われる。
使用可能な帯域幅から導かれる目標品質レベルに拡散モデルを条件付けする,共同エンドツーエンドのトレーニング戦略を導入する。
論文 参考訳(メタデータ) (2025-10-24T11:50:03Z) - Mitigating the Noise Shift for Denoising Generative Models via Noise Awareness Guidance [54.88271057438763]
ノイズアウェアネスガイダンス (NAG) は、事前に定義された騒音スケジュールと整合性を保つために、サンプリング軌道を明示的に制御する補正手法である。
NAGは一貫してノイズシフトを緩和し、主流拡散モデルの生成品質を大幅に改善する。
論文 参考訳(メタデータ) (2025-10-14T13:31:34Z) - Physics-Guided Rectified Flow for Low-light RAW Image Enhancement [0.0]
低照度条件下で撮影されたRAW画像の強調は難しい作業である。
近年の深層学習に基づくRAW強化手法は, 実際のペアデータから, 合成データセットへの依存へと移行している。
論文 参考訳(メタデータ) (2025-09-10T07:08:43Z) - Noise Conditional Variational Score Distillation [60.38982038894823]
騒音条件変化スコア蒸留(NCVSD)は, 予混合拡散モデルから生成消音剤を蒸留する新しい方法である。
この知見を変分スコア蒸留フレームワークに組み込むことで、生成的デノイザのスケーラブルな学習を可能にする。
論文 参考訳(メタデータ) (2025-06-11T06:01:39Z) - Dark Noise Diffusion: Noise Synthesis for Low-Light Image Denoising [22.897202020483576]
低照度写真は、限られた光子による信号対雑音比の低い画像を生成する。
ディープラーニングの手法はうまく機能するが、取得には実用的でないペア画像の大規模なデータセットが必要である。
本稿では,低照度雑音の複雑な分布を捉える拡散モデルについて検討する。
論文 参考訳(メタデータ) (2025-03-14T10:16:54Z) - Enhanced Confocal Laser Scanning Microscopy with Adaptive Physics Informed Deep Autoencoders [0.0]
共焦点レーザー走査顕微鏡の限界に対処する物理インフォームド・ディープラーニング・フレームワークを提案する。
このモデルは、畳み込み層と転置畳み込み層を用いて、ノイズの多い入力から高忠実度画像を再構成する。
論文 参考訳(メタデータ) (2025-01-24T18:32:34Z) - Realistic Noise Synthesis with Diffusion Models [44.404059914652194]
ディープラーニングモデルには、大規模な実世界のトレーニングデータが必要です。
本稿では,これらの課題に対処するために拡散モデルを用いた新しい実音合成拡散器(RNSD)法を提案する。
論文 参考訳(メタデータ) (2023-05-23T12:56:01Z) - Advancing Unsupervised Low-light Image Enhancement: Noise Estimation, Illumination Interpolation, and Self-Regulation [55.07472635587852]
低光画像強調(LLIE)技術は、画像の詳細の保存とコントラストの強化に顕著な進歩をもたらした。
これらのアプローチは、動的ノイズを効率的に緩和し、様々な低照度シナリオを収容する上で、永続的な課題に直面する。
まず,低照度画像の雑音レベルを迅速かつ高精度に推定する方法を提案する。
次に、照明と入力の一般的な制約を満たすために、Learningable Illumination Interpolator (LII) を考案する。
論文 参考訳(メタデータ) (2023-05-17T13:56:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。