論文の概要: Perception-based Image Denoising via Generative Compression
- arxiv url: http://arxiv.org/abs/2602.11553v1
- Date: Thu, 12 Feb 2026 04:21:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-13 21:07:25.635494
- Title: Perception-based Image Denoising via Generative Compression
- Title(参考訳): 生成圧縮による知覚に基づく画像認識
- Authors: Nam Nguyen, Thinh Nguyen, Bella Bose,
- Abstract要約: Image denoisingは、構造的詳細と知覚的リアリズムを維持しながらノイズを取り除くことを目的としている。
歪み駆動法は、特に強いノイズと分布シフトの下で、過度に平滑な再構成を生成することが多い。
本稿では,認識に基づく聴覚認知のための生成的圧縮フレームワークを提案する。
- 参考スコア(独自算出の注目度): 5.85669274676101
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image denoising aims to remove noise while preserving structural details and perceptual realism, yet distortion-driven methods often produce over-smoothed reconstructions, especially under strong noise and distribution shift. This paper proposes a generative compression framework for perception-based denoising, where restoration is achieved by reconstructing from entropy-coded latent representations that enforce low-complexity structure, while generative decoders recover realistic textures via perceptual measures such as learned perceptual image patch similarity (LPIPS) loss and Wasserstein distance. Two complementary instantiations are introduced: (i) a conditional Wasserstein GAN (WGAN)-based compression denoiser that explicitly controls the rate-distortion-perception (RDP) trade-off, and (ii) a conditional diffusion-based reconstruction strategy that performs iterative denoising guided by compressed latents. We further establish non-asymptotic guarantees for the compression-based maximum-likelihood denoiser under additive Gaussian noise, including bounds on reconstruction error and decoding error probability. Experiments on synthetic and real-noise benchmarks demonstrate consistent perceptual improvements while maintaining competitive distortion performance.
- Abstract(参考訳): Image denoisingは、構造的詳細と知覚的リアリズムを維持しながらノイズを取り除くことを目的としているが、歪み駆動方式は、特に強いノイズと分布シフトの下で、過度に平滑な再構成を生成することが多い。
本稿では,低複雑さ構造を強制するエントロピー符号化された潜在表現から復元し,学習された知覚的イメージパッチ類似度(LPIPS)の損失やワッサーシュタイン距離などの知覚的計測によって現実的なテクスチャを復元する。
2つの補完的なインスタンス化が導入される。
i) レート歪み認識(RDP)のトレードオフを明示的に制御する条件付きワッサースタインGAN(WGAN)ベースの圧縮デノイザ
二 圧縮潜伏者による反復演示を行う条件拡散に基づく再建戦略。
さらに,付加的なガウス雑音下での圧縮ベース最大形雑音に対する非漸近的保証を,再構成誤差と復号誤り確率のバウンダリを含む非漸近的保証として確立する。
合成および実雑音ベンチマークの実験は、競合歪み性能を維持しながら、一貫した知覚的改善を示す。
関連論文リスト
- Diffusion-Based Limited-Angle CT Reconstruction under Noisy Conditions [10.287171164361608]
角投影の欠如は、再構成された画像の不完全なシノグラムやアーティファクトに繋がる。
本稿では, 平均回帰微分方程式(MR-SDE)を用いて, 角ビューの欠落を解消する拡散型フレームワークを提案する。
現実的な雑音下でのロバスト性を改善するために,推論時間不確実性を明示的にモデル化する新しいノイズ認識機構を提案する。
論文 参考訳(メタデータ) (2025-07-08T03:58:52Z) - Generative Image Compression by Estimating Gradients of the Rate-variable Feature Distribution [37.60572296105984]
生成画像圧縮に適した拡散に基づく新しい生成モデリングフレームワークを提案する。
逆ニューラルネットワークは、圧縮プロセスを直接反転することにより、画像の再構成を訓練する。
このアプローチは、最小限のサンプリングステップしか持たないスムーズなレート調整とフォトリアリスティックな再構成を実現する。
論文 参考訳(メタデータ) (2025-05-27T10:18:24Z) - Higher fidelity perceptual image and video compression with a latent conditioned residual denoising diffusion model [55.2480439325792]
本稿では,認知品質に最適化されたハイブリッド圧縮方式を提案し,CDCモデルのアプローチをデコーダネットワークで拡張する。
CDCと比較した場合,LPIPSとFIDの知覚スコアを比較検討しながら,最大2dBPSNRの忠実度向上を実現した。
論文 参考訳(メタデータ) (2025-05-19T14:13:14Z) - RDEIC: Accelerating Diffusion-Based Extreme Image Compression with Relay Residual Diffusion [29.277211609920155]
Relay Residual Diffusion Extreme Image Compression (RDEIC)を提案する。
まず, 純雑音ではなく, 付加雑音を付加した画像の圧縮潜時特徴を出発点として, 復調過程の不要な初期段階を除去する。
RDEICは、最先端の視覚的品質を実現し、既存の拡散に基づく極端画像圧縮手法よりも忠実さと効率性が優れている。
論文 参考訳(メタデータ) (2024-10-03T16:24:20Z) - Semantic Ensemble Loss and Latent Refinement for High-Fidelity Neural Image Compression [58.618625678054826]
本研究は、最適な視覚的忠実度のために設計された強化されたニューラル圧縮手法を提案する。
我々は,洗練されたセマンティック・アンサンブル・ロス,シャルボニエ・ロス,知覚的損失,スタイル・ロス,非バイナリ・ディバイザ・ロスを組み込んだモデルを構築した。
実験により,本手法は神経画像圧縮の統計的忠実度を著しく向上させることが示された。
論文 参考訳(メタデータ) (2024-01-25T08:11:27Z) - Reconstruction Distortion of Learned Image Compression with
Imperceptible Perturbations [69.25683256447044]
本稿では,学習画像圧縮(lic)の再構成品質を効果的に劣化させる攻撃手法を提案する。
我々は,Frobeniusノルムに基づく損失関数を導入して,元の画像と再構成された逆例との差を最大化することによって,逆例を生成する。
様々なlicモデルを用いてKodakデータセット上で実験を行った結果,有効性が確認された。
論文 参考訳(メタデータ) (2023-06-01T20:21:05Z) - DiffusionAD: Norm-guided One-step Denoising Diffusion for Anomaly Detection [80.20339155618612]
DiffusionADは、再構成サブネットワークとセグメンテーションサブネットワークからなる、新しい異常検出パイプラインである。
高速なワンステップデノゲーションパラダイムは、同等の再現品質を維持しながら、数百倍の加速を達成する。
異常の出現の多様性を考慮し、複数のノイズスケールの利点を統合するためのノルム誘導パラダイムを提案する。
論文 参考訳(メタデータ) (2023-03-15T16:14:06Z) - SAR Despeckling using a Denoising Diffusion Probabilistic Model [52.25981472415249]
スペックルの存在は画像品質を劣化させ、SAR画像理解アプリケーションの性能に悪影響を及ぼす。
本稿では,SAR脱種のための拡散確率モデルであるSAR-DDPMを紹介する。
提案手法は, 最先端の切り離し法と比較して, 定量化と定性化の両面で有意な改善を実現している。
論文 参考訳(メタデータ) (2022-06-09T14:00:26Z) - Generalized Octave Convolutions for Learned Multi-Frequency Image
Compression [20.504561050200365]
本稿では,初めて学習されたマルチ周波数画像圧縮とエントロピー符号化手法を提案する。
これは最近開発されたオクターブの畳み込みに基づいて、潜水剤を高周波(高分解能)成分に分解する。
提案した一般化オクターブ畳み込みは、他のオートエンコーダベースのコンピュータビジョンタスクの性能を向上させることができることを示す。
論文 参考訳(メタデータ) (2020-02-24T01:35:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。