論文の概要: WavEnhancer: Unifying Wavelet and Transformer for Image Enhancement
- arxiv url: http://arxiv.org/abs/2212.08327v1
- Date: Fri, 16 Dec 2022 08:00:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-19 16:04:49.793345
- Title: WavEnhancer: Unifying Wavelet and Transformer for Image Enhancement
- Title(参考訳): WavEnhancer: 画像強調のためのウェーブレットとトランスフォーマーの統合
- Authors: Zinuo Li, Xuhang Chen, Chi-Man Pun and Shuqiang Wang
- Abstract要約: 本稿では、ウェーブレット領域における変換器ベースモデルを提案し、画像の異なる周波数帯域を洗練させる。
提案手法は, 局所的詳細と高次機能の両方に焦点を合わせ, 優れた結果をもたらすことができる。
- 参考スコア(独自算出の注目度): 42.868893551985735
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image enhancement is a technique that frequently utilized in digital image
processing. In recent years, the popularity of learning-based techniques for
enhancing the aesthetic performance of photographs has increased. However, the
majority of current works do not optimize an image from different frequency
domains and typically focus on either pixel-level or global-level enhancements.
In this paper, we propose a transformer-based model in the wavelet domain to
refine different frequency bands of an image. Our method focuses both on local
details and high-level features for enhancement, which can generate superior
results. On the basis of comprehensive benchmark evaluations, our method
outperforms the state-of-the-art methods.
- Abstract(参考訳): 画像強調はデジタル画像処理で頻繁に利用される技法である。
近年,画像の美的性能を高めるための学習技術の普及が進んでいる。
しかし、現在の作品の大部分は異なる周波数領域からの画像を最適化せず、通常はピクセルレベルまたはグローバルレベルの拡張に焦点を当てている。
本稿では,画像の周波数帯域の異なるウェーブレット領域におけるトランスベースモデルを提案する。
本手法は,局所的詳細と高レベル機能の両方に着目し,優れた結果が得られる。
総合的なベンチマーク評価に基づいて,本手法は最先端手法よりも優れている。
関連論文リスト
- Recognition-Oriented Low-Light Image Enhancement based on Global and Pixelwise Optimization [0.4951599300340954]
本稿では,認識モデルの性能向上を目的とした,新しい低照度画像強調手法を提案する。
提案手法は,下流認識モデルの再学習を必要とせず,低照度認識性能を向上させるフィルタとして適用することができる。
論文 参考訳(メタデータ) (2025-01-08T01:09:49Z) - GenMix: Effective Data Augmentation with Generative Diffusion Model Image Editing [37.489576508876056]
本稿では、一般化可能なプロンプト誘導型生成データ拡張手法であるGenMixを紹介する。
本手法は、画像編集を利用して、カスタム条件付きプロンプトに基づく拡張画像を生成する。
提案手法は、非現実的な画像とラベルの曖昧さを緩和し、結果のモデルの性能と対角的堅牢性を向上する。
論文 参考訳(メタデータ) (2024-12-03T10:45:34Z) - HUPE: Heuristic Underwater Perceptual Enhancement with Semantic Collaborative Learning [62.264673293638175]
既存の水中画像強調法は主に視覚的品質の向上に重点を置いており、実際的な意味を見落としている。
視覚的品質を高め,他の下流タスクに対処する柔軟性を示す,水中知覚向上のための可逆的ネットワークHを提案する。
論文 参考訳(メタデータ) (2024-11-27T12:37:03Z) - Enhance Image Classification via Inter-Class Image Mixup with Diffusion Model [80.61157097223058]
画像分類性能を高めるための一般的な戦略は、T2Iモデルによって生成された合成画像でトレーニングセットを増強することである。
本研究では,既存のデータ拡張技術の欠点について検討する。
Diff-Mixと呼ばれる革新的なクラス間データ拡張手法を導入する。
論文 参考訳(メタデータ) (2024-03-28T17:23:45Z) - Low-light Image Enhancement via CLIP-Fourier Guided Wavelet Diffusion [28.049668999586583]
本稿では,CLIP-Fourier Guided Wavelet Diffusion(CFWD)による新しい低照度画像強調手法を提案する。
CFWDは、複数のウェーブレット変換によって生成される周波数領域空間におけるマルチモーダル視覚言語情報を活用して、拡張プロセスの導出を行う。
提案手法は既存の最先端手法よりも優れ,画像品質と雑音抑制の大幅な進歩を実現している。
論文 参考訳(メタデータ) (2024-01-08T10:08:48Z) - Enhancing Photorealism Enhancement [83.88433283714461]
本稿では,畳み込みネットワークを用いた合成画像のリアリズム向上手法を提案する。
一般的に使用されるデータセットのシーンレイアウトの分布を分析し、重要な方法で異なることを見つけます。
近年のイメージ・ツー・イメージ翻訳法と比較して,安定性とリアリズムの大幅な向上が報告されている。
論文 参考訳(メタデータ) (2021-05-10T19:00:49Z) - Zoom-to-Inpaint: Image Inpainting with High-Frequency Details [39.582275854002994]
高分解能で精錬し、出力を元の解像度に縮小する超解像法を提案します。
精細化ネットワークに高精細画像を導入することで、スペクトルバイアスによって通常滑らかになる細部を再構築することができる。
当社のズームイン、精緻化、ズームアウト戦略は、高解像度の監視とプログレッシブラーニングと組み合わせることで、高周波の詳細を高めるためのフレームワークに依存しないアプローチを構成します。
論文 参考訳(メタデータ) (2020-12-17T05:39:37Z) - DILIE: Deep Internal Learning for Image Enhancement [31.75300124593133]
近年の画像強調手法では, スタイル転送と画像復元が問題となっている。
我々は,深層内部学習フレームワークで画像強調を行う。
画像強調とノイズ強調の両方の結果を示す。
論文 参考訳(メタデータ) (2020-12-11T16:39:44Z) - Pre-Trained Image Processing Transformer [95.93031793337613]
我々は、新しい事前学習モデル、すなわち、画像処理変換器(IPT)を開発する。
本稿では、よく知られたImageNetベンチマークを用いて、大量の画像ペアを生成する。
IPTモデルは、これらの画像をマルチヘッドとマルチテールでトレーニングする。
論文 参考訳(メタデータ) (2020-12-01T09:42:46Z) - Learning End-to-End Lossy Image Compression: A Benchmark [90.35363142246806]
まず,学習した画像の圧縮方法に関する総合的な文献調査を行う。
本稿では,最先端の学習画像圧縮手法のマイルストーンについて述べるとともに,既存の幅広い作品について概観し,その歴史的開発ルートについて考察する。
エントロピー推定と信号再構成のための粗大な超高次モデルを導入することにより、速度歪み性能の向上を実現する。
論文 参考訳(メタデータ) (2020-02-10T13:13:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。