Fugu-MT 論文翻訳(概要): WavEnhancer: Unifying Wavelet and Transformer for Image Enhancement

論文の概要: WavEnhancer: Unifying Wavelet and Transformer for Image Enhancement

arxiv url: http://arxiv.org/abs/2212.08327v1
Date: Fri, 16 Dec 2022 08:00:54 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-19 16:04:49.793345
Title: WavEnhancer: Unifying Wavelet and Transformer for Image Enhancement
Title（参考訳）: WavEnhancer: 画像強調のためのウェーブレットとトランスフォーマーの統合
Authors: Zinuo Li, Xuhang Chen, Chi-Man Pun and Shuqiang Wang
Abstract要約: 本稿では、ウェーブレット領域における変換器ベースモデルを提案し、画像の異なる周波数帯域を洗練させる。提案手法は, 局所的詳細と高次機能の両方に焦点を合わせ, 優れた結果をもたらすことができる。
参考スコア（独自算出の注目度）: 42.868893551985735
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Image enhancement is a technique that frequently utilized in digital image processing. In recent years, the popularity of learning-based techniques for enhancing the aesthetic performance of photographs has increased. However, the majority of current works do not optimize an image from different frequency domains and typically focus on either pixel-level or global-level enhancements. In this paper, we propose a transformer-based model in the wavelet domain to refine different frequency bands of an image. Our method focuses both on local details and high-level features for enhancement, which can generate superior results. On the basis of comprehensive benchmark evaluations, our method outperforms the state-of-the-art methods.
Abstract（参考訳）: 画像強調はデジタル画像処理で頻繁に利用される技法である。近年,画像の美的性能を高めるための学習技術の普及が進んでいる。しかし、現在の作品の大部分は異なる周波数領域からの画像を最適化せず、通常はピクセルレベルまたはグローバルレベルの拡張に焦点を当てている。本稿では,画像の周波数帯域の異なるウェーブレット領域におけるトランスベースモデルを提案する。本手法は,局所的詳細と高レベル機能の両方に着目し,優れた結果が得られる。総合的なベンチマーク評価に基づいて,本手法は最先端手法よりも優れている。

関連論文リスト

Frequency-Domain Fusion Transformer for Image Inpainting [6.4194162137514725]
本稿では,周波数領域融合を取り入れたトランスフォーマーによる画像描画手法を提案する。実験により,提案手法は高周波数情報を保存することにより,画像の塗装品質を効果的に向上することを示した。
論文参考訳（メタデータ） (2025-06-23T09:19:04Z)
Feature Alignment with Equivariant Convolutions for Burst Image Super-Resolution [52.55429225242423]
本稿では,同変畳み込みに基づくアライメントを特徴とするBurst Image Super-Resolution (BISR) のための新しいフレームワークを提案する。これにより、アライメント変換は画像領域の明示的な監督を通じて学習でき、特徴領域に容易に適用できる。 BISRベンチマークの実験は、定量的メトリクスと視覚的品質の両方において、我々のアプローチの優れた性能を示している。
論文参考訳（メタデータ） (2025-03-11T11:13:10Z)
Recognition-Oriented Low-Light Image Enhancement based on Global and Pixelwise Optimization [0.4951599300340954]
本稿では,認識モデルの性能向上を目的とした,新しい低照度画像強調手法を提案する。提案手法は,下流認識モデルの再学習を必要とせず,低照度認識性能を向上させるフィルタとして適用することができる。
論文参考訳（メタデータ） (2025-01-08T01:09:49Z)
GenMix: Effective Data Augmentation with Generative Diffusion Model Image Editing [37.489576508876056]
本稿では、一般化可能なプロンプト誘導型生成データ拡張手法であるGenMixを紹介する。本手法は、画像編集を利用して、カスタム条件付きプロンプトに基づく拡張画像を生成する。提案手法は、非現実的な画像とラベルの曖昧さを緩和し、結果のモデルの性能と対角的堅牢性を向上する。
論文参考訳（メタデータ） (2024-12-03T10:45:34Z)
HUPE: Heuristic Underwater Perceptual Enhancement with Semantic Collaborative Learning [62.264673293638175]
既存の水中画像強調法は主に視覚的品質の向上に重点を置いており、実際的な意味を見落としている。視覚的品質を高め,他の下流タスクに対処する柔軟性を示す,水中知覚向上のための可逆的ネットワークHを提案する。
論文参考訳（メタデータ） (2024-11-27T12:37:03Z)
Enhance Image Classification via Inter-Class Image Mixup with Diffusion Model [80.61157097223058]
画像分類性能を高めるための一般的な戦略は、T2Iモデルによって生成された合成画像でトレーニングセットを増強することである。本研究では,既存のデータ拡張技術の欠点について検討する。 Diff-Mixと呼ばれる革新的なクラス間データ拡張手法を導入する。
論文参考訳（メタデータ） (2024-03-28T17:23:45Z)
Low-light Image Enhancement via CLIP-Fourier Guided Wavelet Diffusion [28.049668999586583]
本稿では,CLIP-Fourier Guided Wavelet Diffusion(CFWD)による新しい低照度画像強調手法を提案する。 CFWDは、複数のウェーブレット変換によって生成される周波数領域空間におけるマルチモーダル視覚言語情報を活用して、拡張プロセスの導出を行う。提案手法は既存の最先端手法よりも優れ,画像品質と雑音抑制の大幅な進歩を実現している。
論文参考訳（メタデータ） (2024-01-08T10:08:48Z)
DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文参考訳（メタデータ） (2023-12-12T06:07:21Z)
Image Enhancement via Bilateral Learning [1.4213973379473654]
本稿では,畳み込みニューラルネットワークに基づく画像強調システムを提案する。私たちの目標は、畳み込みニューラルネットワークと双方向グリッドという2つのアプローチを効果的に活用することにあります。提案手法は, 5つの異なる専門家を取り入れながら, 定量的および質的改善の両立を図っている。
論文参考訳（メタデータ） (2021-12-07T18:30:15Z)
Enhancing Photorealism Enhancement [83.88433283714461]
本稿では,畳み込みネットワークを用いた合成画像のリアリズム向上手法を提案する。一般的に使用されるデータセットのシーンレイアウトの分布を分析し、重要な方法で異なることを見つけます。近年のイメージ・ツー・イメージ翻訳法と比較して,安定性とリアリズムの大幅な向上が報告されている。
論文参考訳（メタデータ） (2021-05-10T19:00:49Z)
Zoom-to-Inpaint: Image Inpainting with High-Frequency Details [39.582275854002994]
高分解能で精錬し、出力を元の解像度に縮小する超解像法を提案します。精細化ネットワークに高精細画像を導入することで、スペクトルバイアスによって通常滑らかになる細部を再構築することができる。当社のズームイン、精緻化、ズームアウト戦略は、高解像度の監視とプログレッシブラーニングと組み合わせることで、高周波の詳細を高めるためのフレームワークに依存しないアプローチを構成します。
論文参考訳（メタデータ） (2020-12-17T05:39:37Z)
DILIE: Deep Internal Learning for Image Enhancement [31.75300124593133]
近年の画像強調手法では, スタイル転送と画像復元が問題となっている。我々は,深層内部学習フレームワークで画像強調を行う。画像強調とノイズ強調の両方の結果を示す。
論文参考訳（メタデータ） (2020-12-11T16:39:44Z)
Pre-Trained Image Processing Transformer [95.93031793337613]
我々は、新しい事前学習モデル、すなわち、画像処理変換器(IPT)を開発する。本稿では、よく知られたImageNetベンチマークを用いて、大量の画像ペアを生成する。 IPTモデルは、これらの画像をマルチヘッドとマルチテールでトレーニングする。
論文参考訳（メタデータ） (2020-12-01T09:42:46Z)
Learning End-to-End Lossy Image Compression: A Benchmark [90.35363142246806]
まず,学習した画像の圧縮方法に関する総合的な文献調査を行う。本稿では,最先端の学習画像圧縮手法のマイルストーンについて述べるとともに,既存の幅広い作品について概観し,その歴史的開発ルートについて考察する。エントロピー推定と信号再構成のための粗大な超高次モデルを導入することにより、速度歪み性能の向上を実現する。
論文参考訳（メタデータ） (2020-02-10T13:13:43Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。