論文の概要: Freqformer: Image-Demoiréing Transformer via Efficient Frequency Decomposition
- arxiv url: http://arxiv.org/abs/2505.19120v1
- Date: Sun, 25 May 2025 12:23:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:42.920097
- Title: Freqformer: Image-Demoiréing Transformer via Efficient Frequency Decomposition
- Title(参考訳): Freqformer: 効率的な周波数分解による画像復調変換器
- Authors: Xiaoyang Liu, Bolin Qiu, Jiezhang Cao, Zheng Chen, Yulun Zhang, Xiaokang Yang,
- Abstract要約: 本稿では,Freqformerについて述べる。Freqformerは,ターゲット周波数分離による画像復号化に特化して設計されたトランスフォーマーベースのフレームワークである。
本手法は,モワールパターンを高周波数空間局在化テクスチャと低周波数スケールローバスト色歪みに明確に分割する有効な周波数分解を行う。
様々なデモアのベンチマーク実験により、Freqformerは、コンパクトなモデルサイズで最先端のパフォーマンスを達成することを示した。
- 参考スコア(独自算出の注目度): 83.40450475728792
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image demoir\'eing remains a challenging task due to the complex interplay between texture corruption and color distortions caused by moir\'e patterns. Existing methods, especially those relying on direct image-to-image restoration, often fail to disentangle these intertwined artifacts effectively. While wavelet-based frequency-aware approaches offer a promising direction, their potential remains underexplored. In this paper, we present Freqformer, a Transformer-based framework specifically designed for image demoir\'eing through targeted frequency separation. Our method performs an effective frequency decomposition that explicitly splits moir\'e patterns into high-frequency spatially-localized textures and low-frequency scale-robust color distortions, which are then handled by a dual-branch architecture tailored to their distinct characteristics. We further propose a learnable Frequency Composition Transform (FCT) module to adaptively fuse the frequency-specific outputs, enabling consistent and high-fidelity reconstruction. To better aggregate the spatial dependencies and the inter-channel complementary information, we introduce a Spatial-Aware Channel Attention (SA-CA) module that refines moir\'e-sensitive regions without incurring high computational cost. Extensive experiments on various demoir\'eing benchmarks demonstrate that Freqformer achieves state-of-the-art performance with a compact model size. The code is publicly available at https://github.com/xyLiu339/Freqformer.
- Abstract(参考訳): Image demoir\'eingは、テクスチャ劣化とmoir\'eパターンによる色歪みとの複雑な相互作用のため、依然として困難なタスクである。
既存の方法、特にイメージ・ツー・イメージの復元に依存しているものは、これらの絡み合ったアーティファクトを効果的に切り離すことができないことが多い。
ウェーブレットベースの周波数認識アプローチは有望な方向を提供するが、そのポテンシャルは未解明のままである。
本稿では,Freqformerについて述べる。Freqformerは,ターゲット周波数分離による画像復号処理に特化したトランスフォーマーベースのフレームワークである。
提案手法は,モワールパターンを高周波数空間局在型テクスチャと低周波数スケールローバスト色歪みに明確に分割し,その特性に合わせて両ブランチアーキテクチャで処理する。
さらに、周波数固有出力を適応的に融合し、一貫した高忠実度再構成を可能にするための学習可能な周波数合成変換(FCT)モジュールを提案する。
空間依存性とチャネル間補完情報をよりよく集約するため,高計算コストを伴わずにモワールに敏感な領域を改良するSpatial-Aware Channel Attention (SA-CA) モジュールを導入する。
様々なdemoir\'eingベンチマークでの大規模な実験により、Freqformerは、コンパクトなモデルサイズで最先端のパフォーマンスを達成することを示した。
コードはhttps://github.com/xyLiu339/Freqformer.comで公開されている。
関連論文リスト
- FreqU-FNet: Frequency-Aware U-Net for Imbalanced Medical Image Segmentation [0.0]
FreqU-FNetは周波数領域で動作する新しいU字型セグメンテーションアーキテクチャである。
我々のフレームワークは、低パス畳み込みとDubechiesウェーブレットに基づくダウンサンプリングを利用する周波数を組み込んでいる。
複数の医療セグメンテーションベンチマークの実験では、FreqU-FNetはCNNとTransformerのベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2025-05-23T06:51:24Z) - FUSE: Label-Free Image-Event Joint Monocular Depth Estimation via Frequency-Decoupled Alignment and Degradation-Robust Fusion [63.87313550399871]
画像強調共同深度推定法は、頑健な知覚に相補的なモダリティを利用するが、一般化可能性の課題に直面している。
自己監督型転送(PST)と周波数デカップリング型フュージョンモジュール(FreDF)を提案する。
PSTは、画像基礎モデルと潜在空間アライメントによるクロスモーダルな知識伝達を確立する。
FreDFは、低周波構造成分から高周波エッジ特性を明示的に分離し、モード比周波数ミスマッチを解消する。
論文 参考訳(メタデータ) (2025-03-25T15:04:53Z) - Frequency Enhancement for Image Demosaicking [40.76899837631637]
本稿では,RGB画像の分割・復号化を行うデュアルパス周波数拡張ネットワーク(DFENet)を提案する。
1つの経路は、空間領域の細かな精細化を通じて行方不明の情報を生成することに焦点を当て、もう1つは望ましくない周波数を抑えることを目的としている。
これらの設計により、提案されたDFENetは、異なるデータセット上で、他の最先端アルゴリズムよりも優れている。
論文 参考訳(メタデータ) (2025-03-20T02:37:10Z) - ASCNet: Asymmetric Sampling Correction Network for Infrared Image Destriping [25.816984064145906]
非対称サンプリング補正ネットワーク(ASCNet)と呼ばれる新しい赤外画像デストリップ手法を提案する。
我々のASCNetは、Residual Haar Discrete Wavelet Transform (RHDWT), Pixel Shuffle (PS), Column Non-uniformity Correction Module (CNCM)の3つのコア要素で構成されています。
論文 参考訳(メタデータ) (2024-01-28T06:23:55Z) - Frequency-Adaptive Pan-Sharpening with Mixture of Experts [22.28680499480492]
パンシャーピングのための新しい周波数適応型エキスパート混合学習フレームワーク(FAME)を提案する。
本手法は他の最先端技術に対して最善を尽くし,現実のシーンに対して強力な一般化能力を有する。
論文 参考訳(メタデータ) (2024-01-04T08:58:25Z) - Spatial-Frequency U-Net for Denoising Diffusion Probabilistic Models [89.76587063609806]
画素空間の代わりにウェーブレット空間における拡散確率モデル(DDPM)を視覚合成のために検討した。
ウェーブレット信号を明示的にモデル化することで、我々のモデルは複数のデータセット上でより高品質な画像を生成することができる。
論文 参考訳(メタデータ) (2023-07-27T06:53:16Z) - Adaptive Frequency Learning in Two-branch Face Forgery Detection [66.91715092251258]
本稿では、AFDと呼ばれる2分岐検出フレームワークにおいて、周波数情報を適応的に学習する手法を提案する。
我々は、固定周波数変換からネットワークを解放し、データおよびタスク依存の変換層でより良いパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-03-27T14:25:52Z) - FreqNet: A Frequency-domain Image Super-Resolution Network with Dicrete
Cosine Transform [16.439669339293747]
単一画像超解像(SISR)は低分解能(LR)入力から高分解能(HR)出力を得ることを目的とした不適切な問題である。
高ピーク信号-雑音比(PSNR)の結果にもかかわらず、モデルが望まれる高周波の詳細を正しく付加するかどうかを判断することは困難である。
本稿では、周波数領域の観点から直感的なパイプラインであるFreqNetを提案し、この問題を解決する。
論文 参考訳(メタデータ) (2021-11-21T11:49:12Z) - WaveFill: A Wavelet-based Generation Network for Image Inpainting [57.012173791320855]
WaveFillはウェーブレットベースの塗装ネットワークで、画像を複数の周波数帯域に分解する。
WaveFillは、空間情報を自然に保存する離散ウェーブレット変換(DWT)を用いて画像を分解する。
低周波帯にL1再構成損失を、高周波帯に敵対損失を施し、それによって周波数間紛争を効果的に軽減する。
論文 参考訳(メタデータ) (2021-07-23T04:44:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。