論文の概要: MoiréNet: A Compact Dual-Domain Network for Image Demoiréing
- arxiv url: http://arxiv.org/abs/2509.18910v1
- Date: Tue, 23 Sep 2025 12:33:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-24 20:41:27.829417
- Title: MoiréNet: A Compact Dual-Domain Network for Image Demoiréing
- Title(参考訳): MoiréNet:画像復号化のためのコンパクトなデュアルドメインネットワーク
- Authors: Shuwei Guo, Simin Luan, Yan Ke, Zeyd Boukhers, John See, Cong Yang,
- Abstract要約: モワールパターンは、ディスプレイピクセル格子とカメラセンサーグリッドの間のスペクトルエイリアスから生じる。
本稿では,周波数領域と空間領域の機能を統合した畳み込み型ニューラルネットワークによる人工物除去フレームワークであるMoir'eNetを提案する。
- 参考スコア(独自算出の注目度): 14.959312694378765
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Moir\'e patterns arise from spectral aliasing between display pixel lattices and camera sensor grids, manifesting as anisotropic, multi-scale artifacts that pose significant challenges for digital image demoir\'eing. We propose Moir\'eNet, a convolutional neural U-Net-based framework that synergistically integrates frequency and spatial domain features for effective artifact removal. Moir\'eNet introduces two key components: a Directional Frequency-Spatial Encoder (DFSE) that discerns moir\'e orientation via directional difference convolution, and a Frequency-Spatial Adaptive Selector (FSAS) that enables precise, feature-adaptive suppression. Extensive experiments demonstrate that Moir\'eNet achieves state-of-the-art performance on public and actively used datasets while being highly parameter-efficient. With only 5.513M parameters, representing a 48% reduction compared to ESDNet-L, Moir\'eNet combines superior restoration quality with parameter efficiency, making it well-suited for resource-constrained applications including smartphone photography, industrial imaging, and augmented reality.
- Abstract(参考訳): Moir\eパターンは、ディスプレイピクセル格子とカメラセンサーグリッドの間のスペクトルエイリアスから発生し、異方性、多スケールのアーティファクトとして現れ、デジタル画像デシプター\eingに重大な課題をもたらす。
本稿では,周波数領域と空間領域の特徴を相乗的に統合し,効率的なアーティファクト除去を実現する,畳み込み型ニューラルネットワークベースのフレームワークであるMoir\'eNetを提案する。
Moir\'eNetは、方向差畳み込みによってmoir\'e方向を識別するDFSE(Directional Frequency-Spatial Encoder)と、正確に、特徴適応的な抑制を可能にするFSAS( Frequency-Spatial Adaptive Selector)という2つの重要なコンポーネントを導入している。
大規模な実験により、Moir\'eNetは、パラメータ効率が高く、パブリックおよびアクティブに使用されるデータセット上で最先端のパフォーマンスを達成することが示された。
わずか5.513Mのパラメータだけで、ESDNet-Lと比較して48%の低下を示し、Moir\'eNetは優れた復元品質とパラメータ効率を組み合わせ、スマートフォン写真、工業画像、拡張現実などのリソース制約のあるアプリケーションに適している。
関連論文リスト
- Iterative Low-rank Network for Hyperspectral Image Denoising [16.26671997491784]
ハイパースペクトル画像(HSI)復調は、その後のタスクにおいて重要な前処理ステップである。
画像の詳細を保存しながら、このような物理的特性を効果的に denoising に適切に利用することは、一般的に困難である。
本稿では,これらの課題に対処するための新しい反復型低ランクネットワーク (ILRNet) を提案する。
論文 参考訳(メタデータ) (2025-08-30T04:34:43Z) - Moiré Zero: An Efficient and High-Performance Neural Architecture for Moiré Removal [8.464291713830127]
MZNetは,モアレパターンを効果的に除去し,モアレゼロ状態に画像が近づくように設計されたU字型ネットワークである。
MZNetは高解像度データセットで最先端のパフォーマンスを達成し、低解像度データセットで競合結果を提供する。
論文 参考訳(メタデータ) (2025-07-30T06:16:35Z) - LEGNet: Lightweight Edge-Gaussian Driven Network for Low-Quality Remote Sensing Image Object Detection [18.804394986840887]
本稿では,新しいエッジ・ガウス・アグリゲーション(EGA)モジュールを備えた軽量バックボーンネットワークであるLEGNetを紹介する。
EGAモジュールは、(a)低コントラストやぼやけたオブジェクトでしばしば失われる重要なエッジの詳細を鋭くするために、方向対応のScharrフィルタと、(b)ノイズを抑え、あいまいな特徴応答を規則化するガウス的特徴改善を統合している。
5つのベンチマークの総合的な評価は、LEGNetが最先端のパフォーマンス、特に低品質なオブジェクトの検出を達成していることを示している。
論文 参考訳(メタデータ) (2025-03-18T08:20:24Z) - Frequency Domain Enhanced U-Net for Low-Frequency Information-Rich Image Segmentation in Surgical and Deep-Sea Exploration Robots [34.28684917337352]
CNNと人間の視覚系における周波数帯域感度の差について検討する。
本稿では、生体視覚機構にインスパイアされたウェーブレット適応スペクトル融合(WASF)法を提案する。
我々は SAM2 のバックボーンネットワークを利用する FE-UNet モデルを開発し, セグメンテーション精度を確保するために細調整した Hiera-Large モジュールを組み込んだ。
論文 参考訳(メタデータ) (2025-02-06T07:24:34Z) - MDeRainNet: An Efficient Macro-pixel Image Rain Removal Network [42.69264615303869]
我々は,LF画像から降雨ストリーク除去を行うために,MDeRainNetと呼ばれる効率的なネットワークを提案する。
提案するネットワークはマルチスケールエンコーダデコーダアーキテクチャを採用し, 直接マクロピクセル画像(MPI)を用いて降雨除去性能を向上する。
そこで本研究では,MDeRainNetのための新しい半教師付き学習フレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-15T14:47:02Z) - Efficient Visual State Space Model for Image Deblurring [99.54894198086852]
畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は、画像復元において優れた性能を発揮している。
本稿では,画像のデブロアに対する簡易かつ効果的な視覚状態空間モデル(EVSSM)を提案する。
提案したEVSSMは、ベンチマークデータセットや実世界の画像に対する最先端の手法に対して好意的に機能する。
論文 参考訳(メタデータ) (2024-05-23T09:13:36Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - DiffiT: Diffusion Vision Transformers for Image Generation [88.08529836125399]
ViT(Vision Transformer)は、特に認識タスクにおいて、強力なモデリング機能とスケーラビリティを実証している。
拡散型生成学習におけるViTの有効性について検討し、拡散ビジョン変換器(DiffiT)と呼ばれる新しいモデルを提案する。
DiffiTはパラメータ効率が大幅に向上した高忠実度画像を生成するのに驚くほど効果的である。
論文 参考訳(メタデータ) (2023-12-04T18:57:01Z) - Asymmetric CNN for image super-resolution [102.96131810686231]
深層畳み込みニューラルネットワーク(CNN)は、過去5年間で低レベルビジョンに広く適用されています。
画像超解像のための非対称ブロック(AB)、mem?ory拡張ブロック(MEB)、高周波数特徴強調ブロック(HFFEB)からなる非対称CNN(ACNet)を提案する。
我々のACNetは、ブラインドノイズの単一画像超解像(SISR)、ブラインドSISR、ブラインドSISRを効果的に処理できる。
論文 参考訳(メタデータ) (2021-03-25T07:10:46Z) - Learning Frequency-aware Dynamic Network for Efficient Super-Resolution [56.98668484450857]
本稿では、離散コサイン変換(dct)領域の係数に応じて入力を複数の部分に分割する新しい周波数認識動的ネットワークについて検討する。
実際、高周波部は高価な操作で処理され、低周波部は計算負荷を軽減するために安価な操作が割り当てられる。
ベンチマークSISRモデルおよびデータセット上での実験は、周波数認識動的ネットワークが様々なSISRニューラルネットワークに使用できることを示している。
論文 参考訳(メタデータ) (2021-03-15T12:54:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。