論文の概要: Learning Noise-Resistant Image Representation by Aligning Clean and
Noisy Domains
- arxiv url: http://arxiv.org/abs/2307.00761v1
- Date: Mon, 3 Jul 2023 05:38:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-05 14:17:47.510361
- Title: Learning Noise-Resistant Image Representation by Aligning Clean and
Noisy Domains
- Title(参考訳): クリーン領域とノイズ領域の整合によるノイズ耐性画像表現の学習
- Authors: Yanhui Guo, Xiaolin Wu, Fangzhou Luo
- Abstract要約: 提案手法は,既存の学習システムに容易に組み込めるスケーラブルなモジュールである。
合成ノイズデータと実世界のノイズデータの両方を用いて、様々なタスクの総合的な試行により、提案手法は複雑なノイズ画像の面において顕著な性能と堅牢性を達成することができることを示した。
- 参考スコア(独自算出の注目度): 17.199023009789308
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent supervised and unsupervised image representation learning algorithms
have achieved quantum leaps. However, these techniques do not account for
representation resilience against noise in their design paradigms.
Consequently, these effective methods suffer failure when confronted with noise
outside the training distribution, such as complicated real-world noise that is
usually opaque to model training. To address this issue, dual domains are
optimized to separately model a canonical space for noisy representations,
namely the Noise-Robust (NR) domain, and a twinned canonical clean space,
namely the Noise-Free (NF) domain, by maximizing the interaction information
between the representations. Given the dual canonical domains, we design a
target-guided implicit neural mapping function to accurately translate the NR
representations to the NF domain, yielding noise-resistant representations by
eliminating noise regencies. The proposed method is a scalable module that can
be readily integrated into existing learning systems to improve their
robustness against noise. Comprehensive trials of various tasks using both
synthetic and real-world noisy data demonstrate that the proposed Target-Guided
Dual-Domain Translation (TDDT) method is able to achieve remarkable performance
and robustness in the face of complex noisy images.
- Abstract(参考訳): 最近の教師付きおよび教師なしの画像表現学習アルゴリズムは量子飛躍を達成した。
しかし、これらの手法は、設計パラダイムにおけるノイズに対する表現レジリエンスを考慮に入れていない。
したがって、これらの効果的な手法は、通常モデルトレーニングに不透明な複雑な実世界のノイズなど、トレーニング分布外のノイズに直面すると故障する。
この問題に対処するため、双対領域は、ノイズ・ロバスト(NR)領域と、ノイズ・フリー(NF)領域という双対な正準清浄空間を、表現間の相互作用情報を最大化することで、別々にノイズ表現の標準空間をモデル化するように最適化されている。
二重正準領域を前提として、NR表現をNF領域に正確に変換する暗黙的ニューラルマッピング関数を設計し、ノイズレギュレーションを除去してノイズ耐性表現を生成する。
提案手法は,既存の学習システムと容易に統合でき,雑音に対するロバスト性が向上するスケーラブルモジュールである。
合成および実世界のノイズデータを用いた様々なタスクの包括的検証により,提案手法は複雑な雑音画像に対して優れた性能と頑健性を実現することができることを示した。
関連論文リスト
- Deep Learning Based Speckle Filtering for Polarimetric SAR Images. Application to Sentinel-1 [51.404644401997736]
本稿では、畳み込みニューラルネットワークを用いて偏光SAR画像のスペックルを除去するための完全なフレームワークを提案する。
実験により,提案手法はスペックル低減と分解能保存の両方において例外的な結果をもたらすことが示された。
論文 参考訳(メタデータ) (2024-08-28T10:07:17Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - Physics-Driven Turbulence Image Restoration with Stochastic Refinement [80.79900297089176]
大気乱流による画像歪みは、長距離光学画像システムにおいて重要な問題である。
ディープラーニングモデルが現実世界の乱流条件に適応するために、高速で物理学的なシミュレーションツールが導入された。
本稿では,物理統合復元ネットワーク(PiRN)を提案する。
論文 参考訳(メタデータ) (2023-07-20T05:49:21Z) - Transformer-based SAR Image Despeckling [53.99620005035804]
本稿では,SAR画像復号化のためのトランスフォーマーネットワークを提案する。
提案する非特定ネットワークは、トランスフォーマーベースのエンコーダにより、異なる画像領域間のグローバルな依存関係を学習することができる。
実験により,提案手法は従来型および畳み込み型ニューラルネットワークに基づく解法よりも大幅に改善されていることが示された。
論文 参考訳(メタデータ) (2022-01-23T20:09:01Z) - Frequency-Aware Physics-Inspired Degradation Model for Real-World Image
Super-Resolution [18.328806055594576]
両光およびセンサ劣化を考慮した実世界の物理インスパイアされた劣化モデルについて定式化する。
我々は、畳み込みニューラルネットワーク(CNN)を用いて、現実世界の劣化過程の遮断周波数を学習することを提案する。
異なる撮像システムで撮像した実世界の画像に対して,提案した劣化モデルの有効性と一般化能力を評価する。
論文 参考訳(メタデータ) (2021-11-05T07:30:00Z) - Improving Super-Resolution Performance using Meta-Attention Layers [17.870338228921327]
畳み込みニューラルネットワーク(CNN)は多くの超解像(SR)と画像復元タスクで素晴らしい結果を得た。
SRのIll-posed性質は、複数の異なる劣化を経た画像を正確に超解き出すのを難しくする。
メタアテンション(メタアテンション)は、任意のSR CNNが関連する劣化パラメータで利用可能な情報を活用できるようにするメカニズムである。
論文 参考訳(メタデータ) (2021-10-27T09:20:21Z) - RBSRICNN: Raw Burst Super-Resolution through Iterative Convolutional
Neural Network [23.451063587138393]
RBSRICNN(Row Burst Super-Resolution Iterative Convolutional Neural Network)を提案する。
提案したネットワークは、中間SR推定を反復的に洗練することにより最終的な出力を生成する。
定量的および定性的な実験において提案手法の有効性を実証する。
論文 参考訳(メタデータ) (2021-10-25T19:01:28Z) - Spatially-Adaptive Image Restoration using Distortion-Guided Networks [51.89245800461537]
空間的に変化する劣化に苦しむ画像の復元のための学習ベースソリューションを提案する。
本研究では、歪み局所化情報を活用し、画像中の困難な領域に動的に適応するネットワーク設計であるSPAIRを提案する。
論文 参考訳(メタデータ) (2021-08-19T11:02:25Z) - Del-Net: A Single-Stage Network for Mobile Camera ISP [14.168130234198467]
スマートフォンカメラにおける従来の画像信号処理(ISP)パイプラインは、原センサーデータから高品質のsRGBイメージを順次再構成するための画像処理ステップで構成されている。
畳み込みニューラルネットワーク(CNN)を用いたディープラーニング手法は、画像のデノイング、コントラストの強化、超解像、デブロアリングなど、多くの画像関連タスクの解決に人気がある。
本稿では,スマートフォンの展開に適した複雑さでISPパイプライン全体を学ぶために,単一のエンドツーエンドディープラーニングモデルであるDelNetを提案する。
論文 参考訳(メタデータ) (2021-08-03T16:51:11Z) - Removing Diffraction Image Artifacts in Under-Display Camera via Dynamic
Skip Connection Network [80.67717076541956]
アンダーディスプレイカメラ(UDC)システムは、スマートフォン上で真のベゼルレスおよびノッチフリーの視聴体験を提供します。
典型的なUDCシステムでは、ピクセルアレイはカメラ上の入射光を減衰および回折し、画像品質の大幅な低下をもたらす。
本研究では,前述の劣化問題の解析と対処を目的とする。
論文 参考訳(メタデータ) (2021-04-19T18:41:45Z) - Beyond Joint Demosaicking and Denoising: An Image Processing Pipeline
for a Pixel-bin Image Sensor [0.883717274344425]
Pixel binningは、スマートフォンカメラのハードウェア制限に対処する最も顕著なソリューションの1つだと考えられている。
本稿では,新しい学習手法を導入することで,このような画像センサ上でのJDD(Joint Desaicing and Denoising)の課題に対処する。
提案手法は,視覚可能な画像を生成するための2つの新しい知覚損失を含む多項目的関数によって導かれる。
論文 参考訳(メタデータ) (2021-04-19T15:41:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。