論文の概要: ARCNet: An Asymmetric Residual Wavelet Column Correction Network for
Infrared Image Destriping
- arxiv url: http://arxiv.org/abs/2401.15578v1
- Date: Sun, 28 Jan 2024 06:23:55 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-30 17:40:03.648884
- Title: ARCNet: An Asymmetric Residual Wavelet Column Correction Network for
Infrared Image Destriping
- Title(参考訳): ARCNet:赤外画像削除のための非対称残留ウェーブレットカラム補正ネットワーク
- Authors: Shuai Yuan, Hanlin Qin, Xiang Yan, Naveed Akhtar, Shiqi Yang, Shuowen
Yang
- Abstract要約: 赤外画像デストリップは、劣化した画像から高品質なコンテンツを復元しようとする。
最近の研究は、先行知識を利用して劣化した画像からストライプノイズを分離することで、この課題に対処している。
画像デストリップのための非対称残留ウェーブレット列補正ネットワーク(ARCNet)を導入する。
- 参考スコア(独自算出の注目度): 28.037564161552446
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Infrared image destriping seeks to restore high-quality content from degraded
images. Recent works mainly address this task by leveraging prior knowledge to
separate stripe noise from the degraded image. However, constructing a robust
decoupling model for that purpose remains challenging, especially when
significant similarities exist between the stripe noise and vertical background
structure. Addressing that, we introduce Asymmetric Residual wavelet Column
correction Network (ARCNet) for image destriping, aiming to consistently
preserve spatially precise high-resolution representations. Our neural model
leverages a novel downsampler, residual haar discrete wavelet transform
(RHDWT), stripe directional prior knowledge and data-driven learning to induce
a model with enriched feature representation of stripe noise and background. In
our technique, the inverse wavelet transform is replaced by transposed
convolution for feature upsampling, which can suppress noise crosstalk and
encourage the network to focus on robust image reconstruction. After each
sampling, a proposed column non-uniformity correction module (CNCM) is
leveraged by our method to enhance column uniformity, spatial correlation, and
global self-dependence between each layer component. CNCM can establish
structural characteristics of stripe noise and utilize contextual information
at long-range dependencies to distinguish stripes with varying intensities and
distributions. Extensive experiments on synthetic data, real data, and infrared
small target detection tasks show that the proposed method outperforms
state-of-the-art single-image destriping methods both visually and
quantitatively by a considerable margin. Our code will be made publicly
available at \url{https://github.com/xdFai}.
- Abstract(参考訳): 赤外画像デストリップは、劣化した画像から高品質なコンテンツを復元しようとする。
最近の研究は、先行知識を利用して劣化した画像からストライプノイズを分離することで、この課題に対処している。
しかし、特にストライプノイズと垂直背景構造の間に大きな類似性がある場合、この目的のためにロバストなデカップリングモデルを構築することは依然として困難である。
そこで我々は,空間的高精度な高分解能表現を一貫して保存することを目的として,画像デストリップのための非対称残留ウェーブレット列補正ネットワーク(ARCNet)を導入する。
我々のニューラルモデルは、新しいダウンサンプラー、残留ハール離散ウェーブレット変換(RHDWT)、指向性事前知識とデータ駆動学習を利用して、ストライプノイズと背景の豊かな特徴表現を持つモデルを誘導する。
本手法では,逆ウェーブレット変換を機能アップサンプリングのための畳み込み変換に置き換えることにより,雑音クロストークを抑制し,ロバストな画像再構成をネットワークに促す。
各サンプリングの後,提案するカラム非均一性補正モジュール(CNCM)を用いて,各レイヤ間のカラム均一性,空間相関,大域自己依存性を向上させる。
CNCMは、ストライプノイズの構造特性を確立し、長距離依存におけるコンテキスト情報を用いて、様々な強度と分布を持つストリップを識別することができる。
合成データ, 実データ, 赤外線小目標検出タスクに関する広範な実験により, 提案手法は, 視覚的および定量的に, かなりのマージンで, 最先端の単像デトリップ法を上回っていることが示された。
私たちのコードは \url{https://github.com/xdFai} で公開されます。
関連論文リスト
- Spherical Linear Interpolation and Text-Anchoring for Zero-shot Composed Image Retrieval [43.47770490199544]
Composed Image Retrieval (CIR)は、画像とキャプションで構成されたクエリを使って画像を取得する複雑なタスクである。
Slerp(Spherical Linear Interpolation)を用いて画像とテキストを直接マージする新しいZS-CIR手法を提案する。
また,テキストエンコーダを固定しながら画像エンコーダを微調整するText-Anchored-Tuning (TAT)を導入する。
論文 参考訳(メタデータ) (2024-05-01T15:19:54Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - FuseNet: Self-Supervised Dual-Path Network for Medical Image
Segmentation [3.485615723221064]
FuseNetは、自己教師型セマンティックセグメンテーションのためのデュアルストリームフレームワークである。
クロスモーダル融合技術は、テキストデータを拡張画像に置き換えることで、CLIPの原理を拡張している。
皮膚病変と肺分画データセットの実験により, 本手法の有効性が示された。
論文 参考訳(メタデータ) (2023-11-22T00:03:16Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Wavelet-based Unsupervised Label-to-Image Translation [9.339522647331334]
本稿では、自己教師付きセグメンテーション損失と全画像ウェーブレットに基づく識別を併用した、SIS(USIS)のための新しいアン教師付きパラダイムを提案する。
3つの挑戦的なデータセットで方法論を検証し、ペアモデルとアンペアモデルのパフォーマンスギャップを橋渡しする能力を実証する。
論文 参考訳(メタデータ) (2023-05-16T17:48:44Z) - Clothes Grasping and Unfolding Based on RGB-D Semantic Segmentation [21.950751953721817]
セグメンテーションのための双方向フラクタルクロスフュージョンネットワーク(BiFCNet)を提案する。
我々は、Fractal Cross FusionモジュールがRGBと深度データを融合するネットワークへの入力として、リッチな色特徴を持つRGB画像を使用する。
実データ収集のコストを削減するため,敵対的戦略に基づくデータ拡張手法を提案する。
論文 参考訳(メタデータ) (2023-05-05T03:21:55Z) - Spatial-Separated Curve Rendering Network for Efficient and
High-Resolution Image Harmonization [59.19214040221055]
本稿では,空間分離型曲線描画ネットワーク(S$2$CRNet)を提案する。
提案手法は従来の手法と比較して90%以上のパラメータを減少させる。
提案手法は,既存の手法よりも10ドル以上高速な高解像度画像をリアルタイムにスムーズに処理することができる。
論文 参考訳(メタデータ) (2021-09-13T07:20:16Z) - SFANet: A Spectrum-aware Feature Augmentation Network for
Visible-Infrared Person Re-Identification [12.566284647658053]
クロスモダリティマッチング問題に対するSFANetという新しいスペクトル認識特徴量化ネットワークを提案する。
grayscale-spectrumイメージで学習すると、モダリティの不一致を低減し、内部構造関係を検出することができる。
特徴レベルでは、特定および粉砕可能な畳み込みブロックの数のバランスをとることにより、従来の2ストリームネットワークを改善します。
論文 参考訳(メタデータ) (2021-02-24T08:57:32Z) - Self-Supervised Representation Learning for RGB-D Salient Object
Detection [93.17479956795862]
我々は、自己教師付き表現学習を用いて、クロスモーダルオートエンコーダと深さ-輪郭推定という2つのプレテキストタスクを設計する。
我々のプレテキストタスクは、ネットワークがリッチなセマンティックコンテキストをキャプチャする事前トレーニングを実行するのに、少数のRGB-Dデータセットしか必要としない。
RGB-D SODにおけるクロスモーダル核融合の固有の問題として,マルチパス核融合モジュールを提案する。
論文 参考訳(メタデータ) (2021-01-29T09:16:06Z) - Example-Guided Image Synthesis across Arbitrary Scenes using Masked
Spatial-Channel Attention and Self-Supervision [83.33283892171562]
実例誘導画像合成は,最近セマンティックラベルマップと模範画像から画像を合成するために試みられている。
本稿では,ラベルマップと意味的に異なる任意のシーンイメージを例に,より困難で汎用的な課題に取り組む。
本稿では,グローバル・ローカルな特徴アライメントと合成のためのエンドツーエンドネットワークを提案する。
論文 参考訳(メタデータ) (2020-04-18T18:17:40Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。