論文の概要: VSANet: View-aware Sparse Attention Network for Light Field Image Denoising
- arxiv url: http://arxiv.org/abs/2606.24737v1
- Date: Tue, 23 Jun 2026 16:00:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 22:16:49.046086
- Title: VSANet: View-aware Sparse Attention Network for Light Field Image Denoising
- Title(参考訳): VSANet: 視野を意識した光画像認識のためのスパースアテンションネットワーク
- Authors: Gargi Panda, Soumitra Kundu, Saumik Bhattacharya, Aurobinda Routray,
- Abstract要約: VSANet(VSANet)は、光フィールド(LF)イメージをデノイングするための、ビュー対応のスパースアテンションネットワークである。
我々は、VSANetが最先端のLF復調法より優れていることを示す。
- 参考スコア(独自算出の注目度): 15.000821535291742
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Light field (LF) image denoising is challenging due to the high-dimensional structure of LF data. While noise is independent across sub-aperture images, scene content exhibits strong cross-view correlations. We introduce VSANet, a view-aware sparse attention network for LF denoising. Specifically, we propose a view-aware sparse attention (VSA) block that represents the 4D LF feature map as a unified spatial-angular token space and performs cross-view aggregation via locality-sensitive hashing-based sparse attention. This enables global feature interactions with linear complexity, effectively exploiting LF correlations across views and spatial locations. In addition, we design a feature refinement (FR) block to emphasize informative features in spatial, angular, and epipolar subspaces. The VSA and FR blocks are integrated within a sequential attention refinement module, forming the core of VSANet. Experiments demonstrate VSANet outperforms stateof-the-art LF denoising methods.
- Abstract(参考訳): LFデータの高次元構造のため、光場(LF)画像のデノイングは困難である。
ノイズはサブアパーチャ画像間では独立であるが、シーンコンテンツは強いクロスビュー相関を示す。
LFデノゲーションのためのビュー対応スパースアテンションネットワークであるVSANetを紹介する。
具体的には、4次元LF特徴写像を空間角の統一トークン空間として表現し、局所性に敏感なハッシュに基づくスパースアテンションによるクロスビューアグリゲーションを行うビュー認識スパースアテンション(VSA)ブロックを提案する。
これにより、線形複雑性とのグローバルな機能相互作用が可能になり、ビューと空間的位置間のLF相関を効果的に活用できる。
さらに,空間,角,極小部分空間における情報的特徴を強調する特徴改善(FR)ブロックを設計する。
VSAブロックとFRブロックはシーケンシャルなアテンションリファインメントモジュールに統合され、VSANetのコアとなる。
実験では、VSANetが最先端のLF denoisingメソッドより優れています。
関連論文リスト
- Non-Learning Low-Light Stereo Vision [12.842377848287045]
ノイズの多い画像から不均一度を推定するための非学習フレームワークを提案する。
FoJ(Field of Junctions)を用いることで、光子ノイズから分離できない微細なテクスチャを破棄しながら、コストボリューム構築のために重いノイズ下で安定な粗い視覚特性を保持する。
得られた構造情報は境界対応のセミ・グロバルマッチング(SGM)を誘導し、スムーズなペナルティを動的に適用して真の不連続性を維持する。
論文 参考訳(メタデータ) (2026-05-29T21:43:38Z) - LFIC-DRASC: Deep Light Field Image Compression Using Disentangled Representation and Asymmetrical Strip Convolution [51.909036244222904]
ディスタングル表現と非対称ストリップ畳み込みを用いたエンドツーエンドのディープLF画像圧縮法を提案する。
実験の結果,提案したLFIC-DRASCは平均20.5%のビットレート削減を達成した。
論文 参考訳(メタデータ) (2024-09-18T05:33:42Z) - Rethinking Transformer-Based Blind-Spot Network for Self-Supervised Image Denoising [94.09442506816724]
BSN(Blind-spot Network)は、自己教師付き画像復調(SSID)におけるニューラルネットワークアーキテクチャとして広く使われている。
本研究では,Transformer ベースの Blind-Spot Network (TBSN) を構築した。
論文 参考訳(メタデータ) (2024-04-11T15:39:10Z) - Hybrid Convolutional and Attention Network for Hyperspectral Image Denoising [54.110544509099526]
ハイパースペクトル画像(HSI)は、ハイパースペクトルデータの効果的な解析と解釈に重要である。
ハイブリット・コンボリューション・アテンション・ネットワーク(HCANet)を提案する。
主流HSIデータセットに対する実験結果は,提案したHCANetの合理性と有効性を示している。
論文 参考訳(メタデータ) (2024-03-15T07:18:43Z) - Diffusion-based Light Field Synthesis [50.24624071354433]
LFdiffは、LF合成に適した拡散ベースの生成フレームワークである。
本稿では,遠絡型雑音推定ネットワークDistgUnetを提案する。
広範囲な実験により、LFdiffは視覚的に快く、不均一に制御可能な光電場を合成する際に優れていることが示されている。
論文 参考訳(メタデータ) (2024-02-01T13:13:16Z) - Spatially Adaptive Self-Supervised Learning for Real-World Image
Denoising [73.71324390085714]
本稿では,現実の sRGB 画像復号化の問題を解決するために,新しい視点を提案する。
ノイズの多い画像における平坦領域とテクスチャ領域のそれぞれの特徴を考慮し、それらを個別に管理する。
LAN自体がBNNの出力で管理されているのに対して,我々はその要件を満たすためのローカル・アウェア・ネットワーク(LAN)を提案する。
論文 参考訳(メタデータ) (2023-03-27T06:18:20Z) - Learning Non-Local Spatial-Angular Correlation for Light Field Image
Super-Resolution [36.69391399634076]
光場(LF)画像超解像(SR)には空間-角相関の爆発が不可欠である
LF画像SRの非局所的空間角相関を学習するための簡易かつ効果的な手法を提案する。
提案手法は,全角視からの情報を完全に取り入れつつ,極上線に沿った大域的受容場を達成できる。
論文 参考訳(メタデータ) (2023-02-16T03:40:40Z) - I See-Through You: A Framework for Removing Foreground Occlusion in Both
Sparse and Dense Light Field Images [25.21481624956202]
光フィールド(LF)カメラは、シーンからリッチな情報をキャプチャする。その情報を用いて、LF非閉塞(LF-DeOcc)タスクは、閉塞のないセンタービューイメージを再構成することを目的としている。
本稿では,(1)LF特徴抽出,(2)隠蔽領域の定義,(3)無塗布閉塞領域の3つの役割からなるフレームワークISTYを提案する。
実験において、定性的および定量的な結果から、提案手法はスパースおよび密度の高いLFデータセットにおいて最先端のLF-DeOcc法より優れていることが示された。
論文 参考訳(メタデータ) (2023-01-16T12:25:42Z) - SSCAN: A Spatial-spectral Cross Attention Network for Hyperspectral
Image Denoising [12.873607414761093]
本稿では,グループ畳み込みとアテンションモジュールを組み合わせた新しいHSIデノベーションネットワークSSCANを提案する。
ハイパースペクトル画像における空間情報とスペクトル情報を有効利用するためのスペクトル空間アテンションブロック(SSAB)を提案する。
実験結果から,提案したSSCANは,最先端のHSI復調アルゴリズムよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2021-05-23T14:36:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。