論文の概要: MaskBlur: Spatial and Angular Data Augmentation for Light Field Image Super-Resolution
- arxiv url: http://arxiv.org/abs/2410.06478v1
- Date: Wed, 9 Oct 2024 02:12:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-01 05:29:07.063736
- Title: MaskBlur: Spatial and Angular Data Augmentation for Light Field Image Super-Resolution
- Title(参考訳): MaskBlur:Light Field Image Super-Resolutionのための空間的および角的データ拡張
- Authors: Wentao Chao, Fuqing Duan, Yulan Guo, Guanghui Wang,
- Abstract要約: MaskBlurは、限られたデータで光電場(LF)画像を強化するための新しい戦略である。
MaskBlurは空間的ぼやけと角ばった2つのコンポーネントで構成されている。
実験では、既存のSR法の性能を大幅に向上させるMaskBlurの有効性を実証した。
- 参考スコア(独自算出の注目度): 34.94804626159376
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Data augmentation (DA) is an effective approach for enhancing model performance with limited data, such as light field (LF) image super-resolution (SR). LF images inherently possess rich spatial and angular information. Nonetheless, there is a scarcity of DA methodologies explicitly tailored for LF images, and existing works tend to concentrate solely on either the spatial or angular domain. This paper proposes a novel spatial and angular DA strategy named MaskBlur for LF image SR by concurrently addressing spatial and angular aspects. MaskBlur consists of spatial blur and angular dropout two components. Spatial blur is governed by a spatial mask, which controls where pixels are blurred, i.e., pasting pixels between the low-resolution and high-resolution domains. The angular mask is responsible for angular dropout, i.e., selecting which views to perform the spatial blur operation. By doing so, MaskBlur enables the model to treat pixels differently in the spatial and angular domains when super-resolving LF images rather than blindly treating all pixels equally. Extensive experiments demonstrate the efficacy of MaskBlur in significantly enhancing the performance of existing SR methods. We further extend MaskBlur to other LF image tasks such as denoising, deblurring, low-light enhancement, and real-world SR. Code is publicly available at \url{https://github.com/chaowentao/MaskBlur}.
- Abstract(参考訳): データ拡張(DA)は、光場(LF)画像超解像(SR)のような限られたデータでモデル性能を向上させる効果的なアプローチである。
LF画像は本質的に、豊かな空間情報と角情報を持っている。
それにもかかわらず、LF画像用に明示的に調整されたDA手法が不足しており、既存の研究は空間領域と角領域の両方にのみ集中する傾向にある。
本稿では,空間的および角的側面を同時に扱うことで,LF画像SRのためのMaskBlurという新しい空間的および角的DA戦略を提案する。
MaskBlurは空間的ぼやけと角ばった2つのコンポーネントで構成されている。
空間的ぼかしは空間マスクによって制御され、低解像度領域と高解像度領域の間に画素を貼り付けるように、ピクセルがぼやけている場所を制御する。
角マスクは、空間的ぼやけた操作を行うためにどのビューを選択するかという、角状のドロップアウトに責任を負う。
MaskBlurは、すべてのピクセルを均等に扱うのではなく、超解像LF画像において、空間領域と角領域で異なるピクセルを扱えるようにします。
大規模な実験により、既存のSR法の性能を大幅に向上させるMaskBlurの有効性が示された。
さらに、MaskBlurをデノイング、デブロアリング、低照度向上、実世界のSRといった他のLFイメージタスクに拡張する。
コードは \url{https://github.com/chaowentao/MaskBlur} で公開されている。
関連論文リスト
- Beyond Subspace Isolation: Many-to-Many Transformer for Light Field
Image Super-resolution [5.277207972856879]
本稿では,光フィールド画像超解像処理のための新しいM2MTを提案する。
M2MTは、自己認識機構を実行する前に、空間部分空間内の角情報を集約する。
光フィールド画像内の全てのサブアパーチャ画像全体への完全なアクセスを可能にする。
論文 参考訳(メタデータ) (2024-01-01T12:48:23Z) - OAFuser: Towards Omni-Aperture Fusion for Light Field Semantic Segmentation [48.828453331724965]
我々は,Omni-Aperture Fusion Model (OAFuser) を提案する。
提案したOAFuserは,すべての評価指標から4つのUrbanLFデータセット上での最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-07-28T14:43:27Z) - Learning Non-Local Spatial-Angular Correlation for Light Field Image
Super-Resolution [36.69391399634076]
光場(LF)画像超解像(SR)には空間-角相関の爆発が不可欠である
LF画像SRの非局所的空間角相関を学習するための簡易かつ効果的な手法を提案する。
提案手法は,全角視からの情報を完全に取り入れつつ,極上線に沿った大域的受容場を達成できる。
論文 参考訳(メタデータ) (2023-02-16T03:40:40Z) - Layered Depth Refinement with Mask Guidance [61.10654666344419]
汎用マスクを用いてSIDEモデルの深度予測を洗練させるマスク誘導深度改善の新しい問題を定式化する。
本フレームワークは,奥行きマップをマスクと逆マスクで表される2つの別々の層に分解し,層状改質・塗装・塗装を行う。
本手法は,内面境界領域と外面境界領域の深度を正確に補正し,異なる種類のマスクや初期深度予測に対して堅牢であることを示す。
論文 参考訳(メタデータ) (2022-06-07T06:42:44Z) - Image Generation with Self Pixel-wise Normalization [17.147675335268282]
領域適応正規化(RAN)法はGAN(Generative Adversarial Network)に基づく画像と画像の変換技術で広く用いられている。
本稿では,マスク画像のない画素適応アフィン変換を行うことにより,自己画素ワイド正規化(SPN)と呼ばれる新しい正規化手法を提案する。
論文 参考訳(メタデータ) (2022-01-26T03:14:31Z) - Image Inpainting with Edge-guided Learnable Bidirectional Attention Maps [85.67745220834718]
不規則な穴の画像インペインティングを改善するためのエッジガイド学習可能な双方向注意マップ(Edge-LBAM)を紹介します。
当社のEdge-LBAMメソッドには、予測エッジによる構造認識マスク更新を含むデュアルプロシージャが含まれています。
広範な実験により,エッジlbamはコヒーレントな画像構造を生成し,色差やぼやけを防止できることがわかった。
論文 参考訳(メタデータ) (2021-04-25T07:25:16Z) - Light Field Reconstruction Using Convolutional Network on EPI and
Extended Applications [78.63280020581662]
スパースビューからの光場再構成のための新しい畳み込みニューラルネットワーク(CNN)ベースのフレームワークを開発した。
最先端のアルゴリズムと比較して,提案フレームワークの高性能と堅牢性を実証する。
論文 参考訳(メタデータ) (2021-03-24T08:16:32Z) - An Empirical Method to Quantify the Peripheral Performance Degradation
in Deep Networks [18.808132632482103]
畳み込みニューラルネットワーク(CNN)カーネルは、各畳み込み層に結合する。
より深いネットワークとストライドベースのダウンサンプリングを組み合わせることで、この領域の伝播は、画像の無視できない部分をカバーすることができる。
我々のデータセットは、高解像度の背景にオブジェクトを挿入することで構築され、画像境界に対してターゲットオブジェクトを特定の位置に配置するサブイメージを収穫することができる。
マスクR-CNNの動作を目標位置の選択にわたって探索することにより、画像境界付近、特に画像コーナーにおいて、パフォーマンス劣化の明確なパターンが明らかになる。
論文 参考訳(メタデータ) (2020-12-04T18:00:47Z) - Learning Light Field Angular Super-Resolution via a Geometry-Aware
Network [101.59693839475783]
そこで本研究では,広いベースラインを持つスパースサンプリング光場を超解き放つことを目的とした,エンド・ツー・エンドの学習ベースアプローチを提案する。
提案手法は,実行時間48$times$を節約しつつ,2番目のベストメソッドのPSNRを平均2dBまで改善する。
論文 参考訳(メタデータ) (2020-02-26T02:36:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。