論文の概要: Physics-Informed Ensemble Representation for Light-Field Image
Super-Resolution
- arxiv url: http://arxiv.org/abs/2305.20006v1
- Date: Wed, 31 May 2023 16:27:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-01 15:25:00.114331
- Title: Physics-Informed Ensemble Representation for Light-Field Image
Super-Resolution
- Title(参考訳): 光ファイバー画像超解像のための物理インフォームエンサンブル表現
- Authors: Manchang Jin, Gaosheng Liu, Kunshu Hu, Xin Luo, Kun Li, Jingyu Yang
- Abstract要約: 我々は、光場(LF)撮像プロセスの座標変換を分析し、LF画像の幾何学的関係を明らかにする。
我々は,仮想スリット画像(VSI)の新たなLF部分空間を導入し,サブアパーチャ画像に補完するサブピクセル情報を提供する。
アンサンプされたLFデータから画像構造を超解き出すために,EPIXformer という幾何認識デコーダを提案する。
- 参考スコア(独自算出の注目度): 12.156009287223382
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent learning-based approaches have achieved significant progress in light
field (LF) image super-resolution (SR) by exploring convolution-based or
transformer-based network structures. However, LF imaging has many intrinsic
physical priors that have not been fully exploited. In this paper, we analyze
the coordinate transformation of the LF imaging process to reveal the geometric
relationship in the LF images. Based on such geometric priors, we introduce a
new LF subspace of virtual-slit images (VSI) that provide sub-pixel information
complementary to sub-aperture images. To leverage the abundant correlation
across the four-dimensional data with manageable complexity, we propose
learning ensemble representation of all $C_4^2$ LF subspaces for more effective
feature extraction. To super-resolve image structures from undersampled LF
data, we propose a geometry-aware decoder, named EPIXformer, which constrains
the transformer's operational searching regions with a LF physical prior.
Experimental results on both spatial and angular SR tasks demonstrate that the
proposed method outperforms other state-of-the-art schemes, especially in
handling various disparities.
- Abstract(参考訳): 最近の学習に基づくアプローチは、畳み込みベースまたはトランスフォーマーベースのネットワーク構造を探索することで、光場(lf)像の超解像(sr)において大きな進歩を遂げている。
しかし、LFイメージングには、十分に活用されていない多くの本質的な物理的先行性がある。
本稿では,lf撮像プロセスの座標変換を解析し,lf像の幾何学的関係を明らかにする。
このような幾何学的前提に基づいて、サブピクセル情報を提供する仮想スリット画像(VSI)の新しいLFサブ空間を導入する。
そこで我々は,4次元データ間の豊富な相関を複雑に管理するために,より効率的な特徴抽出のために,すべての$C_4^2$LF部分空間の学習アンサンブル表現を提案する。
lfデータから画像構造を超解くために,変換器の演算探索領域をlf物理前処理で制約するエピックスフォーマと呼ばれる幾何認識デコーダを提案する。
空間的および角的SRタスクにおける実験結果から,提案手法が他の最先端のスキーム,特に様々な相違に優れることを示した。
関連論文リスト
- LFIC-DRASC: Deep Light Field Image Compression Using Disentangled Representation and Asymmetrical Strip Convolution [51.909036244222904]
ディスタングル表現と非対称ストリップ畳み込みを用いたエンドツーエンドのディープLF画像圧縮法を提案する。
実験の結果,提案したLFIC-DRASCは平均20.5%のビットレート削減を達成した。
論文 参考訳(メタデータ) (2024-09-18T05:33:42Z) - Enhancing Low-light Light Field Images with A Deep Compensation Unfolding Network [52.77569396659629]
本稿では,低光環境下で撮像した光場(LF)画像の復元に,DCUNet(Deep compensation network openfolding)を提案する。
このフレームワークは、中間拡張結果を使用して照明マップを推定し、展開プロセスで新しい拡張結果を生成する。
本稿では,LF画像の特徴を適切に活用するために,擬似明示的特徴相互作用モジュールを提案する。
論文 参考訳(メタデータ) (2023-08-10T07:53:06Z) - Disentangling Light Fields for Super-Resolution and Disparity Estimation [67.50796924758221]
光フィールド(LF)カメラは光線の強度と方向の両方を記録し、3Dシーンを4DLF画像にエンコードする。
空間的・角的な情報は様々な相違で高度に絡み合っているため、畳み込みニューラルネットワーク(CNN)がLF画像を処理することは困難である。
本稿では,この結合した情報をLF画像処理のために切り離すための汎用メカニズムを提案する。
論文 参考訳(メタデータ) (2022-02-22T01:04:41Z) - Detail-Preserving Transformer for Light Field Image Super-Resolution [15.53525700552796]
我々は,光場超解像をシーケンス・ツー・シーケンスの再構成タスクとして扱うことにより,トランスフォーマー上に構築された新しい定式化を行った。
本稿では,光場の勾配マップを利用してシーケンス学習のガイドを行うことにより,ディテール保存型変換器(DPT)を提案する。
DPTは2つのブランチで構成され、それぞれがトランスフォーマーに関連付けられ、オリジナルまたはグラデーション画像シーケンスから学習する。
論文 参考訳(メタデータ) (2022-01-02T12:33:23Z) - Light Field Image Super-Resolution with Transformers [11.104338786168324]
CNNに基づく手法は、LF画像SRにおいて顕著な性能を達成した。
LF画像SRのための簡易だが効果的なトランスフォーマー方式を提案する。
本手法は,モデルサイズが小さく,計算コストが低く,優れたSR性能を実現する。
論文 参考訳(メタデータ) (2021-08-17T12:58:11Z) - Learning Dynamic Interpolation for Extremely Sparse Light Fields with
Wide Baselines [42.59723383219793]
本稿では、一般的な幾何学的ワープ操作を置き換えるための学習可能なモデル、すなわち動的再構成を提案する。
実験の結果,再建したLF重みはPSNR/SSIMよりもはるかに高い値を示し,LFパララックス構造は最先端の手法よりも良好であることがわかった。
論文 参考訳(メタデータ) (2021-08-17T02:20:03Z) - A Parallel Down-Up Fusion Network for Salient Object Detection in
Optical Remote Sensing Images [82.87122287748791]
光リモートセンシング画像(RSI)における有意な物体検出のための新しい並列ダウンアップフュージョンネットワーク(PDF-Net)を提案する。
In-pathの低レベル・高レベルな特徴とクロスパスの多解像度な特徴をフル活用して、多様なスケールのサルエントオブジェクトを識別し、散らかった背景を抑える。
ORSSDデータセットの実験により、提案したネットワークは定性的かつ定量的に最先端のアプローチよりも優れていることが示された。
論文 参考訳(メタデータ) (2020-10-02T05:27:57Z) - Deep Selective Combinatorial Embedding and Consistency Regularization
for Light Field Super-resolution [93.95828097088608]
ハンドヘルドデバイスが取得した光フィールド(LF)画像は通常、空間分解能の低下に悩まされる。
LF画像の高次元特性と複雑な幾何学構造は、従来の単一像SRよりも問題をより困難にしている。
本稿では,LFサブアパーチャ画像間のコヒーレンスを探索するための,新しい学習ベースLF空間SRフレームワークを提案する。
合成および実世界のLFデータセットに対する実験結果は、最先端手法に対する我々のアプローチの顕著な利点を示している。
論文 参考訳(メタデータ) (2020-09-26T08:34:37Z) - Light Field Spatial Super-resolution via Deep Combinatorial Geometry
Embedding and Structural Consistency Regularization [99.96632216070718]
ハンドヘルドデバイスが取得した光フィールド(LF)画像は通常、空間分解能の低下に悩まされる。
LF画像の高次元空間特性と複雑な幾何学構造は、従来の単一像SRよりも問題をより困難にしている。
本稿では,LF画像の各ビューを個別に超解答する新しい学習ベースLFフレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-05T14:39:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。