論文の概要: LFIC-DRASC: Deep Light Field Image Compression Using Disentangled Representation and Asymmetrical Strip Convolution
- arxiv url: http://arxiv.org/abs/2409.11711v1
- Date: Wed, 18 Sep 2024 05:33:42 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-19 19:00:08.081646
- Title: LFIC-DRASC: Deep Light Field Image Compression Using Disentangled Representation and Asymmetrical Strip Convolution
- Title(参考訳): LFIC-DRASC:アンタングル表現と非対称ストリップ畳み込みを用いた深部光場画像圧縮
- Authors: Shiyu Feng, Yun Zhang, Linwei Zhu, Sam Kwong,
- Abstract要約: ディスタングル表現と非対称ストリップ畳み込みを用いたエンドツーエンドのディープLF画像圧縮法を提案する。
実験の結果,提案したLFIC-DRASCは平均20.5%のビットレート削減を達成した。
- 参考スコア(独自算出の注目度): 51.909036244222904
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Light-Field (LF) image is emerging 4D data of light rays that is capable of realistically presenting spatial and angular information of 3D scene. However, the large data volume of LF images becomes the most challenging issue in real-time processing, transmission, and storage. In this paper, we propose an end-to-end deep LF Image Compression method Using Disentangled Representation and Asymmetrical Strip Convolution (LFIC-DRASC) to improve coding efficiency. Firstly, we formulate the LF image compression problem as learning a disentangled LF representation network and an image encoding-decoding network. Secondly, we propose two novel feature extractors that leverage the structural prior of LF data by integrating features across different dimensions. Meanwhile, disentangled LF representation network is proposed to enhance the LF feature disentangling and decoupling. Thirdly, we propose the LFIC-DRASC for LF image compression, where two Asymmetrical Strip Convolution (ASC) operators, i.e. horizontal and vertical, are proposed to capture long-range correlation in LF feature space. These two ASC operators can be combined with the square convolution to further decouple LF features, which enhances the model ability in representing intricate spatial relationships. Experimental results demonstrate that the proposed LFIC-DRASC achieves an average of 20.5\% bit rate reductions comparing with the state-of-the-art methods.
- Abstract(参考訳): 光ファイバー(LF)画像は、3Dシーンの空間的・角的な情報を現実的に提示できる光線の4Dデータを生み出している。
しかし、LF画像の膨大なデータ量は、リアルタイム処理、送信、ストレージにおいて最も難しい問題となっている。
本稿では、符号化効率を向上させるために、ディスタングル表現と非対称ストリップ畳み込み(LFIC-DRASC)を用いたエンドツーエンドの深いLF画像圧縮手法を提案する。
まず、不整合LF表現ネットワークと画像符号化復号ネットワークの学習として、LF画像圧縮問題を定式化する。
次に,異なる次元にまたがる特徴を統合することで,LFデータの構造的先行性を活用する2つの新しい特徴抽出器を提案する。
一方、アンタングル化されたLF表現ネットワークは、アンタングル化とデカップリングを向上するために提案されている。
第3に、LF画像圧縮のためのLFIC-DRASCを提案し、2つの非対称ストリップ畳み込み(ASC)演算子(水平および垂直)を提案し、LF特徴空間における長距離相関を捉える。
これら2つのASC演算子は正方形畳み込みと組み合わせてLF特徴をさらに分離し、複雑な空間関係を表現するモデル能力を高めることができる。
実験結果から,提案したLFIC-DRASCは,最先端手法と比較して平均20.5\%のビットレート削減を実現していることがわかった。
関連論文リスト
- Diffusion-based Light Field Synthesis [50.24624071354433]
LFdiffは、LF合成に適した拡散ベースの生成フレームワークである。
本稿では,遠絡型雑音推定ネットワークDistgUnetを提案する。
広範囲な実験により、LFdiffは視覚的に快く、不均一に制御可能な光電場を合成する際に優れていることが示されている。
論文 参考訳(メタデータ) (2024-02-01T13:13:16Z) - Enhancing Low-light Light Field Images with A Deep Compensation Unfolding Network [52.77569396659629]
本稿では,低光環境下で撮像した光場(LF)画像の復元に,DCUNet(Deep compensation network openfolding)を提案する。
このフレームワークは、中間拡張結果を使用して照明マップを推定し、展開プロセスで新しい拡張結果を生成する。
本稿では,LF画像の特徴を適切に活用するために,擬似明示的特徴相互作用モジュールを提案する。
論文 参考訳(メタデータ) (2023-08-10T07:53:06Z) - Physics-Informed Ensemble Representation for Light-Field Image
Super-Resolution [12.156009287223382]
我々は、光場(LF)撮像プロセスの座標変換を分析し、LF画像の幾何学的関係を明らかにする。
我々は,仮想スリット画像(VSI)の新たなLF部分空間を導入し,サブアパーチャ画像に補完するサブピクセル情報を提供する。
アンサンプされたLFデータから画像構造を超解き出すために,EPIXformer という幾何認識デコーダを提案する。
論文 参考訳(メタデータ) (2023-05-31T16:27:00Z) - Real-World Light Field Image Super-Resolution via Degradation Modulation [59.68036846233918]
本稿では,実世界のLF画像 SR の簡易かつ効果的な手法を提案する。
実際のLF画像の劣化過程を定式化するために,実用的なLF劣化モデルを開発した。
畳み込みニューラルネットワークは、SRプロセスの前に分解を組み込むように設計されている。
論文 参考訳(メタデータ) (2022-06-13T14:44:46Z) - Disentangling Light Fields for Super-Resolution and Disparity Estimation [67.50796924758221]
光フィールド(LF)カメラは光線の強度と方向の両方を記録し、3Dシーンを4DLF画像にエンコードする。
空間的・角的な情報は様々な相違で高度に絡み合っているため、畳み込みニューラルネットワーク(CNN)がLF画像を処理することは困難である。
本稿では,この結合した情報をLF画像処理のために切り離すための汎用メカニズムを提案する。
論文 参考訳(メタデータ) (2022-02-22T01:04:41Z) - Deep Selective Combinatorial Embedding and Consistency Regularization
for Light Field Super-resolution [93.95828097088608]
ハンドヘルドデバイスが取得した光フィールド(LF)画像は通常、空間分解能の低下に悩まされる。
LF画像の高次元特性と複雑な幾何学構造は、従来の単一像SRよりも問題をより困難にしている。
本稿では,LFサブアパーチャ画像間のコヒーレンスを探索するための,新しい学習ベースLF空間SRフレームワークを提案する。
合成および実世界のLFデータセットに対する実験結果は、最先端手法に対する我々のアプローチの顕著な利点を示している。
論文 参考訳(メタデータ) (2020-09-26T08:34:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。