論文の概要: A Hierarchical Coding Scheme for Glasses-free 3D Displays Based on
Scalable Hybrid Layered Representation of Real-World Light Fields
- arxiv url: http://arxiv.org/abs/2104.09378v1
- Date: Mon, 19 Apr 2021 15:09:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-20 13:47:21.134180
- Title: A Hierarchical Coding Scheme for Glasses-free 3D Displays Based on
Scalable Hybrid Layered Representation of Real-World Light Fields
- Title(参考訳): 実世界の光場のスケーラブルハイブリッド層表現に基づくガラスフリー3次元ディスプレイの階層符号化方式
- Authors: Joshitha R and Mansi Sharma
- Abstract要約: Schemeは、異なる走査順序から決定される光界ビューのサブセットから、積み重ねた乗法レイヤを学習する。
層状パターンの空間的相関は、クリロフ部分空間上の特異値分解から導かれる係数化の低い階数で悪用される。
HEVCによるエンコーディングは、低ランク近似層におけるイントラビューおよびインタービュー相関を効率的に除去する。
- 参考スコア(独自算出の注目度): 0.6091702876917279
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a novel hierarchical coding scheme for light fields based
on transmittance patterns of low-rank multiplicative layers and Fourier
disparity layers. The proposed scheme learns stacked multiplicative layers from
subsets of light field views determined from different scanning orders. The
multiplicative layers are optimized using a fast data-driven convolutional
neural network (CNN). The spatial correlation in layer patterns is exploited
with varying low ranks in factorization derived from singular value
decomposition on a Krylov subspace. Further, encoding with HEVC efficiently
removes intra-view and inter-view correlation in low-rank approximated layers.
The initial subset of approximated decoded views from multiplicative
representation is used to construct Fourier disparity layer (FDL)
representation. The FDL model synthesizes second subset of views which is
identified by a pre-defined hierarchical prediction order. The correlations
between the prediction residue of synthesized views is further eliminated by
encoding the residual signal. The set of views obtained from decoding the
residual is employed in order to refine the FDL model and predict the next
subset of views with improved accuracy. This hierarchical procedure is repeated
until all light field views are encoded. The critical advantage of proposed
hybrid layered representation and coding scheme is that it utilizes not just
spatial and temporal redundancies, but efficiently exploits the strong
intrinsic similarities among neighboring sub-aperture images in both horizontal
and vertical directions as specified by different predication orders. Besides,
the scheme is flexible to realize a range of multiple bitrates at the decoder
within a single integrated system. The compression performance analyzed with
real light field shows substantial bitrate savings, maintaining good
reconstruction quality.
- Abstract(参考訳): 本稿では,低位乗算層とフーリエ分散層の透過パターンに基づく光場の新しい階層的符号化方式を提案する。
提案手法は、異なる走査順序から決定される光界ビューのサブセットから積み重ねた乗法層を学習する。
乗算層は高速データ駆動畳み込みニューラルネットワーク(cnn)を用いて最適化される。
層状パターンの空間的相関は、クリロフ部分空間上の特異値分解から導かれる係数化の低い階数で悪用される。
さらに、HEVCを用いた符号化は、低ランク近似層におけるビュー内およびビュー間相関を効率的に除去する。
乗法表現からの近似復号化ビューの初期部分集合を用いてフーリエ分散層(FDL)表現を構築する。
FDLモデルは、事前に定義された階層的予測順序によって識別されるビューの第2サブセットを合成する。
残差信号の符号化により、合成されたビューの予測残差間の相関をさらに排除する。
残差を復号して得られるビューの集合を用いて、FDLモデルを洗練し、次のサブセットのビューを精度良く予測する。
この階層的な手順はすべてのライトフィールドビューがエンコードされるまで繰り返される。
提案手法の利点は,空間的および時間的冗長性だけでなく,異なる述語順序で指定された水平方向と垂直方向の隣接するサブアパーチャ画像の強い内在的類似性を効果的に活用することにある。
さらに、このスキームは単一の統合システム内のデコーダで複数のビットレートの範囲を実現するのに柔軟である。
実光場を用いて解析した圧縮性能は、かなりのビットレートの節約を示し、良好な復元品質を維持している。
関連論文リスト
- Multiscale Graph Neural Network Autoencoders for Interpretable
Scientific Machine Learning [0.0]
この研究の目的は、オートエンコーダベースのモデルにおいて、潜在空間解釈可能性と非構造化メッシュとの互換性という2つの制限に対処することである。
これは、複雑な流体流れのアプリケーションのデモを含む、新しいグラフニューラルネットワーク(GNN)自動エンコーディングアーキテクチャの開発によって達成される。
論文 参考訳(メタデータ) (2023-02-13T08:47:11Z) - WLD-Reg: A Data-dependent Within-layer Diversity Regularizer [98.78384185493624]
ニューラルネットワークは、勾配に基づく最適化と共同で訓練された階層構造に配置された複数の層で構成されている。
我々は、この従来の「中間層」フィードバックを補うために、同じ層内での活性化の多様性を促進するために、追加の「中間層」フィードバックを補うことを提案する。
本稿では,提案手法が複数のタスクにおける最先端ニューラルネットワークモデルの性能を向上させることを実証した広範な実証研究を提案する。
論文 参考訳(メタデータ) (2023-01-03T20:57:22Z) - Semantic Image Synthesis via Diffusion Models [159.4285444680301]
Denoising Diffusion Probabilistic Models (DDPM) は様々な画像生成タスクにおいて顕著な成功を収めた。
セマンティック画像合成に関する最近の研究は、主に「GAN(Generative Adversarial Nets)」に追従している。
論文 参考訳(メタデータ) (2022-06-30T18:31:51Z) - PINs: Progressive Implicit Networks for Multi-Scale Neural
Representations [68.73195473089324]
周波数符号化のインクリメンタルな集合に階層構造を露出するプログレッシブな位置符号化を提案する。
本モデルでは,広帯域のシーンを正確に再構成し,プログレッシブなディテールでシーン表現を学習する。
いくつかの2次元および3次元データセットの実験では、ベースラインと比較して、再構築精度、表現能力、トレーニング速度が改善されている。
論文 参考訳(メタデータ) (2022-02-09T20:33:37Z) - A Novel Hierarchical Light Field Coding Scheme Based on Hybrid Stacked
Multiplicative Layers and Fourier Disparity Layers for Glasses-Free 3D
Displays [0.6091702876917279]
低ランク乗算層とフーリエ差分層の透過パターンに基づく光場のための新しい階層型符号化方式を提案する。
提案手法は,異なる走査順序の畳み込みニューラルネットワークを用いて最適化された光界ビューサブセットの乗法層を同定する。
論文 参考訳(メタデータ) (2021-08-27T17:09:29Z) - Modulated Periodic Activations for Generalizable Local Functional
Representations [113.64179351957888]
我々は,複数のインスタンスに一般化し,最先端の忠実性を実現する新しい表現を提案する。
提案手法は,画像,映像,形状の汎用的な機能表現を生成し,単一信号に最適化された先行処理よりも高い再構成品質を実現する。
論文 参考訳(メタデータ) (2021-04-08T17:59:04Z) - Layer Decomposition Learning Based on Gaussian Convolution Model and
Residual Deblurring for Inverse Halftoning [7.462336024223669]
入力画像をベース層とディテール層に分離するための層分解は、画像復元に着実に使われている。
逆ハーフトニングでは、均質な点パターンは残留層から小さな出力範囲を妨げている。
ガウス畳み込みモデル(GCM)と構造認識デブレーション戦略に基づく新しい層分解ネットワークを提示する。
論文 参考訳(メタデータ) (2020-12-27T09:15:00Z) - Dual-constrained Deep Semi-Supervised Coupled Factorization Network with
Enriched Prior [80.5637175255349]
本稿では、DS2CF-Netと呼ばれる、拡張された事前制約付きDual-Constrained Deep Semi-Supervised Coupled Factorization Networkを提案する。
隠れた深い特徴を抽出するために、DS2CF-Netは、深い構造と幾何学的な構造に制約のあるニューラルネットワークとしてモデル化される。
我々のネットワークは、表現学習とクラスタリングのための最先端の性能を得ることができる。
論文 参考訳(メタデータ) (2020-09-08T13:10:21Z) - Rethinking and Improving Natural Language Generation with Layer-Wise
Multi-View Decoding [59.48857453699463]
シーケンシャル・ツー・シーケンス学習では、デコーダは注意機構に依存してエンコーダから情報を効率的に抽出する。
近年の研究では、異なるエンコーダ層からの表現を多様なレベルの情報に利用することが提案されている。
本稿では, 各デコーダ層に対して, グローバルビューとして機能する最後のエンコーダ層からの表現とともに, ソースシーケンスの立体視のために他のエンコーダ層からのデコーダ層からのデコーダ層を補足するレイヤワイド・マルチビューデコーダを提案する。
論文 参考訳(メタデータ) (2020-05-16T20:00:39Z) - Generalized Octave Convolutions for Learned Multi-Frequency Image
Compression [20.504561050200365]
本稿では,初めて学習されたマルチ周波数画像圧縮とエントロピー符号化手法を提案する。
これは最近開発されたオクターブの畳み込みに基づいて、潜水剤を高周波(高分解能)成分に分解する。
提案した一般化オクターブ畳み込みは、他のオートエンコーダベースのコンピュータビジョンタスクの性能を向上させることができることを示す。
論文 参考訳(メタデータ) (2020-02-24T01:35:29Z) - Multi-Level Representation Learning for Deep Subspace Clustering [10.506584969668792]
本稿では、畳み込みオートエンコーダを用いた新しい深部部分空間クラスタリング手法を提案する。
4つの実世界のデータセットに対する実験により、我々の手法は、ほとんどのサブスペースクラスタリング問題における最先端の手法よりも優れた性能を示すことが示された。
論文 参考訳(メタデータ) (2020-01-19T23:29:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。