論文の概要: A Novel Light Field Coding Scheme Based on Deep Belief Network &
Weighted Binary Images for Additive Layered Displays
- arxiv url: http://arxiv.org/abs/2210.01447v2
- Date: Fri, 21 Apr 2023 14:59:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-24 18:09:14.105766
- Title: A Novel Light Field Coding Scheme Based on Deep Belief Network &
Weighted Binary Images for Additive Layered Displays
- Title(参考訳): 付加層表示のためのディープリーフネットワークと重み付きバイナリ画像に基づく新しい光フィールド符号化方式
- Authors: Sally Khaidem and Mansi Sharma
- Abstract要約: 積層光減衰層は、広い視野深度、広い視野角、高解像度の光界ディスプレイを実装するためのアプローチである。
本稿では,Deep Belief Network(DBN)と重み付きバイナリ画像を利用した光場表現と符号化のための新しいフレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.30458514384586394
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Light-field displays create an immersive experience by providing binocular
depth sensation and motion parallax. Stacking light attenuating layers is one
approach to implement a light field display with a broader depth of field, wide
viewing angles and high resolution. Due to the transparent holographic optical
element (HOE) layers, additive layered displays can be integrated into
augmented reality (AR) wearables to overlay virtual objects onto the real
world, creating a seamless mixed reality (XR) experience. This paper proposes a
novel framework for light field representation and coding that utilizes Deep
Belief Network (DBN) and weighted binary images suitable for additive layered
displays. The weighted binary representation of layers makes the framework more
flexible for adaptive bitrate encoding. The framework effectively captures
intrinsic redundancies in the light field data, and thus provides a scalable
solution for light field coding suitable for XR display applications. The
latent code is encoded by H.265 codec generating a rate-scalable bit-stream. We
achieve adaptive bitrate decoding by varying the number of weighted binary
images and the H.265 quantization parameter, while maintaining an optimal
reconstruction quality. The framework is tested on real and synthetic benchmark
datasets, and the results validate the rate-scalable property of the proposed
scheme.
- Abstract(参考訳): 光界ディスプレイは両眼深度感覚と運動視差を提供することで没入感を生み出す。
積層光減衰層は、広い視野深度、広い視野角、高解像度の光界ディスプレイを実装するためのアプローチである。
透明なホログラフィック光学素子(hoe)層により、付加層ディスプレイを拡張現実(ar)ウェアラブルに統合することで、仮想オブジェクトを現実世界にオーバーレイし、シームレスな複合現実(xr)体験を実現することができる。
本稿では,重み付き重み付き2値画像とディープ信条ネットワーク(dbn)を用いた光場表現と符号化のための新しい枠組みを提案する。
レイヤの重み付けされたバイナリ表現により、適応ビットレートエンコーディングのフレームワークはより柔軟になる。
本フレームワークは,光フィールドデータの固有冗長性を効果的に捉え,XR表示に適した光フィールド符号化のためのスケーラブルなソリューションを提供する。
潜在コードはh.265コーデックで符号化され、レートスカラービットストリームを生成する。
最適な再構成品質を維持しつつ、重み付きバイナリ画像数とh.265量子化パラメータを変化させて適応ビットレート復号を実現する。
このフレームワークは,実および合成ベンチマークデータセット上でテストされ,提案手法のレートスケーリング性を検証する。
関連論文リスト
- CodeEnhance: A Codebook-Driven Approach for Low-Light Image Enhancement [97.95330185793358]
低照度画像強調(LLIE)は、低照度画像を改善することを目的としている。
既存の手法では、様々な明るさ劣化からの回復の不確実性と、テクスチャと色情報の喪失という2つの課題に直面している。
我々は、量子化された先行値と画像の精細化を利用して、新しいエンハンスメント手法、CodeEnhanceを提案する。
論文 参考訳(メタデータ) (2024-04-08T07:34:39Z) - Enhancing Low-light Light Field Images with A Deep Compensation Unfolding Network [52.77569396659629]
本稿では,低光環境下で撮像した光場(LF)画像の復元に,DCUNet(Deep compensation network openfolding)を提案する。
このフレームワークは、中間拡張結果を使用して照明マップを推定し、展開プロセスで新しい拡張結果を生成する。
本稿では,LF画像の特徴を適切に活用するために,擬似明示的特徴相互作用モジュールを提案する。
論文 参考訳(メタデータ) (2023-08-10T07:53:06Z) - Learning Kernel-Modulated Neural Representation for Efficient Light
Field Compression [41.24757573290883]
光場圧縮タスクのためのコンパクトニューラルネットワーク表現を設計する。
トレーニング中に学んだシーン記述情報を格納する記述カーネル(ディスクリプタ)と、クエリされた視点から異なるSAIのレンダリングを制御する変調カーネル(モジュレータ)の2種類で構成されている。
論文 参考訳(メタデータ) (2023-07-12T12:58:03Z) - Spatiotemporally Consistent HDR Indoor Lighting Estimation [66.26786775252592]
本研究では,屋内照明推定問題を解決するための物理動機付きディープラーニングフレームワークを提案する。
深度マップを用いた1枚のLDR画像から,任意の画像位置における空間的に一貫した照明を予測できる。
我々のフレームワークは、最先端の単一画像やビデオベースの手法と比較して、高画質で光リアリスティック照明予測を実現する。
論文 参考訳(メタデータ) (2023-05-07T20:36:29Z) - Scattering-induced entropy boost for highly-compressed optical sensing and encryption [7.502671257653539]
画像センシングは、大きな視野と高解像度を持つ高品質のマシンビジョンシステムに依存していることが多い。
資源効率の高い画像分類のための新しい画像フリーセンシングフレームワークを提案する。
提案手法は, MNISTデータセットの分類において, サンプリングレートが1%, 5%で95%以上精度が得られた。
論文 参考訳(メタデータ) (2022-12-16T09:00:42Z) - RTMV: A Ray-Traced Multi-View Synthetic Dataset for Novel View Synthesis [104.53930611219654]
約2000の複雑なシーンからレンダリングされた300k画像からなる,新しいビュー合成のための大規模合成データセットを提案する。
データセットは、新しいビュー合成のための既存の合成データセットよりも桁違いに大きい。
高品質な3Dメッシュの4つのソースを使用して、私たちのデータセットのシーンは、カメラビュー、照明、形状、材料、テクスチャの難しいバリエーションを示します。
論文 参考訳(メタデータ) (2022-05-14T13:15:32Z) - Neural Étendue Expander for Ultra-Wide-Angle High-Fidelity Holographic Display [51.399291206537384]
現代のホログラフィックディスプレイは、表示領域と回折光の最大固体角度の積である低い「エンテンダ」を有する。
自然画像データセットから学習したニューラルな「固有拡大器」を提案する。
ニューラルネットワーク拡張器を用いて,64$times$ 'etendue expansion of natural image in full color, and expand the FOV by a magnitude of horizontal and vertically。
論文 参考訳(メタデータ) (2021-09-16T17:21:52Z) - A Novel Hierarchical Light Field Coding Scheme Based on Hybrid Stacked
Multiplicative Layers and Fourier Disparity Layers for Glasses-Free 3D
Displays [0.6091702876917279]
低ランク乗算層とフーリエ差分層の透過パターンに基づく光場のための新しい階層型符号化方式を提案する。
提案手法は,異なる走査順序の畳み込みニューラルネットワークを用いて最適化された光界ビューサブセットの乗法層を同定する。
論文 参考訳(メタデータ) (2021-08-27T17:09:29Z) - DeepLight: Robust & Unobtrusive Real-time Screen-Camera Communication
for Real-World Displays [4.632704227272501]
DeepLightは、デコードパイプラインに機械学習(ML)モデルを取り入れ、人間に受け入れられない、適度に高いSCCレートを実現するシステムです。
DeepLightの主な革新は、ディスプレイフレームに空間的にエンコードされたすべてのビットをまとめてデコードするDeep Neural Network(DNN)ベースのデコーダの設計です。
論文 参考訳(メタデータ) (2021-05-11T14:44:12Z) - Generative Modelling of BRDF Textures from Flash Images [50.660026124025265]
我々は、容易にキャプチャ、セマンティックな編集、一貫した、視覚素材の外観の効率よく再現できる潜在空間を学習する。
2番目のステップでは、材料コードに基づいて、私たちの方法は、BRDFモデルパラメータの無限で多様な空間フィールドを生成します。
論文 参考訳(メタデータ) (2021-02-23T18:45:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。