論文の概要: A Novel Unified Model for Multi-exposure Stereo Coding Based on Low Rank
Tucker-ALS and 3D-HEVC
- arxiv url: http://arxiv.org/abs/2104.04726v1
- Date: Sat, 10 Apr 2021 10:10:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-13 14:15:29.417149
- Title: A Novel Unified Model for Multi-exposure Stereo Coding Based on Low Rank
Tucker-ALS and 3D-HEVC
- Title(参考訳): 低ランクタッカーALSと3D-HEVCに基づくマルチ露光ステレオ符号化の統一モデル
- Authors: Mansi Sharma, Aditya Wadaskar
- Abstract要約: テンソル低ランク近似に基づくマルチ露光ステレオ画像の効率的な符号化法を提案する。
マルチ露光融合によりデコーダのHDRステレオ出力が生成され、リアリズムと両眼3D深度が向上する。
3D-HEVCによる符号化は、低ランク近似表現におけるフレーム内、ビュー間、コンポーネント間冗長性を利用して提案されたスキーム効率を向上させる。
- 参考スコア(独自算出の注目度): 0.6091702876917279
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Display technology must offer high dynamic range (HDR) contrast-based depth
induction and 3D personalization simultaneously. Efficient algorithms to
compress HDR stereo data is critical. Direct capturing of HDR content is
complicated due to the high expense and scarcity of HDR cameras. The HDR 3D
images could be generated in low-cost by fusing low-dynamic-range (LDR) images
acquired using a stereo camera with various exposure settings. In this paper,
an efficient scheme for coding multi-exposure stereo images is proposed based
on a tensor low-rank approximation scheme. The multi-exposure fusion can be
realized to generate HDR stereo output at the decoder for increased realism and
exaggerated binocular 3D depth cues.
For exploiting spatial redundancy in LDR stereo images, the stack of
multi-exposure stereo images is decomposed into a set of projection matrices
and a core tensor following an alternating least squares Tucker decomposition
model. The compact, low-rank representation of the scene, thus, generated is
further processed by 3D extension of High Efficiency Video Coding standard. The
encoding with 3D-HEVC enhance the proposed scheme efficiency by exploiting
intra-frame, inter-view and the inter-component redundancies in low-rank
approximated representation. We consider constant luminance property of IPT and
Y'CbCr color space to precisely approximate intensity prediction and
perceptually minimize the encoding distortion. Besides, the proposed scheme
gives flexibility to adjust the bitrate of tensor latent components by changing
the rank of core tensor and its quantization. Extensive experiments on natural
scenes demonstrate that the proposed scheme outperforms state-of-the-art
JPEG-XT and 3D-HEVC range coding standards.
- Abstract(参考訳): ディスプレイ技術はハイダイナミックレンジ(hdr)のコントラストに基づく奥行き誘導と3次元パーソナライズを同時に提供する必要がある。
HDRステレオデータを効率よく圧縮するアルゴリズムが重要である。
HDRカメラのコストと不足のため、HDRコンテンツの直接キャプチャは複雑である。
HDR 3D画像は、様々な露出設定のステレオカメラを用いて取得した低ダイナミックレンジ(LDR)画像を融合することにより、低コストで生成することができる。
本稿では,テンソル低ランク近似に基づくマルチ露光ステレオ画像の効率的な符号化手法を提案する。
マルチ露光融合により、デコーダでHDRステレオ出力を生成し、現実性を高め、双眼3D奥行きを誇張することができる。
LDRステレオ画像における空間冗長性を利用するために、マルチ露光ステレオ画像のスタックを、最小二乗タッカー分解モデルに従って投影行列とコアテンソルのセットに分解する。
シーンのコンパクトで低ランクな表現は、高効率ビデオ符号化規格の3D拡張によりさらに処理される。
3d-hevcを用いた符号化は, フレーム内, ビュー間および部品間冗長性を低ランク近似表現で活用することにより, 提案手法の効率を高める。
我々は、IPTおよびY'CbCr色空間の輝度特性を正確に近似し、符号化歪みを知覚的に最小化するために検討する。
さらに,提案手法は,コアテンソルのランクと量子化を変化させることで,テンソル潜在成分のビットレートを柔軟に調整する。
自然界における大規模な実験により,提案手法は最先端のJPEG-XTと3D-HEVC範囲の符号化基準より優れていることが示された。
関連論文リスト
- Direct and Explicit 3D Generation from a Single Image [25.207277983430608]
マルチビュー2次元深度画像とRGB画像を用いて表面形状とテクスチャを直接生成する新しいフレームワークを提案する。
画素レベルの多視点整合性を実現するために,エピポーラの注意を潜時から画素間デコーダに組み込む。
生成した深度画素を3次元空間にバックプロジェクションすることにより、構造化された3次元表現を生成する。
論文 参考訳(メタデータ) (2024-11-17T03:14:50Z) - Pixel-Aligned Multi-View Generation with Depth Guided Decoder [86.1813201212539]
画素レベルの画像・マルチビュー生成のための新しい手法を提案する。
従来の作業とは異なり、潜伏映像拡散モデルのVAEデコーダにマルチビュー画像にアテンション層を組み込む。
本モデルにより,マルチビュー画像間の画素アライメントが向上する。
論文 参考訳(メタデータ) (2024-08-26T04:56:41Z) - HDRGS: High Dynamic Range Gaussian Splatting [19.119572715951172]
高ダイナミックレンジ(GS)法は輝度によって色次元を向上し、トーンマッピングに非対称グリッドを使用する。
本手法は, 合成シナリオと実世界のシナリオの両方において, 現在の最先端技術を超えている。
論文 参考訳(メタデータ) (2024-08-13T00:32:36Z) - Generating Content for HDR Deghosting from Frequency View [56.103761824603644]
近年の拡散モデル (DM) はHDRイメージング分野に導入されている。
DMは画像全体を推定するために大きなモデルで広範囲の反復を必要とする。
ゴーストフリーHDRイメージングのための低周波数対応拡散(LF-Diff)モデルを提案する。
論文 参考訳(メタデータ) (2024-04-01T01:32:11Z) - Event-based Asynchronous HDR Imaging by Temporal Incident Light Modulation [54.64335350932855]
我々は,HDRイメージングの課題に関する重要な知見に基づいて,Pixel-Asynchronous HDRイメージングシステムを提案する。
提案システムでは,DVS(Dynamic Vision Sensors)とLCDパネルを統合する。
LCDパネルは、その透過性を変化させてDVSの照射インシデントを変調し、ピクセル非依存のイベントストリームをトリガーする。
論文 参考訳(メタデータ) (2024-03-14T13:45:09Z) - Fast High Dynamic Range Radiance Fields for Dynamic Scenes [39.3304365600248]
我々はHDR-HexPlaneという動的HDR NeRFフレームワークを提案し、様々な露出で捉えた動的2D画像から3Dシーンを学習する。
提案したモデルでは、任意の時点における高品質なノベルビュー画像を、望まれる露光でレンダリングすることができる。
論文 参考訳(メタデータ) (2024-01-11T17:15:16Z) - Spatiotemporally Consistent HDR Indoor Lighting Estimation [66.26786775252592]
本研究では,屋内照明推定問題を解決するための物理動機付きディープラーニングフレームワークを提案する。
深度マップを用いた1枚のLDR画像から,任意の画像位置における空間的に一貫した照明を予測できる。
我々のフレームワークは、最先端の単一画像やビデオベースの手法と比較して、高画質で光リアリスティック照明予測を実現する。
論文 参考訳(メタデータ) (2023-05-07T20:36:29Z) - Ghost-free High Dynamic Range Imaging via Hybrid CNN-Transformer and
Structure Tensor [12.167049432063132]
本稿では,ゴーストフリーなHDR画像を生成するために,畳み込みエンコーダとトランスフォーマーデコーダを組み合わせたハイブリッドモデルを提案する。
エンコーダでは、マルチスケール機能を最適化するために、コンテキスト集約ネットワークと非ローカルアテンションブロックが採用されている。
Swin Transformer に基づくデコーダを用いて,提案モデルの再構成性能を向上させる。
論文 参考訳(メタデータ) (2022-12-01T15:43:32Z) - Deep Parametric 3D Filters for Joint Video Denoising and Illumination
Enhancement in Video Super Resolution [96.89588203312451]
本稿では,Deep Parametric 3D Filters (DP3DF) と呼ばれる新しいパラメトリック表現を提案する。
DP3DFは、ローカル情報を組み込んで、単一エンコーダ/デコーダネットワークにおいて、同時復調、照明強化、SRを効率的に実現している。
また、動的残留フレームを共有バックボーンを介してDP3DFと共同で学習し、SR品質をさらに向上させる。
論文 参考訳(メタデータ) (2022-07-05T03:57:25Z) - MEStereo-Du2CNN: A Novel Dual Channel CNN for Learning Robust Depth
Estimates from Multi-exposure Stereo Images for HDR 3D Applications [0.22940141855172028]
マルチ露光ステレオ深度推定のための新しいディープアーキテクチャを開発した。
アーキテクチャの立体深度推定コンポーネントとして,モノ・ステレオ・トランスファー学習アプローチをデプロイする。
性能の面では、提案モデルは最先端のモノクラーおよびステレオ深度推定法を超越している。
論文 参考訳(メタデータ) (2022-06-21T13:23:22Z) - Single-Image HDR Reconstruction by Learning to Reverse the Camera
Pipeline [100.5353614588565]
本稿では,LDR画像形成パイプラインの領域知識をモデルに組み込むことを提案する。
我々は,HDRto-LDR画像形成パイプラインを(1)ダイナミックレンジクリッピング,(2)カメラ応答関数からの非線形マッピング,(3)量子化としてモデル化する。
提案手法は,最先端の単一画像HDR再構成アルゴリズムに対して良好に動作することを示す。
論文 参考訳(メタデータ) (2020-04-02T17:59:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。