論文の概要: Distortion-Aware Loop Filtering of Intra 360^o Video Coding with
Equirectangular Projection
- arxiv url: http://arxiv.org/abs/2202.09802v1
- Date: Sun, 20 Feb 2022 12:00:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-23 10:27:59.473334
- Title: Distortion-Aware Loop Filtering of Intra 360^o Video Coding with
Equirectangular Projection
- Title(参考訳): 等角射影を用いた360^o内映像符号化の歪み認識ループフィルタリング
- Authors: Pingping Zhang, Xu Wang, Linwei Zhu, Yun Zhang, Shiqi Wang, Sam Kwong
- Abstract要約: 等角射影(ERP)フォーマットで投影された360$o$ビデオの符号化性能を向上させるため,歪みを考慮したループフィルタリングモデルを提案する。
提案モジュールは、符号化ユニット(CU)パーティションマスクに基づいてコンテンツ特性を分析し、部分的畳み込みによって処理し、指定された領域を活性化する。
- 参考スコア(独自算出の注目度): 81.63407194858854
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a distortion-aware loop filtering model to improve
the performance of intra coding for 360$^o$ videos projected via
equirectangular projection (ERP) format. To enable the awareness of distortion,
our proposed module analyzes content characteristics based on a coding unit
(CU) partition mask and processes them through partial convolution to activate
the specified area. The feature recalibration module, which leverages cascaded
residual channel-wise attention blocks (RCABs) to adjust the inter-channel and
intra-channel features automatically, is capable of adapting with different
quality levels. The perceptual geometry optimization combining with weighted
mean squared error (WMSE) and the perceptual loss guarantees both the local
field of view (FoV) and global image reconstruction with high quality.
Extensive experimental results show that our proposed scheme achieves
significant bitrate savings compared with the anchor (HM + 360Lib), leading to
8.9%, 9.0%, 7.1% and 7.4% on average bit rate reductions in terms of PSNR,
WPSNR, and PSNR of two viewports for luminance component of 360^o videos,
respectively.
- Abstract(参考訳): 本稿では,等角射影(erp)方式で投影された360$^o$ビデオのイントラコーディング性能を向上させるために,歪みを検知するループフィルタリングモデルを提案する。
歪みの認識を可能にするため,提案モジュールは符号化ユニット(CU)パーティションマスクに基づいてコンテンツ特性を分析し,部分的畳み込み処理を行い,特定領域を活性化する。
チャネル間およびチャネル内機能を自動的に調整するために、カスケードされた残留チャネルワイドアテンションブロック(RCAB)を利用する機能リカバリモジュールは、異なる品質レベルに適応することができる。
重み付き平均二乗誤差(WMSE)と知覚損失を組み合わせた知覚幾何最適化は、局所視野(FoV)と大域画像再構成の両方を高品質で保証する。
実験の結果,提案手法はアンカー (HM + 360Lib) と比較してビットレートの大幅な削減を実現し,PSNR, WPSNR, PSNRの2つのビューポートにおいて平均ビットレート削減率8.9%,9.0%,7.1%,7.4%となることがわかった。
関連論文リスト
- Simple Baselines for Projection-based Full-reference and No-reference
Point Cloud Quality Assessment [60.2709006613171]
投影型ポイントクラウド品質評価(PCQA)のための簡易ベースラインを提案する。
我々は、全参照(FR)タスクと非参照(NR)PCQAタスクの両方に対して、点雲から共通立方体状の投影プロセスによって得られる多重射影を用いる。
ICIP 2023 PCVQA Challengeに参加して,5トラック中4トラックで首位を獲得した。
論文 参考訳(メタデータ) (2023-10-26T04:42:57Z) - ConsistentNeRF: Enhancing Neural Radiance Fields with 3D Consistency for
Sparse View Synthesis [99.06490355990354]
本研究では,深度情報を利用して画素間のマルチビューとシングルビューの3D整合性を調整する手法であるConsistentNeRFを提案する。
提案手法は,PSNRが94%,SSIMが31%,LPIPSが31%,疎視条件下でのモデル性能を大幅に向上させることができる。
論文 参考訳(メタデータ) (2023-05-18T15:18:01Z) - FAMLP: A Frequency-Aware MLP-Like Architecture For Domain Generalization [73.41395947275473]
本稿では、変換周波数領域において、ドメイン固有の特徴をフィルタリングする新しい周波数認識アーキテクチャを提案する。
3つのベンチマークの実験では、最先端の手法をそれぞれ3%、4%、9%のマージンで上回った。
論文 参考訳(メタデータ) (2022-03-24T07:26:29Z) - Video Coding for Machines with Feature-Based Rate-Distortion
Optimization [7.804710977378487]
ニューラルネットワークの安定した改善により、ますます多くのマルチメディアデータが人間によって観測されなくなる。
本稿では,コーディング性能の向上を目的とした標準準拠機能ベースのRDO(FRDO)を提案する。
提案したFRDOとHFRDOのハイブリッドバージョンを比較し,特徴空間の歪みを従来のRDOと比較した。
論文 参考訳(メタデータ) (2022-03-11T12:49:50Z) - Recursive Self-Improvement for Camera Image and Signal Processing
Pipeline [6.318974730864278]
現在のカメラ画像と信号処理パイプライン(ISP)は、画像全体に一様に適用される単一のフィルタを適用する傾向がある。
これは、ほとんどの取得したカメラ画像が空間的に異質なアーティファクトを持っているにもかかわらずである。
学習された潜在部分空間で動作する深層強化学習モデルを提案する。
論文 参考訳(メタデータ) (2021-11-15T02:23:40Z) - A Global Appearance and Local Coding Distortion based Fusion Framework
for CNN based Filtering in Video Coding [15.778380865885842]
ループ内フィルタリングは、ブロックアーティファクトを削除するために再構成されたフレームを処理するためにビデオ符号化で使用される。
本稿では,2つの側面からフィルタの問題に対処する。これは,破壊されたテクスチャに対するグローバルな外観復元と,固定された符号化パイプラインによる局所的な符号化歪み復元である。
高レベルグローバル特徴ストリーム,高レベルローカル特徴ストリーム,低レベルローカル特徴ストリームを用いて3ストリームグローバル外観と局所符号化歪みに基づく融合ネットワークを開発した。
論文 参考訳(メタデータ) (2021-06-24T03:08:44Z) - DeepCompress: Efficient Point Cloud Geometry Compression [1.808877001896346]
本稿では,ポイントクラウド圧縮のためのより効率的なディープラーニングベースのエンコーダアーキテクチャを提案する。
CENIC(Efficient Neural Image Compression)から学習した活性化関数を組み込むことで,効率と性能が劇的に向上することを示す。
提案手法は,BjontegardデルタレートとPSNR値において,ベースラインアプローチよりも小さなマージンで優れていた。
論文 参考訳(メタデータ) (2021-06-02T23:18:11Z) - Robust 360-8PA: Redesigning The Normalized 8-point Algorithm for 360-FoV
Images [53.11097060367591]
球面投影における360-fov画像から本質行列を推定する新しい手法を提案する。
我々の正規化は、時間を大幅に上回ることなく、カメラの精度を約20%向上させることができることを示す。
論文 参考訳(メタデータ) (2021-04-22T07:23:11Z) - Reduced Reference Perceptual Quality Model and Application to Rate
Control for 3D Point Cloud Compression [61.110938359555895]
レート歪み最適化では、ビットレートの制約を受ける再構成品質尺度を最大化してエンコーダ設定を決定する。
本稿では,V-PCC幾何および色量化パラメータを変数とする線形知覚品質モデルを提案する。
400個の圧縮された3D点雲による主観的品質試験の結果,提案モデルが平均評価値とよく相関していることが示唆された。
また、同じ目標ビットレートに対して、提案モデルに基づくレート歪みの最適化は、ポイント・ツー・ポイントの客観的な品質指標による徹底的な探索に基づくレート歪みの最適化よりも高い知覚品質を提供することを示した。
論文 参考訳(メタデータ) (2020-11-25T12:42:02Z) - ODE-CNN: Omnidirectional Depth Extension Networks [43.40308168978984]
本研究では,全方位カメラとキャリブレーションされた投影深度カメラを組み合わせた低コスト3Dセンシングシステムを提案する。
欠損した深度を正確に回復するために,一方向の深度拡張畳み込みニューラルネットワークを設計する。
ODE-CNNは、他の最先端(SoTA)手法よりもかなり優れている(相対的に33%の深度誤差の低減)。
論文 参考訳(メタデータ) (2020-07-03T03:14:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。