論文の概要: The JPEG Pleno Learning-based Point Cloud Coding Standard: Serving Man and Machine
- arxiv url: http://arxiv.org/abs/2409.08130v1
- Date: Thu, 12 Sep 2024 15:20:23 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-13 16:07:58.627631
- Title: The JPEG Pleno Learning-based Point Cloud Coding Standard: Serving Man and Machine
- Title(参考訳): JPEG Plenoラーニングベースのポイントクラウドコーディング標準:人間とマシンのシリアル
- Authors: André F. R. Guarda, Nuno M. M. Rodrigues, Fernando Pereira,
- Abstract要約: ディープラーニングは、ポイントクラウドコーディングの強力なツールとして登場した。
JPEGは先日、JPEG Pleno LearningベースのPoint Cloud Coding標準を確定した。
本稿ではJPEG PCC標準の完全な技術的記述を提供する。
- 参考スコア(独自算出の注目度): 49.16996486119006
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Efficient point cloud coding has become increasingly critical for multiple applications such as virtual reality, autonomous driving, and digital twin systems, where rich and interactive 3D data representations may functionally make the difference. Deep learning has emerged as a powerful tool in this domain, offering advanced techniques for compressing point clouds more efficiently than conventional coding methods while also allowing effective computer vision tasks performed in the compressed domain thus, for the first time, making available a common compressed visual representation effective for both man and machine. Taking advantage of this potential, JPEG has recently finalized the JPEG Pleno Learning-based Point Cloud Coding (PCC) standard offering efficient lossy coding of static point clouds, targeting both human visualization and machine processing by leveraging deep learning models for geometry and color coding. The geometry is processed directly in its original 3D form using sparse convolutional neural networks, while the color data is projected onto 2D images and encoded using the also learning-based JPEG AI standard. The goal of this paper is to provide a complete technical description of the JPEG PCC standard, along with a thorough benchmarking of its performance against the state-of-the-art, while highlighting its main strengths and weaknesses. In terms of compression performance, JPEG PCC outperforms the conventional MPEG PCC standards, especially in geometry coding, achieving significant rate reductions. Color compression performance is less competitive but this is overcome by the power of a full learning-based coding framework for both geometry and color and the associated effective compressed domain processing.
- Abstract(参考訳): バーチャルリアリティ、自律運転、デジタルツインシステムといった複数のアプリケーションにおいて、リッチでインタラクティブな3Dデータ表現が機能的に違いを生じさせる、効率的なポイントクラウドコーディングがますます重要になっている。
ディープラーニングは、この領域で強力なツールとして登場し、従来のコーディング手法よりも効率的なポイントクラウドの圧縮技術を提供しながら、圧縮されたドメインで実行された効率的なコンピュータビジョンタスクを初めて実現し、人間と機械の両方に有効な共通の圧縮された視覚表現を提供する。
この可能性を生かして、JPEGはJPEG Pleno LearningベースのPoint Cloud Coding(PCC)標準を完了した。静的ポイントクラウドの効率の悪いコーディングを提供し、幾何学とカラーコーディングのためのディープラーニングモデルを活用することで、人間の可視化と機械学習の両方をターゲットにしている。
ジオメトリは、スパース畳み込みニューラルネットワークを使用して、元の3D形式で直接処理され、カラーデータは2Dイメージに投影され、学習ベースのJPEG AI標準を使用してエンコードされる。
本論文の目的は、JPEG PCC標準の完全な技術的記述と、最先端技術に対するパフォーマンスの徹底的なベンチマークを提供することであり、その主な強みと弱点を強調している。
圧縮性能の面では、JPEG PCCは従来のMPEG PCC標準、特に幾何符号化よりも優れており、大幅な速度低下を実現している。
色圧縮性能は競争力に欠けるが、これは幾何学と色の両方とそれに関連する効果的な圧縮ドメイン処理のための完全な学習ベースのコーディングフレームワークの力によって克服される。
関連論文リスト
- Double Deep Learning-based Event Data Coding and Classification [45.8313373627054]
イベントカメラは、"イベント"と呼ばれる、画素ごとの非同期の明るさ変化をキャプチャする機能を持つ
本稿では、イベントのポイントクラウドベースの表現を用いて、イベントデータ符号化と分類の両方のための新しいダブルディープラーニングベースのアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-07-22T10:45:55Z) - Deep Learning-based Compressed Domain Multimedia for Man and Machine: A
Taxonomy and Application to Point Cloud Classification [27.071264214506108]
本稿では,圧縮されたドメイン・コンピュータ・ビジョン・ソリューションを設計するための最初の分類法を提案する。
提案された分類のポテンシャルは、ポイントクラウド分類の特定のケースで示される。
論文 参考訳(メタデータ) (2023-10-28T23:38:30Z) - Learned Lossless Compression for JPEG via Frequency-Domain Prediction [50.20577108662153]
JPEG画像のロスレス圧縮を学習するための新しいフレームワークを提案する。
周波数領域での学習を可能にするために、DCT係数は暗黙の局所冗長性を利用するためにグループに分割される。
グループ化されたDCT係数のエントロピーモデリングを実現するために、重み付きブロックに基づいてオートエンコーダのようなアーキテクチャを設計する。
論文 参考訳(メタデータ) (2023-03-05T13:15:28Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - Learning-based Compression for Material and Texture Recognition [23.668803886355683]
本稿では,圧縮領域表現を用いて,圧縮領域内で直接視覚処理やコンピュータビジョンタスクを行う学習ベース圧縮方式について述べる。
学習ベースのJPEG-AIフレームワークを採用し、バリイングビットレートで圧縮ドメインの潜入表現を使用して材料およびテクスチャ認識を行います。
また, 圧縮領域分類は, より小さな縮小複雑度分類モデルを用いてTop-1とTop-5の精度で競合性能が得られることを示した。
論文 参考訳(メタデータ) (2021-04-16T23:16:26Z) - Analyzing and Mitigating JPEG Compression Defects in Deep Learning [69.04777875711646]
本稿では,JPEG圧縮が共通タスクやデータセットに与える影響を統一的に検討する。
高圧縮の一般的なパフォーマンス指標には大きなペナルティがあることが示される。
論文 参考訳(メタデータ) (2020-11-17T20:32:57Z) - Multiscale Point Cloud Geometry Compression [29.605320327889142]
本稿では,3次元ポイント・クラウド・ジオメトリを階層的に再構築するマルチスケール・ツー・エンド・ラーニング・フレームワークを提案する。
このフレームワークは、ポイントクラウド圧縮と再構成のためのスパース畳み込みベースのオートエンコーダの上に開発されている。
論文 参考訳(メタデータ) (2020-11-07T16:11:16Z) - Learning to Improve Image Compression without Changing the Standard
Decoder [100.32492297717056]
本稿では,標準デコーダによる符号化性能向上のための学習法を提案する。
具体的には、DCT係数の分布を最適化する周波数領域事前編集法を提案する。
JPEGデコーダは変更しないので、広く使われている標準JPEGデコーダで画像を見る際には、我々のアプローチが適用可能である。
論文 参考訳(メタデータ) (2020-09-27T19:24:42Z) - Quantization Guided JPEG Artifact Correction [69.04777875711646]
我々はJPEGファイル量子化行列を用いたアーティファクト修正のための新しいアーキテクチャを開発した。
これにより、特定の品質設定のためにトレーニングされたモデルに対して、単一のモデルで最先端のパフォーマンスを達成できます。
論文 参考訳(メタデータ) (2020-04-17T00:10:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。