論文の概要: ROI-Guided Point Cloud Geometry Compression Towards Human and Machine Vision
- arxiv url: http://arxiv.org/abs/2504.14240v1
- Date: Sat, 19 Apr 2025 09:31:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-30 03:54:24.740093
- Title: ROI-Guided Point Cloud Geometry Compression Towards Human and Machine Vision
- Title(参考訳): 人間と機械ビジョンに向けたROI誘導点雲幾何圧縮
- Authors: Xie Liang, Gao Wei, Zhenghui Ming, Li Ge,
- Abstract要約: 本研究では,人間と機械の視界に対する新しい関心誘導ポイントクラウド幾何圧縮法(RPCGC)を提案する。
我々のフレームワークはデュアルブランチ並列構造を用いており、ベース層はポイントクラウドの簡易バージョンをエンコードしデコードする。
我々はこれらのマスクの詳細を、各点を歪み計算で重み付けしたRD(Rate-Distortion)最適化プロセスに適用する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Point cloud data is pivotal in applications like autonomous driving, virtual reality, and robotics. However, its substantial volume poses significant challenges in storage and transmission. In order to obtain a high compression ratio, crucial semantic details usually confront severe damage, leading to difficulties in guaranteeing the accuracy of downstream tasks. To tackle this problem, we are the first to introduce a novel Region of Interest (ROI)-guided Point Cloud Geometry Compression (RPCGC) method for human and machine vision. Our framework employs a dual-branch parallel structure, where the base layer encodes and decodes a simplified version of the point cloud, and the enhancement layer refines this by focusing on geometry details. Furthermore, the residual information of the enhancement layer undergoes refinement through an ROI prediction network. This network generates mask information, which is then incorporated into the residuals, serving as a strong supervision signal. Additionally, we intricately apply these mask details in the Rate-Distortion (RD) optimization process, with each point weighted in the distortion calculation. Our loss function includes RD loss and detection loss to better guide point cloud encoding for the machine. Experiment results demonstrate that RPCGC achieves exceptional compression performance and better detection accuracy (10% gain) than some learning-based compression methods at high bitrates in ScanNet and SUN RGB-D datasets.
- Abstract(参考訳): ポイントクラウドデータは、自動運転、バーチャルリアリティー、ロボット工学といったアプリケーションにおいて重要である。
しかし、その相当量の容量は、ストレージと送信において重大な課題を招いている。
高圧縮比を得るためには、重要なセマンティックな詳細は通常深刻な損傷に直面し、下流のタスクの精度を保証するのに苦労する。
この問題に対処するため、我々は、人間と機械ビジョンのための新しい関心領域(ROI)誘導ポイントクラウド幾何圧縮(RPCGC)手法を初めて導入した。
筆者らのフレームワークはデュアルブランチ並列構造を用いており、ベース層はポイントクラウドの簡易版をエンコードし、デコードし、拡張層は幾何学的詳細に焦点を当ててこれを洗練する。
さらに、拡張層の残余情報はROI予測ネットワークを介して洗練される。
このネットワークはマスク情報を生成し、その後残留物に組み込まれ、強力な監視信号として機能する。
さらに、これらのマスクの詳細を、各点を歪み計算に重み付けしたRD(Rate-Distortion)最適化プロセスに適用する。
我々の損失関数にはRD損失と検出損失が含まれており、マシンのポイントクラウドエンコーディングをより良くガイドすることができる。
実験結果から,RPCGCはScanNetおよびSUN RGB-Dデータセットの高ビットレートでの学習ベース圧縮法よりも優れた圧縮性能と検出精度(10%ゲイン)を達成することが示された。
関連論文リスト
- PCE-GAN: A Generative Adversarial Network for Point Cloud Attribute Quality Enhancement based on Optimal Transport [56.56430888985025]
点雲品質向上のための生成逆ネットワーク(PCE-GAN)を提案する。
ジェネレータは、局所特徴抽出(LFE)ユニット、大域空間相関(GSC)ユニット、特徴圧縮ユニットからなる。
判別器は、強化点雲と原点雲の確率分布のずれを計算し、ジェネレータを誘導して高品質な再構成を実現する。
論文 参考訳(メタデータ) (2025-02-26T07:34:33Z) - Rendering-Oriented 3D Point Cloud Attribute Compression using Sparse Tensor-based Transformer [52.40992954884257]
3D視覚化技術は、私たちがデジタルコンテンツと対話する方法を根本的に変えてきた。
ポイントクラウドの大規模データサイズは、データ圧縮において大きな課題を呈している。
そこで我々はPCACと差別化可能なレンダリングをシームレスに統合するエンドツーエンドのディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-12T16:12:51Z) - Decoupling Fine Detail and Global Geometry for Compressed Depth Map Super-Resolution [55.9977636042469]
圧縮深度マップ超解像のための新しいフレームワークGDNetを提案する。
グローバルおよび詳細な幾何学的特徴を別々に扱うことにより、高品質な深度マップ再構築プロセスを分離する。
我々の解は、幾何的整合性と詳細回復の観点から、現在の方法よりも大幅に優れています。
論文 参考訳(メタデータ) (2024-11-05T16:37:30Z) - Att2CPC: Attention-Guided Lossy Attribute Compression of Point Clouds [18.244200436103156]
本稿では, オートエンコーダアーキテクチャを利用して, ポイントクラウド属性を効率よく圧縮する手法を提案する。
実験の結果,YチャネルのBD-PSNRとYUVチャネルの平均改善率は1.15dBと2.13dBであることがわかった。
論文 参考訳(メタデータ) (2024-10-23T12:32:21Z) - Convolutional variational autoencoders for secure lossy image compression in remote sensing [47.75904906342974]
本研究では,畳み込み変分オートエンコーダ(CVAE)に基づく画像圧縮について検討する。
CVAEは、JPEG2000のような従来の圧縮手法を圧縮ベンチマークデータセットのかなりのマージンで上回ることが示されている。
論文 参考訳(メタデータ) (2024-04-03T15:17:29Z) - 3D Point Cloud Compression with Recurrent Neural Network and Image
Compression Methods [0.0]
多くのAVアプリケーションでは、LiDARポイントクラウドデータの保存と送信が不可欠である。
データの幅と秩序のない構造のため、ポイントクラウドデータを低ボリュームに圧縮することは困難である。
圧縮アルゴリズムが空間相関を効率的に活用できる新しい3D-to-2D変換を提案する。
論文 参考訳(メタデータ) (2024-02-18T19:08:19Z) - Compression of Structured Data with Autoencoders: Provable Benefit of
Nonlinearities and Depth [83.15263499262824]
勾配勾配勾配は入力のスパース構造を完全に無視する解に収束することを示す。
浅層構造にデノナイジング関数を付加することにより,スパースデータの圧縮におけるガウス性能の改善方法を示す。
CIFAR-10 や MNIST などの画像データセットに対して,本研究の成果を検証した。
論文 参考訳(メタデータ) (2024-02-07T16:32:29Z) - Depth Monocular Estimation with Attention-based Encoder-Decoder Network
from Single Image [7.753378095194288]
ビジョンベースのアプローチは最近多くの注目を集めており、これらの欠点を克服することができる。
本研究では,格子状アーチファクトやぼやけたエッジに悩まされている1つの単眼画像から深度マップを推定する。
我々の新しいアプローチは、最小限のオーバーヘッドで現在の画像の焦点を見つけることができ、奥行き特性の損失を避けることができる。
論文 参考訳(メタデータ) (2022-10-24T23:01:25Z) - Reducing Redundancy in the Bottleneck Representation of the Autoencoders [98.78384185493624]
オートエンコーダは教師なしニューラルネットワークの一種であり、様々なタスクを解くのに使用できる。
本稿では,ボトルネック表現における特徴冗長性を明示的に罰する手法を提案する。
我々は,3つの異なるデータセットを用いた次元削減,MNISTデータセットを用いた画像圧縮,ファッションMNISTを用いた画像デノナイズという,さまざまなタスクにまたがってアプローチを検証した。
論文 参考訳(メタデータ) (2022-02-09T18:48:02Z) - GRNet: Gridding Residual Network for Dense Point Cloud Completion [54.43648460932248]
完全な3Dポイントクラウドを不完全なクラウドから推定することは、多くのビジョンやロボティクスアプリケーションにおいて重要な問題である。
本稿では,ポイントクラウド補完のための新しいGridding Residual Network(GRNet)を提案する。
実験結果から,提案したGRNetはShapeNet,Completion3D,KITTIベンチマークの最先端手法に対して良好に動作することがわかった。
論文 参考訳(メタデータ) (2020-06-06T02:46:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。