論文の概要: DetVPCC: RoI-based Point Cloud Sequence Compression for 3D Object Detection
- arxiv url: http://arxiv.org/abs/2502.04804v1
- Date: Fri, 07 Feb 2025 10:16:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-10 14:56:33.327080
- Title: DetVPCC: RoI-based Point Cloud Sequence Compression for 3D Object Detection
- Title(参考訳): DetVPCC:3Dオブジェクト検出のためのRoIベースのポイントクラウドシーケンス圧縮
- Authors: Mingxuan Yan, Ruijie Zhang, Xuedou Xiao, Wei Wang,
- Abstract要約: MPEG規格化されたビデオベースポイントクラウド圧縮(VPCC)は、人間の知覚に対する高い圧縮効率を実現する。
VPCCは、3Dオブジェクト検出器をサポートする際に、貯蓄と検出精度の間のトレードオフに苦慮している。
本稿では,効率的なポイントクラウドシーケンス圧縮のために,関心領域(RoI)エンコーディングをVPCCと統合する新しい手法であるDetVPCCを提案する。
- 参考スコア(独自算出の注目度): 4.350982395442569
- License:
- Abstract: While MPEG-standardized video-based point cloud compression (VPCC) achieves high compression efficiency for human perception, it struggles with a poor trade-off between bitrate savings and detection accuracy when supporting 3D object detectors. This limitation stems from VPCC's inability to prioritize regions of different importance within point clouds. To address this issue, we propose DetVPCC, a novel method integrating region-of-interest (RoI) encoding with VPCC for efficient point cloud sequence compression while preserving the 3D object detection accuracy. Specifically, we augment VPCC to support RoI-based compression by assigning spatially non-uniform quality levels. Then, we introduce a lightweight RoI detector to identify crucial regions that potentially contain objects. Experiments on the nuScenes dataset demonstrate that our approach significantly improves the detection accuracy. The code and demo video are available in supplementary materials.
- Abstract(参考訳): MPEG標準化されたビデオベースポイントクラウド圧縮(VPCC)は、人間の知覚に対する高い圧縮効率を達成するが、3Dオブジェクト検出器をサポートする場合のビットレートの保存と検出精度のトレードオフに苦慮している。
この制限は、ポイントクラウド内で異なる重要領域を優先順位付けできないVPCCが原因である。
本稿では,3次元物体検出精度を維持しつつ,効率的な点雲列圧縮を行うために,関心領域(RoI)エンコーディングをVPCCと統合する新しい手法であるDetVPCCを提案する。
具体的には、空間的に不均一な品質レベルを割り当てることで、VPCCをRoIベースの圧縮をサポートするように拡張する。
そして、オブジェクトを含む可能性のある重要な領域を特定するために、軽量なRoI検出器を導入する。
nuScenesデータセットの実験により,本手法が検出精度を大幅に向上することが示された。
コードとデモビデオは補足資料で入手できる。
関連論文リスト
- Att2CPC: Attention-Guided Lossy Attribute Compression of Point Clouds [18.244200436103156]
本稿では, オートエンコーダアーキテクチャを利用して, ポイントクラウド属性を効率よく圧縮する手法を提案する。
実験の結果,YチャネルのBD-PSNRとYUVチャネルの平均改善率は1.15dBと2.13dBであることがわかった。
論文 参考訳(メタデータ) (2024-10-23T12:32:21Z) - HEDNet: A Hierarchical Encoder-Decoder Network for 3D Object Detection
in Point Clouds [19.1921315424192]
ポイントクラウドにおける3Dオブジェクト検出は、自律運転システムにとって重要である。
3Dオブジェクト検出における主な課題は、3Dシーン内の点のスパース分布に起因する。
本稿では3次元オブジェクト検出のための階層型エンコーダデコーダネットワークであるHEDNetを提案する。
論文 参考訳(メタデータ) (2023-10-31T07:32:08Z) - PointHR: Exploring High-Resolution Architectures for 3D Point Cloud
Segmentation [77.44144260601182]
3Dポイントクラウドセグメンテーションのための高分解能アーキテクチャについて検討する。
我々は、特徴抽出のためのknnベースのシーケンス演算子と差分再サンプリング演算子を含む、PointHRという名前の統一パイプラインを提案する。
S3DISとScanNetV2データセットを用いて,これらのアーキテクチャを高密度点雲解析のために評価する。
論文 参考訳(メタデータ) (2023-10-11T09:29:17Z) - V-DETR: DETR with Vertex Relative Position Encoding for 3D Object
Detection [73.37781484123536]
DETRフレームワークを用いた点雲のための高性能な3次元物体検出器を提案する。
限界に対処するため,新しい3次元相対位置(3DV-RPE)法を提案する。
挑戦的なScanNetV2ベンチマークで例外的な結果を示す。
論文 参考訳(メタデータ) (2023-08-08T17:14:14Z) - Point Cloud Video Anomaly Detection Based on Point Spatio-Temporal
Auto-Encoder [1.4340883856076097]
我々は、ポイントクラウドビデオの異常を検出するためにポイントクラウドビデオを入力として使用する自動エンコーダフレームワークであるポイント時自動エンコーダ(PSTAE)を提案する。
本手法はTIMoデータセット上に新しい最先端(SOTA)を設定する。
論文 参考訳(メタデータ) (2023-06-04T10:30:28Z) - 3D Cascade RCNN: High Quality Object Detection in Point Clouds [122.42455210196262]
本稿では3次元カスケードRCNNを提案する。これはカスケードパラダイムにおいて、酸化点雲に基づいて複数の検出器を割り当てる。
提案する3次元カスケードRCNNは,最先端の3次元物体検出技術と比較した場合の優位性を検証した。
論文 参考訳(メタデータ) (2022-11-15T15:58:36Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - 3D Object Detection Combining Semantic and Geometric Features from Point
Clouds [19.127930862527666]
そこで本研究では,SGNetと呼ばれる2次元物体検出装置を提案する。
VTPMはVoxel-Point-Based Moduleであり、最終的に点空間で3Dオブジェクト検出を実装している。
2021年9月19日時点で、KITTIデータセットでは、SGNetは、難易度の高いサイクリストの3DおよびBEV検出で1位、適度なサイクリストの3D検出では2位であった。
論文 参考訳(メタデータ) (2021-10-10T04:43:27Z) - Progressive Coordinate Transforms for Monocular 3D Object Detection [52.00071336733109]
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
論文 参考訳(メタデータ) (2021-08-12T15:22:33Z) - Anchor-free 3D Single Stage Detector with Mask-Guided Attention for
Point Cloud [79.39041453836793]
我々は、点雲をアンカーフリーで検出する新しい1段3次元検出器を開発した。
ボクセルをベースとしたスパース3D特徴量からスパース2D特徴量マップに変換することでこれを克服する。
検出信頼度スコアとバウンディングボックス回帰の精度との相関性を改善するために,IoUに基づく検出信頼度再校正手法を提案する。
論文 参考訳(メタデータ) (2021-08-08T13:42:13Z) - Boundary-Aware Dense Feature Indicator for Single-Stage 3D Object
Detection from Point Clouds [32.916690488130506]
本稿では,3次元検出器が境界を意識して点雲の最も密集した領域に焦点を合わせるのを支援する普遍モジュールを提案する。
KITTIデータセットの実験により、DENFIはベースライン単段検出器の性能を著しく改善することが示された。
論文 参考訳(メタデータ) (2020-04-01T01:21:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。