論文の概要: Learned Point Cloud Compression for Classification
- arxiv url: http://arxiv.org/abs/2308.05959v1
- Date: Fri, 11 Aug 2023 06:28:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-14 15:07:09.201528
- Title: Learned Point Cloud Compression for Classification
- Title(参考訳): 学習点雲圧縮による分類
- Authors: Mateen Ulhaq, Ivan V. Baji\'c
- Abstract要約: ディープラーニングは、分類、オブジェクト検出、セグメンテーションといったマシンビジョンタスクを3Dポイントクラウドデータ上で実行するために、ますます使われています。
分類の機械的タスクに高度に特化している新しい点雲を提示する。
特に、ModelNet40データセット上の特殊化されていないコーデックに対して、BDビットレートを93%削減する。
- 参考スコア(独自算出の注目度): 35.103437828235826
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep learning is increasingly being used to perform machine vision tasks such
as classification, object detection, and segmentation on 3D point cloud data.
However, deep learning inference is computationally expensive. The limited
computational capabilities of end devices thus necessitate a codec for
transmitting point cloud data over the network for server-side processing. Such
a codec must be lightweight and capable of achieving high compression ratios
without sacrificing accuracy. Motivated by this, we present a novel point cloud
codec that is highly specialized for the machine task of classification. Our
codec, based on PointNet, achieves a significantly better rate-accuracy
trade-off in comparison to alternative methods. In particular, it achieves a
94% reduction in BD-bitrate over non-specialized codecs on the ModelNet40
dataset. For low-resource end devices, we also propose two lightweight
configurations of our encoder that achieve similar BD-bitrate reductions of 93%
and 92% with 3% and 5% drops in top-1 accuracy, while consuming only 0.470 and
0.048 encoder-side kMACs/point, respectively. Our codec demonstrates the
potential of specialized codecs for machine analysis of point clouds, and
provides a basis for extension to more complex tasks and datasets in the
future.
- Abstract(参考訳): ディープラーニングは、3dポイントクラウドデータで分類、オブジェクト検出、セグメンテーションなどの機械学習タスクを実行するためにますます使われています。
しかし、ディープラーニングの推論は計算コストが高い。
したがって、エンドデバイスの限られた計算能力は、サーバ側処理のためにネットワーク上でポイントクラウドデータを送信するためのコーデックを必要とする。
このようなコーデックは軽量で、精度を犠牲にすることなく高い圧縮比を達成することができる。
そこで本研究では,分類の機械作業に高度に特化した,新しい点クラウドコーデックを提案する。
当社のコーデックはpointnetをベースとして,代替手法と比較して,レート精度のトレードオフが大幅に向上しています。
特に、modelnet40データセット上の非特殊コーデックよりも94%のbdビットレートの削減を実現している。
低リソースのエンドデバイスでは、同様のBDビットレートの93%と92%の削減を実現し、トップ1の精度で3%と5%の削減を実現し、それぞれ0.470と0.048のエンコーダサイドkMACs/pointしか消費しない2つの軽量なエンコーダ構成を提案する。
私たちのコーデックは、ポイントクラウドのマシン分析のための特別なコーデックの可能性を示し、将来的にはより複雑なタスクやデータセットに拡張するための基盤を提供します。
関連論文リスト
- LCM: Locally Constrained Compact Point Cloud Model for Masked Point Modeling [47.94285833315427]
本稿では,局所的に制約されたコンパクト・エンコーダと局所的に制約されたMambaベースのデコーダからなる,局所的に制約されたコンパクト・ポイント・クラウド・モデルを提案する。
エンコーダは、パフォーマンスと効率のエレガントなバランスを達成するために、自己アテンションをローカルアグリゲーション層に置き換えます。
このデコーダは、高情報密度の未処理パッチからの点雲幾何学情報の知覚を最大化しつつ、線形複雑性を保証する。
論文 参考訳(メタデータ) (2024-05-27T13:19:23Z) - Scalable Human-Machine Point Cloud Compression [29.044369073873465]
本稿では,分類の機械的タスクに特化した,スケーラブルなポイントクラウドデータを提供するとともに,人間の視聴のメカニズムも提供する。
提案した拡張性では、"base"ビットストリームはマシンタスクをサポートし、"enhancement"ビットストリームは、人間の視聴のための入力再構成性能を改善するために使用される。
論文 参考訳(メタデータ) (2024-02-19T20:43:10Z) - SeRP: Self-Supervised Representation Learning Using Perturbed Point
Clouds [6.29475963948119]
SeRPはエンコーダ・デコーダアーキテクチャで構成されており、乱れや破損した点雲を入力として利用する。
トランスフォーマーとPointNetベースのオートエンコーダを使用しました。
論文 参考訳(メタデータ) (2022-09-13T15:22:36Z) - SoftPool++: An Encoder-Decoder Network for Point Cloud Completion [93.54286830844134]
本稿では,ポイントクラウド完了作業のための新しい畳み込み演算子を提案する。
提案した演算子は、最大プールやボキセル化操作を一切必要としない。
提案手法は,低解像度・高解像度の形状仕上げにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2022-05-08T15:31:36Z) - Variable Rate Compression for Raw 3D Point Clouds [5.107705550575662]
そこで本研究では,生の3Dポイントクラウドデータを用いた新しい可変レート深部圧縮アーキテクチャを提案する。
我々のネットワークは、ポイントクラウドを明示的に処理し、圧縮された記述を生成することができる。
論文 参考訳(メタデータ) (2022-02-28T15:15:39Z) - StolenEncoder: Stealing Pre-trained Encoders [62.02156378126672]
我々は、事前訓練された画像エンコーダを盗むStolenEncoderと呼ばれる最初の攻撃を提案する。
以上の結果から,StolenEncoderが盗んだエンコーダは,ターゲットエンコーダと同じような機能を持つことがわかった。
論文 参考訳(メタデータ) (2022-01-15T17:04:38Z) - Dynamic Neural Representational Decoders for High-Resolution Semantic
Segmentation [98.05643473345474]
動的ニューラル表現デコーダ(NRD)と呼ばれる新しいデコーダを提案する。
エンコーダの出力上の各位置がセマンティックラベルの局所的なパッチに対応するので、この研究では、これらの局所的なパッチをコンパクトなニューラルネットワークで表現する。
このニューラル表現により、意味ラベル空間に先行する滑らかさを活用することができ、デコーダをより効率的にすることができる。
論文 参考訳(メタデータ) (2021-07-30T04:50:56Z) - Lightweight Compression of Intermediate Neural Network Features for
Collaborative Intelligence [32.03465747357384]
協調インテリジェンスアプリケーションでは、ディープニューラルネットワーク(DNN)の一部が携帯電話やエッジデバイスなどの軽量デバイスにデプロイされます。
本稿では,分割DNNの中間層によって出力される特徴を量子化し圧縮する,新しい軽量圧縮技術を提案する。
論文 参考訳(メタデータ) (2021-05-15T00:10:12Z) - Lightweight compression of neural network feature tensors for
collaborative intelligence [32.03465747357384]
協調インテリジェンスアプリケーションでは、ディープニューラルネットワーク(DNN)の一部は、携帯電話やエッジデバイスなどの比較的低い複雑さのデバイスにデプロイされます。
本稿では,スプリットdnn層のアクティベーションをコード化するために設計された新しい軽量圧縮技術を提案する。
論文 参考訳(メタデータ) (2021-05-12T23:41:35Z) - OctSqueeze: Octree-Structured Entropy Model for LiDAR Compression [77.8842824702423]
本稿では,LiDAR点雲のメモリフットプリントを削減するための新しいディープ圧縮アルゴリズムを提案する。
本手法は,メモリフットプリントを低減するために,点間の間隔と構造的冗長性を利用する。
我々のアルゴリズムは、自動運転車などのアプリケーションにおいて、LiDARポイントのオンボードおよびオフボードストレージを減らすために使用できる。
論文 参考訳(メタデータ) (2020-05-14T17:48:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。