論文の概要: Scalable Human-Machine Point Cloud Compression
- arxiv url: http://arxiv.org/abs/2402.12532v1
- Date: Mon, 19 Feb 2024 20:43:10 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-21 18:12:35.295896
- Title: Scalable Human-Machine Point Cloud Compression
- Title(参考訳): スケーラブルなヒューマンマシンポイントクラウド圧縮
- Authors: Mateen Ulhaq, Ivan V. Baji\'c
- Abstract要約: 本稿では,分類の機械的タスクに特化した,スケーラブルなポイントクラウドデータを提供するとともに,人間の視聴のメカニズムも提供する。
提案した拡張性では、"base"ビットストリームはマシンタスクをサポートし、"enhancement"ビットストリームは、人間の視聴のための入力再構成性能を改善するために使用される。
- 参考スコア(独自算出の注目度): 29.044369073873465
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Due to the limited computational capabilities of edge devices, deep learning
inference can be quite expensive. One remedy is to compress and transmit point
cloud data over the network for server-side processing. Unfortunately, this
approach can be sensitive to network factors, including available bitrate.
Luckily, the bitrate requirements can be reduced without sacrificing inference
accuracy by using a machine task-specialized codec. In this paper, we present a
scalable codec for point-cloud data that is specialized for the machine task of
classification, while also providing a mechanism for human viewing. In the
proposed scalable codec, the "base" bitstream supports the machine task, and an
"enhancement" bitstream may be used for better input reconstruction performance
for human viewing. We base our architecture on PointNet++, and test its
efficacy on the ModelNet40 dataset. We show significant improvements over prior
non-specialized codecs.
- Abstract(参考訳): エッジデバイスの計算能力が限られているため、ディープラーニング推論は非常に高価である。
一つの対策は、サーバ側処理のためにネットワーク上でポイントクラウドデータを圧縮して送信することである。
残念ながら、このアプローチは利用可能なビットレートを含むネットワーク要因に敏感である。
幸運にも、マシンタスク特化コーデックを使用することで、推論精度を犠牲にすることなく、ビットレート要件を削減できる。
本稿では,分類の機械的タスクに特化する点クラウドデータのためのスケーラブルなコーデックを提案するとともに,人間の視聴のメカニズムも提供する。
提案するスケーラブルコーデックでは、"ベース"ビットストリームがマシンタスクをサポートし、"エンハンスメント"ビットストリームが人間の視聴における入力再構成のパフォーマンス向上に使用できる。
当社のアーキテクチャはPointNet++に基づいており、その有効性をModelNet40データセットでテストしています。
先行する非特化コーデックに対する大幅な改善を示す。
関連論文リスト
- Towards Point Cloud Compression for Machine Perception: A Simple and Strong Baseline by Learning the Octree Depth Level Predictor [12.510990055381452]
本稿では,人間と機械の両方の視覚タスクを同時に処理するポイントクラウド圧縮フレームワークを提案する。
我々のフレームワークは、異なるマシンビジョンタスクのサブセットのみを使用して、スケーラブルなビットストリームを学習し、ビットレートを節約します。
新しいオクツリー深さレベルの予測器は、点雲から構築された各オクツリーの最適深さレベルを適応的に決定する。
論文 参考訳(メタデータ) (2024-06-02T16:13:57Z) - A Perspective on Deep Vision Performance with Standard Image and Video Codecs [41.73262031925552]
エッジデバイスや携帯電話などのリソース制約のあるハードウェアは、ディープビジョンモデルにおける推論に必要な計算リソースを提供するために、クラウドサーバーに依存していることが多い。
本稿では,ディープビジョンパイプラインにおける標準化コーデックの導入がもたらす意味について検討する。
JPEGとH.264の符号化により、幅広い視覚タスクやモデルにおける精度が大幅に低下することがわかった。
論文 参考訳(メタデータ) (2024-04-18T16:58:05Z) - Learned Point Cloud Compression for Classification [35.103437828235826]
ディープラーニングは、分類、オブジェクト検出、セグメンテーションといったマシンビジョンタスクを3Dポイントクラウドデータ上で実行するために、ますます使われています。
分類の機械的タスクに高度に特化している新しい点雲を提示する。
特に、ModelNet40データセット上の特殊化されていないコーデックに対して、BDビットレートを93%削減する。
論文 参考訳(メタデータ) (2023-08-11T06:28:19Z) - Attention-based Feature Compression for CNN Inference Offloading in Edge
Computing [93.67044879636093]
本稿では,デバイスエッジ共振器におけるCNN推論の計算負荷について検討する。
エンドデバイスにおける効率的な特徴抽出のための新しいオートエンコーダベースのCNNアーキテクチャ(AECNN)を提案する。
実験の結果、AECNNは中間データを約4%の精度で256倍圧縮できることがわかった。
論文 参考訳(メタデータ) (2022-11-24T18:10:01Z) - Preprocessing Enhanced Image Compression for Machine Vision [14.895698385236937]
本稿では,マシンビジョンタスクのための前処理による画像圧縮手法を提案する。
私たちのフレームワークは従来の非微分コーデックの上に構築されています。
実験の結果,提案手法は,約20%の節約により,ダウンストリームマシンビジョンタスクのコーディングと性能のトレードオフを向上することが示された。
論文 参考訳(メタデータ) (2022-06-12T03:36:38Z) - SoftPool++: An Encoder-Decoder Network for Point Cloud Completion [93.54286830844134]
本稿では,ポイントクラウド完了作業のための新しい畳み込み演算子を提案する。
提案した演算子は、最大プールやボキセル化操作を一切必要としない。
提案手法は,低解像度・高解像度の形状仕上げにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2022-05-08T15:31:36Z) - A New Image Codec Paradigm for Human and Machine Uses [53.48873918537017]
本研究では,人間用と機械用の両方にスケーラブルな画像パラダイムを提案する。
高レベルのインスタンスセグメンテーションマップと低レベルの信号特徴をニューラルネットワークで抽出する。
画像は16ビットのグレースケールプロファイルと信号特徴を持つ一般的な画質のイメージ再構成を実現するために設計および訓練される。
論文 参考訳(メタデータ) (2021-12-19T06:17:38Z) - Small Lesion Segmentation in Brain MRIs with Subpixel Embedding [105.1223735549524]
ヒト脳のMRIスキャンを虚血性脳梗塞と正常組織に分割する方法を提案する。
本稿では,空間展開埋め込みネットワークによって予測を導出する標準エンコーダデコーダの形式でニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-09-18T00:21:17Z) - Dynamic Neural Representational Decoders for High-Resolution Semantic
Segmentation [98.05643473345474]
動的ニューラル表現デコーダ(NRD)と呼ばれる新しいデコーダを提案する。
エンコーダの出力上の各位置がセマンティックラベルの局所的なパッチに対応するので、この研究では、これらの局所的なパッチをコンパクトなニューラルネットワークで表現する。
このニューラル表現により、意味ラベル空間に先行する滑らかさを活用することができ、デコーダをより効率的にすることができる。
論文 参考訳(メタデータ) (2021-07-30T04:50:56Z) - Quantized Neural Networks via {-1, +1} Encoding Decomposition and
Acceleration [83.84684675841167]
本稿では,量子化されたニューラルネットワーク(QNN)をマルチブランチバイナリネットワークに分解するために,-1,+1を用いた新しい符号化方式を提案する。
本稿では,大規模画像分類,オブジェクト検出,セマンティックセグメンテーションにおける提案手法の有効性を検証する。
論文 参考訳(メタデータ) (2021-06-18T03:11:15Z) - End-to-end optimized image compression for machines, a study [3.0448872422956437]
画像とビデオのコンテンツのシェアは、人間が見るのではなく、機械によって分析される。
従来のコーディングツールは、もともと人間の知覚のために設計されたマシンタスクを専門化するのが難しい。
ニューラルネットワークベースのコーデックは、任意の畳み込みニューラルネットワーク(CNN)ベースのタスクモデルと、エンドツーエンドで共同でトレーニングすることができる。
論文 参考訳(メタデータ) (2020-11-10T20:10:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。