論文の概要: Pointsoup: High-Performance and Extremely Low-Decoding-Latency Learned Geometry Codec for Large-Scale Point Cloud Scenes
- arxiv url: http://arxiv.org/abs/2404.13550v1
- Date: Sun, 21 Apr 2024 06:31:29 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-23 18:31:12.404229
- Title: Pointsoup: High-Performance and Extremely Low-Decoding-Latency Learned Geometry Codec for Large-Scale Point Cloud Scenes
- Title(参考訳): Pointsoup: 大規模クラウドシーンのための高性能かつ極低デコードレイテンシ学習幾何コーデック
- Authors: Kang You, Kai Liu, Li Yu, Pan Gao, Dandan Ding,
- Abstract要約: Pointsoupは、高性能かつ極低復号レイテンシを同時に達成する、効率的な学習ベースの幾何学である。
単一のニューラルモデル(2.9MB)で可変レート制御を提供する。
- 参考スコア(独自算出の注目度): 15.262269044326915
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite considerable progress being achieved in point cloud geometry compression, there still remains a challenge in effectively compressing large-scale scenes with sparse surfaces. Another key challenge lies in reducing decoding latency, a crucial requirement in real-world application. In this paper, we propose Pointsoup, an efficient learning-based geometry codec that attains high-performance and extremely low-decoding-latency simultaneously. Inspired by conventional Trisoup codec, a point model-based strategy is devised to characterize local surfaces. Specifically, skin features are embedded from local windows via an attention-based encoder, and dilated windows are introduced as cross-scale priors to infer the distribution of quantized features in parallel. During decoding, features undergo fast refinement, followed by a folding-based point generator that reconstructs point coordinates with fairly fast speed. Experiments show that Pointsoup achieves state-of-the-art performance on multiple benchmarks with significantly lower decoding complexity, i.e., up to 90$\sim$160$\times$ faster than the G-PCCv23 Trisoup decoder on a comparatively low-end platform (e.g., one RTX 2080Ti). Furthermore, it offers variable-rate control with a single neural model (2.9MB), which is attractive for industrial practitioners.
- Abstract(参考訳): 点雲幾何圧縮においてかなりの進歩が達成されているにもかかわらず、大規模なシーンを粗い表面で効果的に圧縮することは依然として課題である。
もうひとつの重要な課題は、現実のアプリケーションにおいて重要な要件である、デコードレイテンシの削減だ。
本稿では,高速かつ極低復号レイテンシを同時に実現した学習に基づく効率的な幾何コーデックであるPointsoupを提案する。
従来のTrisoupコーデックに触発されて、局所曲面を特徴付ける点モデルに基づく戦略が考案された。
具体的には、注意に基づくエンコーダを介して、局所的な窓から皮膚の特徴を埋め込んで、拡張された窓を、並列に量子化された特徴の分布を推定するために、クロススケールの先行として導入する。
復号中、機能は高速に洗練され、続いて折り畳みベースの点生成器がかなり高速で点座標を再構築した。
実験の結果、Pointsoupは、比較的ローエンドなプラットフォーム(例えば、RTX 2080Ti)上のG-PCCv23 Trisoupデコーダよりも90$\sim$160$\times$よりはるかに低いデコード複雑性を持つ複数のベンチマークで、最先端のパフォーマンスを達成することが示された。
さらに、単一のニューラルモデル(2.9MB)で可変レート制御を提供する。
関連論文リスト
- Efficient and Generic Point Model for Lossless Point Cloud Attribute Compression [28.316347464011056]
PoLoPCACは、高い圧縮効率と強力な一般化性を同時に達成する効率的で汎用的なPCAC手法である。
提案手法は,Synthetic 2k-ShapeNetデータセットでトレーニングした時に即座にデプロイできる。
実験により, 各種データセット上でのG-PCCv23よりも連続的にビットレートを低減できることがわかった。
論文 参考訳(メタデータ) (2024-04-10T11:40:02Z) - Hierarchical Prior-based Super Resolution for Point Cloud Geometry
Compression [39.052583172727324]
幾何学に基づくポイントクラウド圧縮(G-PCC)は、ポイントクラウドを圧縮するために移動画像専門家グループによって開発された。
本稿では,点雲幾何学的圧縮のための階層的事前分解能超解法を提案する。
論文 参考訳(メタデータ) (2024-02-17T11:15:38Z) - StarNet: Style-Aware 3D Point Cloud Generation [82.30389817015877]
StarNetは、マッピングネットワークを使用して高忠実度および3Dポイントクラウドを再構築し、生成することができる。
我々のフレームワークは、クラウドの再構築と生成タスクにおいて、様々なメトリクスで同等の最先端のパフォーマンスを達成します。
論文 参考訳(メタデータ) (2023-03-28T08:21:44Z) - DSVT: Dynamic Sparse Voxel Transformer with Rotated Sets [95.84755169585492]
本研究では,屋外3次元知覚のためのシングルストライドウィンドウベースのボクセルトランスであるDynamic Sparse Voxel Transformer (DSVT)を提案する。
本モデルでは,3次元認識タスクを多岐にわたって行うことにより,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-01-15T09:31:58Z) - IPDAE: Improved Patch-Based Deep Autoencoder for Lossy Point Cloud
Geometry Compression [11.410441760314564]
パッチベースのポイントクラウド圧縮の大幅な改善を提案する。
改良されたパッチベースのオートエンコーダは、速度歪み性能の点で最先端よりも優れていることを示す実験結果が得られた。
論文 参考訳(メタデータ) (2022-08-04T08:12:35Z) - SoftPool++: An Encoder-Decoder Network for Point Cloud Completion [93.54286830844134]
本稿では,ポイントクラウド完了作業のための新しい畳み込み演算子を提案する。
提案した演算子は、最大プールやボキセル化操作を一切必要としない。
提案手法は,低解像度・高解像度の形状仕上げにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2022-05-08T15:31:36Z) - Dynamic Point Cloud Compression with Cross-Sectional Approach [10.850101961203748]
MPEGはV-PCCとして知られるビデオベースのPoint Cloud Compression標準を確定した。
提案手法は,新しい断面法を用いて,これらの制約に対処する。
標準ビデオシーケンスを用いた実験結果から,幾何学的およびテクスチャ的データの両方において,提案手法がより良い圧縮を実現することを示す。
論文 参考訳(メタデータ) (2022-04-25T02:58:18Z) - ZippyPoint: Fast Interest Point Detection, Description, and Matching
through Mixed Precision Discretization [71.91942002659795]
我々は,ネットワーク量子化技術を用いて推論を高速化し,計算限定プラットフォームでの利用を可能にする。
バイナリディスクリプタを用いた効率的な量子化ネットワークZippyPointは,ネットワーク実行速度,ディスクリプタマッチング速度,3Dモデルサイズを改善する。
これらの改善は、ホモグラフィー推定、視覚的ローカライゼーション、マップフリーな視覚的再ローカライゼーションのタスクで評価されるように、小さなパフォーマンス劣化をもたらす。
論文 参考訳(メタデータ) (2022-03-07T18:59:03Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - HyperSeg: Patch-wise Hypernetwork for Real-time Semantic Segmentation [95.47168925127089]
本稿では,エンコーダがデコーダのパラメータ(重み)をエンコードして生成する,新しいリアルタイムセマンティックセグメンテーションネットワークを提案する。
我々は、より高レベルなコンテキスト特徴を描画するためのネストされたU-Netからなる新しいタイプのハイパーネットワークを設計する。
論文 参考訳(メタデータ) (2020-12-21T18:58:18Z) - Multiscale Point Cloud Geometry Compression [29.605320327889142]
本稿では,3次元ポイント・クラウド・ジオメトリを階層的に再構築するマルチスケール・ツー・エンド・ラーニング・フレームワークを提案する。
このフレームワークは、ポイントクラウド圧縮と再構成のためのスパース畳み込みベースのオートエンコーダの上に開発されている。
論文 参考訳(メタデータ) (2020-11-07T16:11:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。