Fugu-MT 論文翻訳(概要): Pointsoup: High-Performance and Extremely Low-Decoding-Latency Learned Geometry Codec for Large-Scale Point Cloud Scenes

論文の概要: Pointsoup: High-Performance and Extremely Low-Decoding-Latency Learned Geometry Codec for Large-Scale Point Cloud Scenes

arxiv url: http://arxiv.org/abs/2404.13550v1
Date: Sun, 21 Apr 2024 06:31:29 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-23 18:31:12.404229
Title: Pointsoup: High-Performance and Extremely Low-Decoding-Latency Learned Geometry Codec for Large-Scale Point Cloud Scenes
Title（参考訳）: Pointsoup: 大規模クラウドシーンのための高性能かつ極低デコードレイテンシ学習幾何コーデック
Authors: Kang You, Kai Liu, Li Yu, Pan Gao, Dandan Ding,
Abstract要約: Pointsoupは、高性能かつ極低復号レイテンシを同時に達成する、効率的な学習ベースの幾何学である。単一のニューラルモデル(2.9MB)で可変レート制御を提供する。
参考スコア（独自算出の注目度）: 15.262269044326915
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Despite considerable progress being achieved in point cloud geometry compression, there still remains a challenge in effectively compressing large-scale scenes with sparse surfaces. Another key challenge lies in reducing decoding latency, a crucial requirement in real-world application. In this paper, we propose Pointsoup, an efficient learning-based geometry codec that attains high-performance and extremely low-decoding-latency simultaneously. Inspired by conventional Trisoup codec, a point model-based strategy is devised to characterize local surfaces. Specifically, skin features are embedded from local windows via an attention-based encoder, and dilated windows are introduced as cross-scale priors to infer the distribution of quantized features in parallel. During decoding, features undergo fast refinement, followed by a folding-based point generator that reconstructs point coordinates with fairly fast speed. Experiments show that Pointsoup achieves state-of-the-art performance on multiple benchmarks with significantly lower decoding complexity, i.e., up to 90$\sim$160$\times$ faster than the G-PCCv23 Trisoup decoder on a comparatively low-end platform (e.g., one RTX 2080Ti). Furthermore, it offers variable-rate control with a single neural model (2.9MB), which is attractive for industrial practitioners.
Abstract（参考訳）: 点雲幾何圧縮においてかなりの進歩が達成されているにもかかわらず、大規模なシーンを粗い表面で効果的に圧縮することは依然として課題である。もうひとつの重要な課題は、現実のアプリケーションにおいて重要な要件である、デコードレイテンシの削減だ。本稿では,高速かつ極低復号レイテンシを同時に実現した学習に基づく効率的な幾何コーデックであるPointsoupを提案する。従来のTrisoupコーデックに触発されて、局所曲面を特徴付ける点モデルに基づく戦略が考案された。具体的には、注意に基づくエンコーダを介して、局所的な窓から皮膚の特徴を埋め込んで、拡張された窓を、並列に量子化された特徴の分布を推定するために、クロススケールの先行として導入する。復号中、機能は高速に洗練され、続いて折り畳みベースの点生成器がかなり高速で点座標を再構築した。実験の結果、Pointsoupは、比較的ローエンドなプラットフォーム(例えば、RTX 2080Ti)上のG-PCCv23 Trisoupデコーダよりも90$\sim$160$\times$よりはるかに低いデコード複雑性を持つ複数のベンチマークで、最先端のパフォーマンスを達成することが示された。さらに、単一のニューラルモデル(2.9MB)で可変レート制御を提供する。

関連論文リスト

ProGIC: Progressive and Lightweight Generative Image Compression with Residual Vector Quantization [59.481950697968706]
残留ベクトル量子化(RVQ)に基づくコンパクトなプログレッシブ生成画像圧縮(ProGIC)を提案する。 RVQでは、ベクトル量子化器の列がステージごとに残余を符号化し、それぞれが独自のコードブックを持つ。これを奥行き分離可能な畳み込みと小さな注意ブロックに基づく軽量なバックボーンと組み合わせることで、GPUとCPUのみのデバイスに実用的なデプロイを可能にします。
論文参考訳（メタデータ） (2026-03-03T11:47:05Z)
Re-Densification Meets Cross-Scale Propagation: Real-Time Neural Compression of LiDAR Point Clouds [83.39320394656855]
LiDARポイントクラウドは、様々なアプリケーションに基本的だが、高精度スキャンは、かなりのストレージと送信オーバーヘッドを発生させる。既存の手法では、非順序の点を階層的なオクツリーやボクセル構造に変換して、密度から疎い予測符号化を行うのが一般的である。筆者らのフレームワークは2つの軽量モジュールから構成されている。まず、Geometry Re-Densification Moduleがエンコードされたスパース幾何を再認識し、より密なスケールで特徴を抽出し、予測符号化のための特徴を再分離する。
論文参考訳（メタデータ） (2025-08-28T06:36:10Z)
On Geometry-Enhanced Parameter-Efficient Fine-Tuning for 3D Scene Segmentation [52.96632954620623]
本稿では3Dポイント・クラウド・トランス用に設計された新しい幾何対応PEFTモジュールを提案する。当社のアプローチでは,大規模3Dポイントクラウドモデルの効率的,スケーラブル,かつ幾何を考慮した微調整のための新しいベンチマークを設定している。
論文参考訳（メタデータ） (2025-05-28T15:08:36Z)
REN: Fast and Efficient Region Encodings from Patch-Based Image Encoders [52.61034140869803]
Region Network (REN) は、ポイントプロンプトを用いて領域ベースの画像表現を生成するための高速で効果的なモデルである。 RENは、リージョントークンを直接生成する軽量モジュールを使用して、このボトルネックをバイパスする。これはいくつかのクロスアテンションブロックを使用し、ポイントプロンプトをクエリとして取り、パッチベースのイメージエンコーダからキーと値として機能してリージョントークンを生成する。
論文参考訳（メタデータ） (2025-05-23T17:59:33Z)
High Efficiency Wiener Filter-based Point Cloud Quality Enhancement for MPEG G-PCC [23.8642501868336]
点雲は、シーンやオブジェクトの幾何学や属性を多数の点で直接記録する。静的クラウドと動的クラウドの両方に対するジオメトリベースのポイントクラウド圧縮(G-PCC)標準。 G-PCCのエンコーダおよびデコーダパイプラインに統合可能な高効率Wienerフィルタを提案する。
論文参考訳（メタデータ） (2025-03-21T18:24:58Z)
Implicit Neural Compression of Point Clouds [61.491532656446054]
NeRC$3$は、新しいポイントクラウド圧縮フレームワークである。 NeRC$3$は密度点雲の幾何学と属性の両方を符号化する。動的点雲の場合、4D-NeRC$3$は優れた幾何圧縮性能を達成する。
論文参考訳（メタデータ） (2024-12-11T03:22:00Z)
DiffCom: Decoupled Sparse Priors Guided Diffusion Compression for Point Clouds [54.96190721255167]
ロスシー圧縮は、ポイントクラウドをストレージの潜在ポイントに変換するためのオートエンコーダに依存している。本稿では,特に低レベルにおいて高い復元品質を実現するための拡散型フレームワークを提案する。
論文参考訳（メタデータ） (2024-11-21T05:41:35Z)
High-Efficiency Neural Video Compression via Hierarchical Predictive Learning [27.41398149573729]
強化されたDeep Hierarchical Video Compression(DHVC 2.0)は、優れた圧縮性能と目覚ましい複雑さの効率を導入する。階層的な予測符号化を使用して、各ビデオフレームをマルチスケール表現に変換する。トランスミッションフレンドリーなプログレッシブデコーディングをサポートしており、パケットロスの存在下では特にネットワーク化されたビデオアプリケーションに有利である。
論文参考訳（メタデータ） (2024-10-03T15:40:58Z)
SPAC: Sampling-based Progressive Attribute Compression for Dense Point Clouds [51.313922535437726]
本研究では,高密度点雲のエンドツーエンド圧縮法を提案する。提案手法は,周波数サンプリングモジュール,適応スケール特徴抽出モジュール,幾何支援モジュール,大域的ハイパープライアエントロピーモデルを組み合わせた。
論文参考訳（メタデータ） (2024-09-16T13:59:43Z)
Fast Point Cloud Geometry Compression with Context-based Residual Coding and INR-based Refinement [19.575833741231953]
我々は、KNN法を用いて、原表面点の近傍を決定する。条件付き確率モデルは局所幾何学に適応し、大きな速度減少をもたらす。暗黙のニューラル表現を精製層に組み込むことで、デコーダは任意の密度で下面の点をサンプリングすることができる。
論文参考訳（メタデータ） (2024-08-06T05:24:06Z)
Hierarchical Prior-based Super Resolution for Point Cloud Geometry Compression [39.052583172727324]
幾何学に基づくポイントクラウド圧縮(G-PCC)は、ポイントクラウドを圧縮するために移動画像専門家グループによって開発された。本稿では,点雲幾何学的圧縮のための階層的事前分解能超解法を提案する。
論文参考訳（メタデータ） (2024-02-17T11:15:38Z)
StarNet: Style-Aware 3D Point Cloud Generation [82.30389817015877]
StarNetは、マッピングネットワークを使用して高忠実度および3Dポイントクラウドを再構築し、生成することができる。我々のフレームワークは、クラウドの再構築と生成タスクにおいて、様々なメトリクスで同等の最先端のパフォーマンスを達成します。
論文参考訳（メタデータ） (2023-03-28T08:21:44Z)
DSVT: Dynamic Sparse Voxel Transformer with Rotated Sets [95.84755169585492]
本研究では,屋外3次元知覚のためのシングルストライドウィンドウベースのボクセルトランスであるDynamic Sparse Voxel Transformer (DSVT)を提案する。本モデルでは,3次元認識タスクを多岐にわたって行うことにより,最先端の性能を実現する。
論文参考訳（メタデータ） (2023-01-15T09:31:58Z)
IPDAE: Improved Patch-Based Deep Autoencoder for Lossy Point Cloud Geometry Compression [11.410441760314564]
パッチベースのポイントクラウド圧縮の大幅な改善を提案する。改良されたパッチベースのオートエンコーダは、速度歪み性能の点で最先端よりも優れていることを示す実験結果が得られた。
論文参考訳（メタデータ） (2022-08-04T08:12:35Z)
SoftPool++: An Encoder-Decoder Network for Point Cloud Completion [93.54286830844134]
本稿では,ポイントクラウド完了作業のための新しい畳み込み演算子を提案する。提案した演算子は、最大プールやボキセル化操作を一切必要としない。提案手法は,低解像度・高解像度の形状仕上げにおける最先端性能を実現する。
論文参考訳（メタデータ） (2022-05-08T15:31:36Z)
ZippyPoint: Fast Interest Point Detection, Description, and Matching through Mixed Precision Discretization [71.91942002659795]
我々は,ネットワーク量子化技術を用いて推論を高速化し,計算限定プラットフォームでの利用を可能にする。バイナリディスクリプタを用いた効率的な量子化ネットワークZippyPointは,ネットワーク実行速度,ディスクリプタマッチング速度,3Dモデルサイズを改善する。これらの改善は、ホモグラフィー推定、視覚的ローカライゼーション、マップフリーな視覚的再ローカライゼーションのタスクで評価されるように、小さなパフォーマンス劣化をもたらす。
論文参考訳（メタデータ） (2022-03-07T18:59:03Z)
HyperSeg: Patch-wise Hypernetwork for Real-time Semantic Segmentation [95.47168925127089]
本稿では,エンコーダがデコーダのパラメータ(重み)をエンコードして生成する,新しいリアルタイムセマンティックセグメンテーションネットワークを提案する。我々は、より高レベルなコンテキスト特徴を描画するためのネストされたU-Netからなる新しいタイプのハイパーネットワークを設計する。
論文参考訳（メタデータ） (2020-12-21T18:58:18Z)
Multiscale Point Cloud Geometry Compression [29.605320327889142]
本稿では,3次元ポイント・クラウド・ジオメトリを階層的に再構築するマルチスケール・ツー・エンド・ラーニング・フレームワークを提案する。このフレームワークは、ポイントクラウド圧縮と再構成のためのスパース畳み込みベースのオートエンコーダの上に開発されている。
論文参考訳（メタデータ） (2020-11-07T16:11:16Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。