論文の概要: OctAttention: Octree-based Large-scale Contexts Model for Point Cloud
Compression
- arxiv url: http://arxiv.org/abs/2202.06028v1
- Date: Sat, 12 Feb 2022 10:06:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-15 15:51:50.299485
- Title: OctAttention: Octree-based Large-scale Contexts Model for Point Cloud
Compression
- Title(参考訳): OctAttention:ポイントクラウド圧縮のためのOctreeベースの大規模コンテキストモデル
- Authors: Chunyang Fu, Ge Li, Rui Song, Wei Gao, Shan Liu
- Abstract要約: OctAttentionは、点雲のメモリ効率のよい表現であるoctree構造を用いる。
我々の手法は、ボクセルベースラインと比較して95%のコーディング時間を節約する。
従来の最先端技術と比較すると,LiDARベンチマークでは10%-35%のBD-Rateゲインが得られる。
- 参考スコア(独自算出の注目度): 36.77271904751208
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In point cloud compression, sufficient contexts are significant for modeling
the point cloud distribution. However, the contexts gathered by the previous
voxel-based methods decrease when handling sparse point clouds. To address this
problem, we propose a multiple-contexts deep learning framework called
OctAttention employing the octree structure, a memory-efficient representation
for point clouds. Our approach encodes octree symbol sequences in a lossless
way by gathering the information of sibling and ancestor nodes. Expressly, we
first represent point clouds with octree to reduce spatial redundancy, which is
robust for point clouds with different resolutions. We then design a
conditional entropy model with a large receptive field that models the sibling
and ancestor contexts to exploit the strong dependency among the neighboring
nodes and employ an attention mechanism to emphasize the correlated nodes in
the context. Furthermore, we introduce a mask operation during training and
testing to make a trade-off between encoding time and performance. Compared to
the previous state-of-the-art works, our approach obtains a 10%-35% BD-Rate
gain on the LiDAR benchmark (e.g. SemanticKITTI) and object point cloud dataset
(e.g. MPEG 8i, MVUB), and saves 95% coding time compared to the voxel-based
baseline. The code is available at https://github.com/zb12138/OctAttention.
- Abstract(参考訳): ポイントクラウド圧縮では、ポイントクラウドの分散をモデル化するのに十分なコンテキストが重要である。
しかし、以前のvoxelベースのメソッドが集めたコンテキストは、スパースポイントクラウドを扱う際に減少する。
そこで本研究では,ポイントクラウドのためのメモリ効率の高い表現であるoctree構造を用いた,ocattentionと呼ばれる多コンテキストディープラーニングフレームワークを提案する。
本手法では,兄弟ノードと祖先ノードの情報を収集することで,octreeシンボルシーケンスを損失のない方法でエンコードする。
明快に言うと、我々はまずoctreeでポイントクラウドを表現し、空間冗長性を低減し、異なる解像度のポイントクラウドに対して堅牢である。
次に、兄弟および祖先のコンテキストをモデル化し、隣接するノード間の強い依存性を活用し、コンテキスト内の相関ノードを強調する注意機構を用いて、条件付きエントロピーモデルを設計する。
さらに,コーディング時間と性能のトレードオフを実現するために,トレーニングとテスト中にマスク操作を導入する。
従来の最先端技術と比較すると,LiDARベンチマーク(SemanticKITTIなど)とオブジェクトポイントクラウドデータセット(MPEG 8i,MVUBなど)で10%-35%のBD-Rateゲインを得ることができ,ボクセルベースラインと比較して95%のコーディング時間を節約できる。
コードはhttps://github.com/zb12138/OctAttentionで入手できる。
関連論文リスト
- PVContext: Hybrid Context Model for Point Cloud Compression [61.24130634750288]
我々は,効率的なオクツリーベースのポイントクラウド圧縮のためのハイブリッドコンテキストモデルPVContextを提案する。
PVContextは、ボクセルを用いて局所幾何学情報を正確に表現するVoxel Contextと、ポイントクラウドからグローバルな形状情報を効率的に保存するPoint Contextの2つのコンポーネントから構成される。
論文 参考訳(メタデータ) (2024-09-19T12:47:35Z) - Enhancing context models for point cloud geometry compression with context feature residuals and multi-loss [17.88391386335647]
点雲幾何学的圧縮では、コンテキストモデルは通常、ノード占有率の1ホット符号化をラベルとして使用する。
コンテキスト間の差異を増幅するために、コンテキストモデルにコンテキスト特徴残差を導入する。
また、出力とノード占有率の平均2乗誤差を損失関数として用いた多層知覚分岐も追加する。
論文 参考訳(メタデータ) (2024-07-11T14:08:37Z) - GQE-Net: A Graph-based Quality Enhancement Network for Point Cloud Color
Attribute [51.4803148196217]
本稿では,点雲の色歪みを低減するため,グラフベースの品質向上ネットワーク(GQE-Net)を提案する。
GQE-Netは、幾何学情報を補助入力とグラフ畳み込みブロックとして使用し、局所的な特徴を効率的に抽出する。
実験結果から,本手法は最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2023-03-24T02:33:45Z) - ECM-OPCC: Efficient Context Model for Octree-based Point Cloud
Compression [6.509720419113212]
我々は,十分に効率的なコンテキストモデルを提案し,ポイントクラウドのための効率的なディープラーニングを設計する。
具体的には、まず、自己回帰的コンテキストを活用するために、ウィンドウ制約付きマルチグループ符号化戦略を提案する。
また、その祖先と兄弟に対する現在のノードの依存性を利用するためのデュアルトランスフォーマーアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-11-20T09:20:32Z) - Point Cloud Compression with Sibling Context and Surface Priors [47.96018990521301]
大規模クラウド圧縮のための新しいオクツリーベースのマルチレベルフレームワークを提案する。
本稿では,オクツリーの階層的依存性を探索する新しいエントロピーモデルを提案する。
表面をボクセルベースの幾何認識モジュールで局所的に整合させ,エントロピー符号化における幾何学的先行情報を提供する。
論文 参考訳(メタデータ) (2022-05-02T09:13:26Z) - PointAttN: You Only Need Attention for Point Cloud Completion [89.88766317412052]
ポイント・クラウド・コンプリート(Point cloud completion)とは、部分的な3次元ポイント・クラウドから3次元の形状を完成させることである。
そこで我々は,kNNを除去するために,ポイントクラウドをポイント単位に処理する新しいニューラルネットワークを提案する。
提案するフレームワークであるPointAttNはシンプルで簡潔で効果的であり、3次元形状の構造情報を正確に捉えることができる。
論文 参考訳(メタデータ) (2022-03-16T09:20:01Z) - CP-Net: Contour-Perturbed Reconstruction Network for Self-Supervised
Point Cloud Learning [53.1436669083784]
本稿では,CP-Net(Contour-Perturbed Restruction Network)を提案する。
分類では、ModelNet40(92.5%の精度)とScanObjectNN(87.9%の精度)の完全教師付き手法で競合する結果を得る。
論文 参考訳(メタデータ) (2022-01-20T15:04:12Z) - DeepCLR: Correspondence-Less Architecture for Deep End-to-End Point
Cloud Registration [12.471564670462344]
この研究は、ディープニューラルネットワークを用いたポイントクラウド登録の問題に対処する。
重なり合うデータ内容を持つ2つの点雲間のアライメントを予測する手法を提案する。
提案手法は,最先端の精度と比較手法の最低実行時間を実現する。
論文 参考訳(メタデータ) (2020-07-22T08:20:57Z) - TearingNet: Point Cloud Autoencoder to Learn Topology-Friendly
Representations [20.318695890515613]
本稿では,固定長ディスクリプタを用いたポイントクラウドの表現に挑戦する自動エンコーダTearingNetを提案する。
我々のTeringNetは、提案されたTeringネットワークモジュールと、相互に反復的に相互作用するFoldingネットワークモジュールによって特徴付けられる。
実験は、点雲の再構成や、ベンチマークよりもトポロジに優しい表現を生成するという点で、我々の提案の優位性を示している。
論文 参考訳(メタデータ) (2020-06-17T22:42:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。