論文の概要: Enhancing context models for point cloud geometry compression with context feature residuals and multi-loss
- arxiv url: http://arxiv.org/abs/2407.08520v1
- Date: Thu, 11 Jul 2024 14:08:37 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-12 17:10:08.267545
- Title: Enhancing context models for point cloud geometry compression with context feature residuals and multi-loss
- Title(参考訳): コンテキスト特徴残差とマルチロスを用いた点雲幾何圧縮のためのコンテキストモデル強化
- Authors: Chang Sun, Hui Yuan, Shuai Li, Xin Lu, Raouf Hamzaoui,
- Abstract要約: 点雲幾何学的圧縮では、コンテキストモデルは通常、ノード占有率の1ホット符号化をラベルとして使用する。
コンテキスト間の差異を増幅するために、コンテキストモデルにコンテキスト特徴残差を導入する。
また、出力とノード占有率の平均2乗誤差を損失関数として用いた多層知覚分岐も追加する。
- 参考スコア(独自算出の注目度): 17.88391386335647
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In point cloud geometry compression, context models usually use the one-hot encoding of node occupancy as the label, and the cross-entropy between the one-hot encoding and the probability distribution predicted by the context model as the loss function. However, this approach has two main weaknesses. First, the differences between contexts of different nodes are not significant, making it difficult for the context model to accurately predict the probability distribution of node occupancy. Second, as the one-hot encoding is not the actual probability distribution of node occupancy, the cross-entropy loss function is inaccurate. To address these problems, we propose a general structure that can enhance existing context models. We introduce the context feature residuals into the context model to amplify the differences between contexts. We also add a multi-layer perception branch, that uses the mean squared error between its output and node occupancy as a loss function to provide accurate gradients in backpropagation. We validate our method by showing that it can improve the performance of an octree-based model (OctAttention) and a voxel-based model (VoxelDNN) on the object point cloud datasets MPEG 8i and MVUB, as well as the LiDAR point cloud dataset SemanticKITTI.
- Abstract(参考訳): 点雲の幾何学的圧縮では、コンテキストモデルは通常、ノード占有率の1ホット符号化をラベルとして使用し、その1ホット符号化と、コンテキストモデルによって予測される確率分布との交叉エントロピーを損失関数として使用する。
しかし、このアプローチには2つの大きな弱点がある。
まず、異なるノードのコンテキストの違いは重要ではなく、コンテキストモデルがノード占有率の確率分布を正確に予測することは困難である。
第二に、1ホット符号化はノード占有率の実際の確率分布ではないので、クロスエントロピー損失関数は不正確である。
これらの問題に対処するために,既存の文脈モデルを強化する汎用構造を提案する。
コンテキスト間の差異を増幅するために、コンテキストモデルにコンテキスト特徴残差を導入する。
また、その出力とノード占有率の平均2乗誤差を損失関数として用いて、バックプロパゲーションの正確な勾配を与える多層認識分岐も追加する。
我々は,OctAttention(OctAttention)モデルとVoxelDNN(VoxelDNN)モデルのオブジェクトポイントクラウドデータセットMPEG 8iとMVUB,およびLiDARポイントクラウドデータセットSemanticKITTIの性能を向上できることを示し,本手法の有効性を検証する。
関連論文リスト
- SIGMA:Sinkhorn-Guided Masked Video Modeling [69.31715194419091]
SIGMA (Sinkhorn-guided Masked Video Modelling) は、新しいビデオ事前学習法である。
時空管の特徴を,限られた数の学習可能なクラスタに均等に分散する。
10個のデータセットによる実験結果から,より高性能で時間的,堅牢な映像表現を学習する上で,SIGMAの有効性が検証された。
論文 参考訳(メタデータ) (2024-07-22T08:04:09Z) - Enhancing octree-based context models for point cloud geometry compression with attention-based child node number prediction [12.074555015414886]
点雲幾何学的圧縮では、ほとんどのオクツリーベースのコンテキストモデルでは、ノード占有率の1ホット符号化と、コンテキストモデルによって予測される確率分布との交差エントロピーを損失として利用する。
まず,クロスエントロピー損失関数が1ホット符号化と予測確率分布の差を正確に測定できない理由を解析する。
本稿では,注意に基づく子ノード数予測(ACNP)モジュールを提案する。
論文 参考訳(メタデータ) (2024-07-11T14:16:41Z) - Towards Robust and Efficient Cloud-Edge Elastic Model Adaptation via Selective Entropy Distillation [56.79064699832383]
Cloud-Edge Elastic Model Adaptation (CEMA)パラダイムを確立し、エッジモデルが前方伝播のみを実行するようにします。
CEMAでは,通信負担を軽減するため,不要なサンプルをクラウドにアップロードすることを避けるための2つの基準を考案した。
論文 参考訳(メタデータ) (2024-02-27T08:47:19Z) - Unsupervised Deep Probabilistic Approach for Partial Point Cloud
Registration [74.53755415380171]
ディープポイントクラウド登録手法は、部分的に重複し、ラベル付きデータに依存するという課題に直面している。
部分的な重なりを持つ点雲に対する教師なしの深い確率的登録フレームワークであるUDPRegを提案する。
UDPRegは3DMatch/3DLoMatchとModelNet/ModelLoNetベンチマークの競合性能を実現しています。
論文 参考訳(メタデータ) (2023-03-23T14:18:06Z) - Interpretations Steered Network Pruning via Amortized Inferred Saliency
Maps [85.49020931411825]
限られたリソースを持つエッジデバイスにこれらのモデルをデプロイするには、畳み込みニューラルネットワーク(CNN)圧縮が不可欠である。
本稿では,新しい視点からチャネルプルーニング問題に対処するために,モデルの解釈を活用して,プルーニング過程を解析する手法を提案する。
本研究では,実時間スムーズなスムーズなスムーズなスムーズなマスク予測を行うセレクタモデルを導入することで,この問題に対処する。
論文 参考訳(メタデータ) (2022-09-07T01:12:11Z) - OctAttention: Octree-based Large-scale Contexts Model for Point Cloud
Compression [36.77271904751208]
OctAttentionは、点雲のメモリ効率のよい表現であるoctree構造を用いる。
我々の手法は、ボクセルベースラインと比較して95%のコーディング時間を節約する。
従来の最先端技術と比較すると,LiDARベンチマークでは10%-35%のBD-Rateゲインが得られる。
論文 参考訳(メタデータ) (2022-02-12T10:06:12Z) - A Deep Latent Space Model for Graph Representation Learning [10.914558012458425]
本稿では,従来の潜時変動に基づく生成モデルをディープラーニングフレームワークに組み込むために,有向グラフのための深潜時空間モデル(DLSM)を提案する。
提案モデルは,階層的変動型オートエンコーダアーキテクチャによって階層的に接続されるグラフ畳み込みネットワーク(GCN)エンコーダとデコーダから構成される。
実世界のデータセットにおける実験により,提案モデルがリンク予測とコミュニティ検出の両タスクにおける最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2021-06-22T12:41:19Z) - Towards Efficient Scene Understanding via Squeeze Reasoning [71.1139549949694]
我々はSqueeze Reasoningと呼ばれる新しいフレームワークを提案する。
空間地図上の情報を伝播するのではなく、まず入力特徴をチャネルワイドなグローバルベクトルに絞ることを学ぶ。
提案手法はエンドツーエンドのトレーニングブロックとしてモジュール化可能であり,既存のネットワークに簡単に接続可能であることを示す。
論文 参考訳(メタデータ) (2020-11-06T12:17:01Z) - Learning Context-Based Non-local Entropy Modeling for Image Compression [140.64888994506313]
本稿では,文脈内でのグローバルな類似性を利用して,文脈モデリングのための非局所的操作を提案する。
エントロピーモデルはさらに、結合速度歪み最適化における速度損失として採用されている。
低歪みモデルのトレーニングに変換の幅が不可欠であることを考えると、最終的に変換のU-Netブロックを生成して、管理可能なメモリ消費と時間複雑性で幅を拡大する。
論文 参考訳(メタデータ) (2020-05-10T13:28:18Z) - Residual Correlation in Graph Neural Network Regression [39.54530450932135]
我々は条件付き独立仮定が予測力を著しく制限していることを示します。
この問題を解釈可能かつ効率的なフレームワークで解決する。
我々のフレームワークは、競合するベースラインよりもかなり高い精度を実現している。
論文 参考訳(メタデータ) (2020-02-19T16:32:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。