論文の概要: NeuralQAAD: An Efficient Differentiable Framework for High Resolution
Point Cloud Compression
- arxiv url: http://arxiv.org/abs/2012.08143v1
- Date: Tue, 15 Dec 2020 08:18:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-07 05:12:21.956659
- Title: NeuralQAAD: An Efficient Differentiable Framework for High Resolution
Point Cloud Compression
- Title(参考訳): NeuralQAAD: 高解像度ポイントクラウド圧縮のための効率的な微分可能なフレームワーク
- Authors: Nicolas Wagner, Ulrich Schwanecke
- Abstract要約: 我々は,高速で,サンプリングに堅牢で,高解像度に適用可能な,差別化可能なポイントクラウド圧縮フレームワークであるNeuralQAADを提案する。
重みの共有と自動復号を特徴とする新しいニューラルネットワークアーキテクチャを用いて課題に取り組む。
NeuralQAADは、COMA、D-FAUST、およびSkullsで実証され、現在の最先端の視覚的およびEM-kDの観点で大幅にパフォーマンスを上回る。
- 参考スコア(独自算出の注目度): 4.1423579563037505
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In this paper, we propose NeuralQAAD, a differentiable point cloud
compression framework that is fast, robust to sampling, and applicable to high
resolutions. Previous work that is able to handle complex and non-smooth
topologies is hardly scaleable to more than just a few thousand points. We
tackle the task with a novel neural network architecture characterized by
weight sharing and autodecoding. Our architecture uses parameters much more
efficiently than previous work, allowing us to be deeper and scalable.
Futhermore, we show that the currently only tractable training criterion for
point cloud compression, the Chamfer distance, performances poorly for high
resolutions. To overcome this issue, we pair our architecture with a new
training procedure based upon a quadratic assignment problem (QAP) for which we
state two approximation algorithms. We solve the QAP in parallel to gradient
descent. This procedure acts as a surrogate loss and allows to implicitly
minimize the more expressive Earth Movers Distance (EMD) even for point clouds
with way more than $10^6$ points. As evaluating the EMD on high resolution
point clouds is intractable, we propose a divide-and-conquer approach based on
k-d trees, the EM-kD, as a scaleable and fast but still reliable upper bound
for the EMD. NeuralQAAD is demonstrated on COMA, D-FAUST, and Skulls to
significantly outperform the current state-of-the-art visually and in terms of
the EM-kD. Skulls is a novel dataset of skull CT-scans which we will make
publicly available together with our implementation of NeuralQAAD.
- Abstract(参考訳): 本稿では,高速で,サンプリングに頑健で,高解像度に適用可能な,微分可能なポイントクラウド圧縮フレームワークneuralqaadを提案する。
複雑で非滑らかなトポロジを扱うことができるこれまでの作業は、ほんの数千ポイント以上まで拡張可能であることはほとんどない。
我々は、ウェイトシェアリングとオートデコーディングを特徴とする新しいニューラルネットワークアーキテクチャでタスクに取り組む。
私たちのアーキテクチャは、以前の作業よりもずっと効率的にパラメータを使用します。
さらに、現在、ポイントクラウド圧縮のための唯一の訓練基準である、Chamfer距離、高解像度では性能が劣っていることを示す。
この問題を克服するために,我々は2つの近似アルゴリズムを提示する二次代入問題 (qap) に基づく新しい訓練手順とアーキテクチャを組み合わせる。
我々は勾配降下と並行してqapを解く。
この手順は代理損失として機能し、より表現力のある地球移動距離 (EMD) を10^6$以上の点群であっても暗黙的に最小化することができる。
高分解能点雲上でのemdの評価は難解なため、emdのスケール可能かつ高速かつ信頼性の高い上限として、k-d木に基づく分割・分割手法を提案する。
ニューラルQAADはCOMA、D-FAUST、Skullsで示され、現状の最先端とEM-kDで大きく上回っている。
Skullsは頭蓋骨CTスキャンの新しいデータセットであり、NeuralQAADの実装とともに公開します。
関連論文リスト
- Fast Point Cloud Geometry Compression with Context-based Residual Coding and INR-based Refinement [19.575833741231953]
我々は、KNN法を用いて、原表面点の近傍を決定する。
条件付き確率モデルは局所幾何学に適応し、大きな速度減少をもたらす。
暗黙のニューラル表現を精製層に組み込むことで、デコーダは任意の密度で下面の点をサンプリングすることができる。
論文 参考訳(メタデータ) (2024-08-06T05:24:06Z) - N-BVH: Neural ray queries with bounding volume hierarchies [51.430495562430565]
3Dコンピュータグラフィックスでは、シーンのメモリ使用量の大部分がポリゴンとテクスチャによるものである。
N-BVHは3次元の任意の光線クエリに応答するように設計されたニューラル圧縮アーキテクチャである。
本手法は, 視認性, 深度, 外観特性を忠実に近似する。
論文 参考訳(メタデータ) (2024-05-25T13:54:34Z) - CMG-Net: Robust Normal Estimation for Point Clouds via Chamfer Normal
Distance and Multi-scale Geometry [23.86650228464599]
この研究は、点雲から正規度を推定するための正確で堅牢な方法を示す。
まず,この問題に対処するため,シャンファー正規距離(Chamfer Normal Distance)と呼ばれる新しい尺度を提案する。
マルチスケールな局所的特徴集約と階層的幾何情報融合を含む革新的なアーキテクチャを考案する。
論文 参考訳(メタデータ) (2023-12-14T17:23:16Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - EVC-Net: Multi-scale V-Net with Conditional Random Fields for Brain
Extraction [3.4376560669160394]
EVC-Netは各エンコーダブロックに低スケール入力を追加する。
条件付きランダムフィールドは、ネットワークの出力を洗練するための追加ステップとしてここで再導入される。
その結果、限られたトレーニングリソースであっても、EVC-Netはより高いDice CoefficientとJaccard Indexを達成することがわかった。
論文 参考訳(メタデータ) (2022-06-06T18:21:21Z) - Scalable Kernel-Based Minimum Mean Square Error Estimator for
Accelerated Image Error Concealment [2.3484130340004326]
拡張性のある空間誤差隠蔽アルゴリズムを提案する。
カーネルベースの最小二乗誤差K-MMSE推定器の優れた再構成能力を利用する。
K-MMSEと同等の高品質な再構築を行い、計算時間の約10分の1を必要としている。
論文 参考訳(メタデータ) (2022-05-23T12:15:24Z) - Scaling Structured Inference with Randomization [64.18063627155128]
本稿では、構造化されたモデルを数万の潜在状態に拡張するためにランダム化された動的プログラミング(RDP)のファミリを提案する。
我々の手法は古典的DPベースの推論に広く適用できる。
また、自動微分とも互換性があり、ニューラルネットワークとシームレスに統合できる。
論文 参考訳(メタデータ) (2021-12-07T11:26:41Z) - An Information Theory-inspired Strategy for Automatic Network Pruning [88.51235160841377]
深層畳み込みニューラルネットワークは、リソース制約のあるデバイスで圧縮されることがよく知られている。
既存のネットワークプルーニング手法の多くは、人的努力と禁忌な計算資源を必要とする。
本稿では,自動モデル圧縮のための情報理論に基づく戦略を提案する。
論文 参考訳(メタデータ) (2021-08-19T07:03:22Z) - When Liebig's Barrel Meets Facial Landmark Detection: A Practical Model [87.25037167380522]
正確で、堅牢で、効率的で、一般化可能で、エンドツーエンドのトレーニングが可能なモデルを提案する。
精度を向上させるために,2つの軽量モジュールを提案する。
DQInitは、インプットからデコーダのクエリを動的に初期化し、複数のデコーダ層を持つものと同じ精度でモデルを実現する。
QAMemは、共有するクエリではなく、それぞれのクエリに別々のメモリ値を割り当てることで、低解像度のフィーチャーマップ上のクエリの識別能力を高めるように設計されている。
論文 参考訳(メタデータ) (2021-05-27T13:51:42Z) - Once Quantization-Aware Training: High Performance Extremely Low-bit
Architecture Search [112.05977301976613]
本稿では,ネットワークアーキテクチャ検索手法と量子化手法を組み合わせることで,両者のメリットを享受することを提案する。
まず、多数の量子化モデルを取得するために、共有ステップサイズでアーキテクチャと量子化の合同トレーニングを提案する。
次に、量子化されたモデルを低ビットに転送するためにビット継承方式を導入し、さらに時間コストを削減し、量子化精度を向上させる。
論文 参考訳(メタデータ) (2020-10-09T03:52:16Z) - Hierarchical Quantized Autoencoders [3.9146761527401432]
本稿では,Vector Quantized Variencoders (VQ-VAEs) の階層構造を用いて,高い圧縮係数を求める。
量子化と階層的潜在構造の組み合わせは、確率に基づく画像圧縮に役立つことを示す。
得られたスキームは、高い知覚品質の画像を再構成するマルコフ変数の列を生成する。
論文 参考訳(メタデータ) (2020-02-19T11:26:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。