論文の概要: Volumetric Attribute Compression for 3D Point Clouds using Feedforward
Network with Geometric Attention
- arxiv url: http://arxiv.org/abs/2304.00335v1
- Date: Sat, 1 Apr 2023 15:24:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-04 18:33:25.576246
- Title: Volumetric Attribute Compression for 3D Point Clouds using Feedforward
Network with Geometric Attention
- Title(参考訳): 幾何学的注意を伴うフィードフォワードネットワークを用いた3次元点雲の体積属性圧縮
- Authors: Tam Thuc Do, Philip A. Chou, Gene Cheung
- Abstract要約: 固有分解のない関数空間にまたがる高階B-スプラインベースを実装したフィードフォワード線形ネットワークを提案する。
エンコーダにおける正規化におけるレイヤーの数は、逆テイラー級数における項の数に等しいことを示す。
- 参考スコア(独自算出の注目度): 36.41214415449853
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We study 3D point cloud attribute compression using a volumetric approach:
given a target volumetric attribute function $f : \mathbb{R}^3 \rightarrow
\mathbb{R}$, we quantize and encode parameter vector $\theta$ that
characterizes $f$ at the encoder, for reconstruction
$f_{\hat{\theta}}(\mathbf{x})$ at known 3D points $\mathbf{x}$'s at the
decoder. Extending a previous work Region Adaptive Hierarchical Transform
(RAHT) that employs piecewise constant functions to span a nested sequence of
function spaces, we propose a feedforward linear network that implements
higher-order B-spline bases spanning function spaces without
eigen-decomposition. Feedforward network architecture means that the system is
amenable to end-to-end neural learning. The key to our network is space-varying
convolution, similar to a graph operator, whose weights are computed from the
known 3D geometry for normalization. We show that the number of layers in the
normalization at the encoder is equivalent to the number of terms in a matrix
inverse Taylor series. Experimental results on real-world 3D point clouds show
up to 2-3 dB gain over RAHT in energy compaction and 20-30% bitrate reduction.
- Abstract(参考訳): 対象のボリューム属性関数 $f : \mathbb{R}^3 \rightarrow \mathbb{R}$ を与えられた場合、エンコーダで$f$を特徴づけるパラメータベクトル $\theta$ を量子化し、エンコーダで$f$ を符号化し、復調する $f_{\hat{\theta}}(\mathbf{x})$ 既知の3Dポイントで $\mathbf{x}$'s をデコーダで符号化する。
関数空間のネスト列にまたがる一括定数関数を用いた以前の処理領域適応階層変換(RAHT)を拡張し,固有分解のない関数空間にまたがる高次B-スプラインベースを実装したフィードフォワード線形ネットワークを提案する。
feedforwardネットワークアーキテクチャは、システムがエンドツーエンドのニューラルネットワークに適していることを意味する。
我々のネットワークの鍵は空間変化の畳み込みであり、その重みは正規化のために既知の3次元幾何学から計算されるグラフ演算子に似ている。
エンコーダにおける正規化の層数は行列逆テイラー級数における項数に等しいことを示す。
実世界の3次元点雲の実験結果は、RAHTよりも2~3dBのエネルギー圧縮と20~30%のビットレート還元を示す。
関連論文リスト
- Implicit Hypersurface Approximation Capacity in Deep ReLU Networks [0.0]
本稿では,ReLUアクティベーションを用いたディープフィードフォワードニューラルネットワークの幾何近似理論を開発する。
幅$d+1$の深い完全連結ReLUネットワークは、そのゼロ輪郭として暗黙的に近似を構成することができることを示す。
論文 参考訳(メタデータ) (2024-07-04T11:34:42Z) - Learning Hierarchical Polynomials with Three-Layer Neural Networks [56.71223169861528]
3層ニューラルネットワークを用いた標準ガウス分布における階層関数の学習問題について検討する。
次数$k$s$p$の大規模なサブクラスの場合、正方形損失における階層的勾配によるトレーニングを受けた3層ニューラルネットワークは、テストエラーを消すためにターゲット$h$を学習する。
この研究は、3層ニューラルネットワークが複雑な特徴を学習し、その結果、幅広い階層関数のクラスを学ぶ能力を示す。
論文 参考訳(メタデータ) (2023-11-23T02:19:32Z) - Learned Nonlinear Predictor for Critically Sampled 3D Point Cloud
Attribute Compression [24.001318485207207]
我々はデコーダによる3次元点雲圧縮について検討した。
本稿では,$f_l*$をレベル$l+1$,$f_l*$$l$,$G_l*$のエンコーディングを$p=1$で予測する。
論文 参考訳(メタデータ) (2023-11-22T17:26:54Z) - Learning Neural Volumetric Field for Point Cloud Geometry Compression [13.691147541041804]
我々は、ニューラルネットワークを学習することで、与えられた点雲の幾何学をコーディングすることを提案する。
空間全体を小さな立方体に分割し,各空でない立方体をニューラルネットワークと入力潜時符号で表現する。
ネットワークは、空間的および時間的冗長性を利用するために、1つのフレームまたは複数のフレームで全ての立方体間で共有される。
論文 参考訳(メタデータ) (2022-12-11T19:55:24Z) - LVAC: Learned Volumetric Attribute Compression for Point Clouds using
Coordinate Based Networks [21.6781972169876]
点雲の属性を離散位置におけるベクトル値体積関数のサンプルとして考える。
空間をブロックにタイリングすることで体積関数をモデル化し、座標ベースまたは暗黙のニューラルネットワークのシフトによって各ブロック上の関数を表現する。
我々は、幾何学ベースの点クラウドG-PCCで使用される領域適応階層変換(RAHT)の係数を用いて、潜在ベクトルを表現する。
論文 参考訳(メタデータ) (2021-11-17T09:11:09Z) - Learning Deformable Tetrahedral Meshes for 3D Reconstruction [78.0514377738632]
学習に基づく3次元再構成に対応する3次元形状表現は、機械学習とコンピュータグラフィックスにおいてオープンな問題である。
ニューラル3D再構成に関するこれまでの研究は、利点だけでなく、ポイントクラウド、ボクセル、サーフェスメッシュ、暗黙の関数表現といった制限も示していた。
Deformable Tetrahedral Meshes (DefTet) を, ボリューム四面体メッシュを再構成問題に用いるパラメータ化として導入する。
論文 参考訳(メタデータ) (2020-11-03T02:57:01Z) - Learning Local Neighboring Structure for Robust 3D Shape Representation [143.15904669246697]
3Dメッシュの表現学習は多くのコンピュータビジョンやグラフィックスアプリケーションにおいて重要である。
局所構造認識型異方性畳み込み操作(LSA-Conv)を提案する。
本モデルでは,3次元形状復元において最先端の手法に比べて顕著な改善が得られた。
論文 参考訳(メタデータ) (2020-04-21T13:40:03Z) - Implicit Functions in Feature Space for 3D Shape Reconstruction and
Completion [53.885984328273686]
Implicit Feature Networks (IF-Nets) は連続的な出力を提供し、複数のトポロジを扱える。
IF-NetsはShapeNetにおける3次元オブジェクト再構成における先行作業よりも明らかに優れており、より正確な3次元人間の再構成が得られる。
論文 参考訳(メタデータ) (2020-03-03T11:14:29Z) - PUGeo-Net: A Geometry-centric Network for 3D Point Cloud Upsampling [103.09504572409449]
PUGeo-Netと呼ばれる新しいディープニューラルネットワークを用いた一様高密度点雲を生成する手法を提案する。
その幾何学中心の性質のおかげで、PUGeo-Netはシャープな特徴を持つCADモデルとリッチな幾何学的詳細を持つスキャンされたモデルの両方でうまく機能する。
論文 参考訳(メタデータ) (2020-02-24T14:13:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。