論文の概要: Point Neighborhood Embeddings
- arxiv url: http://arxiv.org/abs/2310.02083v1
- Date: Tue, 3 Oct 2023 14:26:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-04 13:59:15.937642
- Title: Point Neighborhood Embeddings
- Title(参考訳): 点近傍埋め込み
- Authors: Pedro Hermosilla
- Abstract要約: 点畳み込み操作は3次元空間のパターンを検出するために各点の近傍情報を符号化する異なる埋め込み機構に依存する。
本研究は, 制御された実験装置を用いて, 近傍埋め込みのみを解析した最初の大規模研究である。
このような埋め込みに基づく単純な畳み込みを用いたニューラルネットワークアーキテクチャは、いくつかのタスクで最先端の結果を得ることができることを示す。
- 参考スコア(独自算出の注目度): 6.68576477453729
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Point convolution operations rely on different embedding mechanisms to encode
the neighborhood information of each point in order to detect patterns in 3D
space. However, as convolutions are usually evaluated as a whole, not much work
has been done to investigate which is the ideal mechanism to encode such
neighborhood information. In this paper, we provide the first extensive study
that analyzes such Point Neighborhood Embeddings (PNE) alone in a controlled
experimental setup. From our experiments, we derive a set of recommendations
for PNE that can help to improve future designs of neural network architectures
for point clouds. Our most surprising finding shows that the most commonly used
embedding based on a Multi-layer Perceptron (MLP) with ReLU activation
functions provides the lowest performance among all embeddings, even being
surpassed on some tasks by a simple linear combination of the point
coordinates. Additionally, we show that a neural network architecture using
simple convolutions based on such embeddings is able to achieve
state-of-the-art results on several tasks, outperforming recent and more
complex operations. Lastly, we show that these findings extrapolate to other
more complex convolution operations, where we show how following our
recommendations we are able to improve recent state-of-the-art architectures.
- Abstract(参考訳): 点畳み込み操作は3次元空間のパターンを検出するために各点の近傍情報を符号化する異なる埋め込み機構に依存する。
しかしながら、畳み込みは通常全体として評価されるため、そのような近隣情報をエンコードする理想的なメカニズムがどれであるかを調査する作業はあまり行われていない。
本稿では,PNE(Point Neighborhood Embeddings)のみを制御された実験装置で解析する最初の大規模研究について述べる。
私たちの実験から、ポイントクラウドのためのニューラルネットワークアーキテクチャの将来設計を改善するのに役立つ、PNEのための一連の推奨事項を導き出します。
最も意外な発見は、ReLUアクティベーション関数を持つ多層パーセプトロン(MLP)をベースとした最も一般的な埋め込みは、全ての埋め込みの中で最低性能を示し、点座標の単純な線形結合によって、いくつかのタスクを超越している。
さらに,このような組込みに基づく単純な畳み込みを用いたニューラルネットワークアーキテクチャは,最近の複雑な処理を上回って,いくつかのタスクで最先端の結果を実現できることを示す。
最後に、これらの発見は、他のより複雑な畳み込み操作に比例し、最近の最先端アーキテクチャをいかに改善できるかを示す。
関連論文リスト
- MultiPull: Detailing Signed Distance Functions by Pulling Multi-Level Queries at Multi-Step [48.812388649469106]
粗いSDFを粗い値から細かい値に最適化することにより,原点雲から多スケール暗黙フィールドを学習する手法を提案する。
広く使われているオブジェクトとシーンのベンチマーク実験により,この手法は表面再構成における最先端の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-11-02T10:50:22Z) - Human as Points: Explicit Point-based 3D Human Reconstruction from
Single-view RGB Images [78.56114271538061]
我々はHaPと呼ばれる明示的なポイントベース人間再構築フレームワークを導入する。
提案手法は,3次元幾何学空間における完全明示的な点雲推定,操作,生成,洗練が特徴である。
我々の結果は、完全に明示的で幾何学中心のアルゴリズム設計へのパラダイムのロールバックを示すかもしれない。
論文 参考訳(メタデータ) (2023-11-06T05:52:29Z) - Self-Supervised Monocular Depth Estimation by Direction-aware Cumulative
Convolution Network [80.19054069988559]
自己教師付き単眼深度推定は, 方向感度と環境依存性を示す。
本稿では2つの側面において深度表現を改善する方向対応累積畳み込みネットワーク(DaCCN)を提案する。
実験の結果,提案手法は広く使用されている3つのベンチマークにおいて大幅な改善が得られた。
論文 参考訳(メタデータ) (2023-08-10T14:32:18Z) - Small but Mighty: Enhancing 3D Point Clouds Semantic Segmentation with
U-Next Framework [7.9395601503353825]
我々は,ポイントクラウドセマンティックセマンティックセグメンテーション用に設計された,小さいが強力なフレームワークであるU-Nextを提案する。
U-Nextは複数のU-Net$L1$コーデックをネストして密に配置し、セマンティックギャップを最小限に抑えることで構築します。
S3DIS、Tronto3D、SensatUrbanの3つの大規模ベンチマークで実施された大規模な実験は、提案したU-Nextアーキテクチャの優位性と有効性を示している。
論文 参考訳(メタデータ) (2023-04-03T06:59:08Z) - Flattened Graph Convolutional Networks For Recommendation [18.198536511983452]
本稿では,既存のモデルに比べて非常に少ない複雑さで優れた性能を達成できるフラット化GCN(FlatGCN)モデルを提案する。
まず,1つの平坦なGCN層を用いて周辺情報を集約する簡易かつ強力なGCNアーキテクチャを提案する。
次に,隣り合うノード間の相関を計測し,最も価値のある隣人を選択するための情報的隣人-infomaxサンプリング手法を提案する。
第3に,最終層に階層的近傍表現を組み立てることで,学習した表現の表現性を向上する層アンサンブル手法を提案する。
論文 参考訳(メタデータ) (2022-09-25T12:53:50Z) - Spelunking the Deep: Guaranteed Queries for General Neural Implicit
Surfaces [35.438964954948574]
この研究は、広範囲の既存アーキテクチャに対して、一般的なニューラル暗黙関数でクエリを直接実行するための新しいアプローチを示す。
私たちのキーとなるツールは、ニューラルネットワークへのレンジ分析の適用であり、ネットワークの出力を領域を越えてバウンドするために自動演算ルールを使用します。
得られた境界を用いて、レイキャスト、交差試験、空間階層の構築、高速メッシュ抽出、最近点評価などのクエリを開発する。
論文 参考訳(メタデータ) (2022-02-05T00:37:08Z) - Random Features for the Neural Tangent Kernel [57.132634274795066]
完全接続型ReLUネットワークのニューラルタンジェントカーネル(NTK)の効率的な特徴マップ構築を提案する。
得られた特徴の次元は、理論と実践の両方で比較誤差境界を達成するために、他のベースライン特徴マップ構造よりもはるかに小さいことを示しています。
論文 参考訳(メタデータ) (2021-04-03T09:08:12Z) - Densely Nested Top-Down Flows for Salient Object Detection [137.74130900326833]
本稿では,物体検出におけるトップダウンモデリングの役割を再考する。
密度の高いトップダウンフロー(DNTDF)ベースのフレームワークを設計する。
DNTDFのすべての段階において、高いレベルの特徴はプログレッシブ圧縮ショートカットパス(PCSP)を介して読み込まれる。
論文 参考訳(メタデータ) (2021-02-18T03:14:02Z) - PC-RGNN: Point Cloud Completion and Graph Neural Network for 3D Object
Detection [57.49788100647103]
LiDARベースの3Dオブジェクト検出は、自動運転にとって重要なタスクです。
現在のアプローチでは、遠方および閉ざされた物体の偏りと部分的な点雲に苦しむ。
本稿では,この課題を2つの解決法で解決する新しい二段階アプローチ,pc-rgnnを提案する。
論文 参考訳(メタデータ) (2020-12-18T18:06:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。