論文の概要: RPSRNet: End-to-End Trainable Rigid Point Set Registration Network using
Barnes-Hut $2^D$-Tree Representation
- arxiv url: http://arxiv.org/abs/2104.05328v1
- Date: Mon, 12 Apr 2021 10:16:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-13 14:06:53.629260
- Title: RPSRNet: End-to-End Trainable Rigid Point Set Registration Network using
Barnes-Hut $2^D$-Tree Representation
- Title(参考訳): RPSRNet: Barnes-Hut $2^D$-Tree Representation を用いたエンドツーエンドトレーニング可能な Rigid Point Set 登録ネットワーク
- Authors: Sk Aziz Ali, Kerem Kahraman, Gerd Reis, Didier Stricker
- Abstract要約: リジッドポイントセット登録のための新しいエンドツーエンドトレーニング可能なディープニューラルネットワークであるRPSRNetを提案します。
入力ポイントセットに新たな$d$-tree表現と、ニューラルネットワークに埋め込まれた階層的なディープ機能を使用します。
1対の入力点雲を250kまで登録するために12~15msの推論速度を達成する。
- 参考スコア(独自算出の注目度): 13.351162559710124
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose RPSRNet - a novel end-to-end trainable deep neural network for
rigid point set registration. For this task, we use a novel $2^D$-tree
representation for the input point sets and a hierarchical deep feature
embedding in the neural network. An iterative transformation refinement module
in our network boosts the feature matching accuracy in the intermediate stages.
We achieve an inference speed of 12-15ms to register a pair of input point
clouds as large as 250K. Extensive evaluation on (i) KITTI LiDAR odometry and
(ii) ModelNet-40 datasets shows that our method outperforms prior
state-of-the-art methods - e.g., on the KITTI data set, DCP-v2 by1.3 and 1.5
times, and PointNetLK by 1.8 and 1.9 times better rotational and translational
accuracy respectively. Evaluation on ModelNet40 shows that RPSRNet is more
robust than other benchmark methods when the samples contain a significant
amount of noise and other disturbances. RPSRNet accurately registers point
clouds with non-uniform sampling densities, e.g., LiDAR data, which cannot be
processed by many existing deep-learning-based registration methods.
- Abstract(参考訳): 本稿では、厳格な点集合登録のための新しいエンドツーエンドトレーニング可能なディープニューラルネットワークRPSRNetを提案する。
本研究では,入力点集合に対して新しい2^D$-tree表現を用い,ニューラルネットワークに階層的な深い特徴を埋め込む。
ネットワーク内の反復変換リファインメントモジュールにより,中間段階における特徴マッチング精度が向上する。
1対の入力点雲を250kまで登録するために12~15msの推論速度を達成する。
i) KITTI LiDAR odometry および (ii) ModelNet-40 データセットの広範囲な評価により,本手法は, KITTI データセット, DCP-v2 by1.3 および 1.5 倍, PointNetLK が 1.8 倍,変換精度が 1.9 倍向上した。
ModelNet40の評価によると、RPSRNetは、サンプルが大量のノイズやその他の乱れを含む場合、他のベンチマーク手法よりも堅牢である。
RPSRNetは、例えば、多くの既存のディープラーニングベースの登録方法では処理できないLiDARデータのような、一様でないサンプリング密度の点雲を正確に登録する。
関連論文リスト
- Neural Implicit Dictionary via Mixture-of-Expert Training [111.08941206369508]
ニューラルインシシット辞書(NID)を学習することで、データとトレーニング効率の両方を達成する汎用INRフレームワークを提案する。
我々のNIDは、所望の関数空間にまたがるように調整された座標ベースのImpworksのグループを組み立てる。
実験の結果,NIDは最大98%の入力データで2次元画像や3次元シーンの再現を2桁高速化できることがわかった。
論文 参考訳(メタデータ) (2022-07-08T05:07:19Z) - Unsupervised Representation Learning via Neural Activation Coding [66.65837512531729]
我々は、下流アプリケーションのためのラベルなしデータから深部表現を学習するための新しいアプローチとして、ニューラルアクティベーションコーディング(NAC)を提案する。
我々はNACが連続したデータ表現と離散的なデータ表現の両方を学習し、それぞれ下流の2つのタスクで評価することを示した。
論文 参考訳(メタデータ) (2021-12-07T21:59:45Z) - Network-wide Multi-step Traffic Volume Prediction using Graph
Convolutional Gated Recurrent Neural Network [16.56822335262946]
本稿では,新しいディープラーニングモデルであるGCGRNN(Graph Convolutional Gated Recurrent Neural Network)を提案する。
我々は,カリフォルニア州ロサンゼルスの150個のセンサーから抽出した2つのトラフィックデータセットを,それぞれ1時間15分で評価した。
論文 参考訳(メタデータ) (2021-11-22T16:41:13Z) - Logsig-RNN: a novel network for robust and efficient skeleton-based
action recognition [3.775860173040509]
我々は、ログネイティブ層とリカレント型ニューラルネットワーク(RNN)を組み合わせた新しいモジュール、Logsig-RNNを提案する。
特に,簡単な経路変換層とLogsig-RNNを組み合わせることで,Chalearn2013ジェスチャデータの最先端精度を実現する。
論文 参考訳(メタデータ) (2021-10-25T14:47:15Z) - Learning Semantic Segmentation of Large-Scale Point Clouds with Random
Sampling [52.464516118826765]
我々はRandLA-Netを紹介した。RandLA-Netは、大規模ポイントクラウドのポイントごとの意味を推論する、効率的で軽量なニューラルネットワークアーキテクチャである。
我々のアプローチの鍵は、より複雑な点選択アプローチではなく、ランダムな点サンプリングを使用することである。
我々のRandLA-Netは、既存のアプローチよりも最大200倍高速な1回のパスで100万ポイントを処理できます。
論文 参考訳(メタデータ) (2021-07-06T05:08:34Z) - ANNETTE: Accurate Neural Network Execution Time Estimation with Stacked
Models [56.21470608621633]
本稿では,アーキテクチャ検索を対象ハードウェアから切り離すための時間推定フレームワークを提案する。
提案手法は,マイクロカーネルと多層ベンチマークからモデルの集合を抽出し,マッピングとネットワーク実行時間推定のためのスタックモデルを生成する。
生成した混合モデルの推定精度と忠実度, 統計モデルとルーフラインモデル, 評価のための洗練されたルーフラインモデルを比較した。
論文 参考訳(メタデータ) (2021-05-07T11:39:05Z) - Manifold Regularized Dynamic Network Pruning [102.24146031250034]
本稿では,全インスタンスの多様体情報をプルーンドネットワークの空間に埋め込むことにより,冗長フィルタを動的に除去する新しいパラダイムを提案する。
提案手法の有効性をいくつかのベンチマークで検証し,精度と計算コストの両面で優れた性能を示す。
論文 参考訳(メタデータ) (2021-03-10T03:59:03Z) - Fully Dynamic Inference with Deep Neural Networks [19.833242253397206]
Layer-Net(L-Net)とChannel-Net(C-Net)と呼ばれる2つのコンパクトネットワークは、どのレイヤやフィルタ/チャネルが冗長であるかをインスタンス毎に予測する。
CIFAR-10データセットでは、LC-Netは11.9$times$ less floating-point Operations (FLOPs) となり、他の動的推論手法と比較して最大3.3%精度が向上する。
ImageNetデータセットでは、LC-Netは最大1.4$times$ FLOPsを減らし、Top-1の精度は他の方法よりも4.6%高い。
論文 参考訳(メタデータ) (2020-07-29T23:17:48Z) - RPM-Net: Robust Point Matching using Learned Features [79.52112840465558]
RPM-Netは、より敏感で、より堅牢なディープラーニングベースのアプローチである。
既存の方法とは異なり、我々のRPM-Netは、部分的な可視性を備えた対応や点雲の欠如を処理します。
論文 参考訳(メタデータ) (2020-03-30T13:45:27Z) - Compressing deep neural networks on FPGAs to binary and ternary
precision with HLS4ML [13.325670094073383]
本稿では, hls4mlライブラリにおける2次ニューラルネットワークと3次ニューラルネットワークの実装について述べる。
モデル精度と資源消費のトレードオフについて論じる。
二分法と三分法の実装は、FPGAリソースを劇的に減らしながら高い精度の実装と類似した性能を持つ。
論文 参考訳(メタデータ) (2020-03-11T10:46:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。