論文の概要: R3PM-Net: Real-time, Robust, Real-world Point Matching Network
- arxiv url: http://arxiv.org/abs/2604.05060v2
- Date: Fri, 10 Apr 2026 09:33:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 13:51:27.64656
- Title: R3PM-Net: Real-time, Robust, Real-world Point Matching Network
- Title(参考訳): R3PM-Net: リアルタイム、ロバスト、リアルタイムのポイントマッチングネットワーク
- Authors: Yasaman Kashefbahrami, Erkut Akdag, Panagiotis Meletis, Evgeniya Balmashnova, Dip Goswami, Egor Bondarau,
- Abstract要約: 本稿では,軽量でグローバルなオブジェクトレベルの点マッチングネットワークであるR3PM-Netを紹介する。
実験により、R3PM-Netは未一致の速度で競合精度を達成することが示された。
これらの結果は、R3PM-Netが重要な産業アプリケーションに対して堅牢で高速なソリューションを提供することを確認した。
- 参考スコア(独自算出の注目度): 2.5553138705231535
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate Point Cloud Registration (PCR) is an important task in 3D data processing, involving the estimation of a rigid transformation between two point clouds. While deep-learning methods have addressed key limitations of traditional non-learning approaches, such as sensitivity to noise, outliers, occlusion, and initialization, they are developed and evaluated on clean, dense, synthetic datasets (limiting their generalizability to real-world industrial scenarios). This paper introduces R3PM-Net, a lightweight, global-aware, object-level point matching network designed to bridge this gap by prioritizing both generalizability and real-time efficiency. To support this transition, two datasets, Sioux-Cranfield and Sioux-Scans, are proposed. They provide an evaluation ground for registering imperfect photogrammetric and event-camera scans to digital CAD models, and have been made publicly available. Extensive experiments demonstrate that R3PM-Net achieves competitive accuracy with unmatched speed. On ModelNet40, it reaches a perfect fitness score of $1$ and inlier RMSE of $0.029$ cm in only $0.007$s, approximately 7 times faster than the state-of-the-art method RegTR. This performance carries over to the Sioux-Cranfield dataset, maintaining a fitness of $1$ and inlier RMSE of $0.030$ cm with similarly low latency. Furthermore, on the highly challenging Sioux-Scans dataset, R3PM-Net successfully resolves edge cases in under 50 ms. These results confirm that R3PM-Net offers a robust, high-speed solution for critical industrial applications, where precision and real-time performance are indispensable. The code and datasets are available at https://github.com/YasiiKB/R3PM-Net.
- Abstract(参考訳): 正確なポイントクラウド登録(PCR)は、2つのポイントクラウド間の厳密な変換を推定する3Dデータ処理において重要なタスクである。
ディープラーニング手法は、ノイズ、外れ値、閉塞、初期化といった従来の非学習アプローチの重要な制限に対処する一方で、クリーンで密度の高い合成データセット(現実の産業シナリオへの一般化性を制限する)で開発され、評価されている。
本稿では,R3PM-Netについて紹介する。R3PM-Netは,汎用性とリアルタイムの効率性の両方を優先することで,このギャップを埋めるように設計された軽量でグローバルなポイントマッチングネットワークである。
この移行をサポートするために、Sioux-CranfieldとSioux-Scansという2つのデータセットが提案されている。
デジタルCADモデルに不完全なフォトグラムとイベントカメラスキャンを登録するための評価基盤を提供し、公開されている。
大規模な実験により、R3PM-Netは未整合の速度で競合精度を達成することが示された。
ModelNet40では、完全なフィットネススコアが1ドル、未熟なRMSEが0.007ドルのわずか0.029ドルで、最先端のRegTRの約7倍の速さで到達している。
このパフォーマンスはSioux-Cranfieldデータセットに受け継がれ、フィットネスは1ドル、より低いRMSEは0.030$ cmで、同様にレイテンシも低い。
さらに、非常に挑戦的なSioux-Scansデータセットでは、R3PM-Netが50ms以下のエッジケースの解決に成功している。これらの結果は、R3PM-Netが、正確性とリアルタイムのパフォーマンスが不可欠である重要な産業アプリケーションに対して、堅牢で高速なソリューションを提供することを確認した。
コードとデータセットはhttps://github.com/YasiiKB/R3PM-Netで公開されている。
関連論文リスト
- Enhancing 3D Point Cloud Classification with ModelNet-R and Point-SkipNet [1.0923877073891444]
3Dポイントクラウドの分類は、自律運転、ロボティクス、拡張現実などのアプリケーションに不可欠である。
一般的に使用されるModelNet40データセットは、一貫性のないラベル付け、2Dデータ、サイズミスマッチ、不適切なクラス分化といった制限に悩まされている。
本稿では,これらの問題に対処し,信頼性の高いベンチマークとして機能するModelNet40の細かな改良版であるModelNet-Rを紹介する。
論文 参考訳(メタデータ) (2025-09-05T15:57:36Z) - AutoSynth: Learning to Generate 3D Training Data for Object Point Cloud
Registration [69.21282992341007]
Auto Synthは、ポイントクラウド登録のための3Dトレーニングデータを自動的に生成する。
私たちはポイントクラウド登録ネットワークをもっと小さなサロゲートネットワークに置き換え、4056.43$のスピードアップを実現しました。
TUD-L,LINEMOD,Occluded-LINEMODに関する我々の研究結果は,検索データセットでトレーニングされたニューラルネットワークが,広く使用されているModelNet40データセットでトレーニングされたニューラルネットワークよりも一貫してパフォーマンスが向上していることを示す。
論文 参考訳(メタデータ) (2023-09-20T09:29:44Z) - Deep Learning for Day Forecasts from Sparse Observations [60.041805328514876]
深層ニューラルネットワークは、気象条件をモデル化するための代替パラダイムを提供する。
MetNet-3は、密度とスパースの両方のデータセンサーから学習し、降水、風、温度、露点を最大24時間前に予測する。
MetNet-3は、それぞれ時間分解能と空間分解能が高く、最大2分と1km、運用遅延は低い。
論文 参考訳(メタデータ) (2023-06-06T07:07:54Z) - Rethinking Voxelization and Classification for 3D Object Detection [68.8204255655161]
LiDARポイントクラウドからの3Dオブジェクト検出の主な課題は、ネットワークの信頼性に影響を与えることなく、リアルタイムのパフォーマンスを実現することである。
本稿では,高速な動的ボキセラライザを実装することにより,ネットワークの推論速度と精度を同時に向上するソリューションを提案する。
さらに,予測対象を分類し,偽検出対象をフィルタリングする軽量検出サブヘッドモデルを提案する。
論文 参考訳(メタデータ) (2023-01-10T16:22:04Z) - SVNet: Where SO(3) Equivariance Meets Binarization on Point Cloud
Representation [65.4396959244269]
本論文は,3次元学習アーキテクチャを構築するための一般的なフレームワークを設計することによる課題に対処する。
提案手法はPointNetやDGCNNといった一般的なバックボーンに適用できる。
ModelNet40、ShapeNet、および実世界のデータセットであるScanObjectNNの実験では、この手法が効率、回転、精度の間の大きなトレードオフを達成することを示した。
論文 参考訳(メタデータ) (2022-09-13T12:12:19Z) - ANNETTE: Accurate Neural Network Execution Time Estimation with Stacked
Models [56.21470608621633]
本稿では,アーキテクチャ検索を対象ハードウェアから切り離すための時間推定フレームワークを提案する。
提案手法は,マイクロカーネルと多層ベンチマークからモデルの集合を抽出し,マッピングとネットワーク実行時間推定のためのスタックモデルを生成する。
生成した混合モデルの推定精度と忠実度, 統計モデルとルーフラインモデル, 評価のための洗練されたルーフラインモデルを比較した。
論文 参考訳(メタデータ) (2021-05-07T11:39:05Z) - RPSRNet: End-to-End Trainable Rigid Point Set Registration Network using
Barnes-Hut $2^D$-Tree Representation [13.351162559710124]
リジッドポイントセット登録のための新しいエンドツーエンドトレーニング可能なディープニューラルネットワークであるRPSRNetを提案します。
入力ポイントセットに新たな$d$-tree表現と、ニューラルネットワークに埋め込まれた階層的なディープ機能を使用します。
1対の入力点雲を250kまで登録するために12~15msの推論速度を達成する。
論文 参考訳(メタデータ) (2021-04-12T10:16:09Z) - Voxel R-CNN: Towards High Performance Voxel-based 3D Object Detection [99.16162624992424]
Voxel R-CNNというシンプルで効果的なVoxelベースのフレームワークを考案しました。
2段階のアプローチでボクセルの特徴をフル活用することにより,最先端の点ベースモデルと同等の精度で検出できる。
その結果、Voxel R-CNNは、NVIDIA 2080 Ti GPU上での25 FPSの速度で、リアルタイムフレーム処理速度を維持しながら、より高い検出精度を提供する。
論文 参考訳(メタデータ) (2020-12-31T17:02:46Z) - Fully Dynamic Inference with Deep Neural Networks [19.833242253397206]
Layer-Net(L-Net)とChannel-Net(C-Net)と呼ばれる2つのコンパクトネットワークは、どのレイヤやフィルタ/チャネルが冗長であるかをインスタンス毎に予測する。
CIFAR-10データセットでは、LC-Netは11.9$times$ less floating-point Operations (FLOPs) となり、他の動的推論手法と比較して最大3.3%精度が向上する。
ImageNetデータセットでは、LC-Netは最大1.4$times$ FLOPsを減らし、Top-1の精度は他の方法よりも4.6%高い。
論文 参考訳(メタデータ) (2020-07-29T23:17:48Z) - AANet: Adaptive Aggregation Network for Efficient Stereo Matching [33.39794232337985]
現在の最先端ステレオモデルは、ほとんどが高価な3D畳み込みに基づいている。
エッジフェットング問題を緩和するために,スパースポイントに基づくスケール内コストアグリゲーション手法を提案する。
また、従来のクロススケールなコスト集約アルゴリズムをニューラルネットワーク層に近似して、大きなテクスチャレス領域を処理する。
論文 参考訳(メタデータ) (2020-04-20T18:07:55Z) - StickyPillars: Robust and Efficient Feature Matching on Point Clouds
using Graph Neural Networks [16.940377259203284]
StickyPillarsは、ポイントクラウド上の高速で正確で、非常に堅牢な3D機能マッチング方法である。
KITTIデータセット上で実証された登録問題に対して,最先端技術による精度評価結果を示す。
我々はマッチングシステムをLiDARオドメトリーパイプラインに統合し、KITTIデータセット上で最も正確な結果を得る。
論文 参考訳(メタデータ) (2020-02-10T17:53:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。