Fugu-MT 論文翻訳(概要): IGASA: Integrated Geometry-Aware and Skip-Attention Modules for Enhanced Point Cloud Registration

論文の概要: IGASA: Integrated Geometry-Aware and Skip-Attention Modules for Enhanced Point Cloud Registration

arxiv url: http://arxiv.org/abs/2603.12719v1
Date: Fri, 13 Mar 2026 07:04:51 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-16 17:38:11.957444
Title: IGASA: Integrated Geometry-Aware and Skip-Attention Modules for Enhanced Point Cloud Registration
Title（参考訳）: IGASA: ポイントクラウド登録のための統合幾何認識とスキップアテンションモジュール
Authors: Dongxu Zhang, Jihua Zhu, Shiqi Li, Wenbiao Yan, Haoran Xu, Peilin Fan, Huimin Lu,
Abstract要約: 階層ピラミッドアーキテクチャ(HPA)に基づく新規登録フレームワークとしてIGASAを提案する。このフレームワークは階層的クロスレイア・アテンション(HCLA)モジュールとイテレーティブ・ジオメトリ・アウェア・リファインメント(IGAR)モジュールからなる2つの重要なコンポーネントを統合している。我々は,3D(Lo)Match,KITTI,nuScenesなど,広く認識されている4つのベンチマークデータセット上でIGASAの性能を評価する。
参考スコア（独自算出の注目度）: 29.175402958104783
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Point cloud registration (PCR) is a fundamental task in 3D vision and provides essential support for applications such as autonomous driving, robotics, and environmental modeling. Despite its widespread use, existing methods often fail when facing real-world challenges like heavy noise, significant occlusions, and large-scale transformations. These limitations frequently result in compromised registration accuracy and insufficient robustness in complex environments. In this paper, we propose IGASA as a novel registration framework constructed upon a Hierarchical Pyramid Architecture (HPA) designed for robust multi-scale feature extraction and fusion. The framework integrates two pivotal components consisting of the Hierarchical Cross-Layer Attention (HCLA) module and the Iterative Geometry-Aware Refinement (IGAR) module. The HCLA module utilizes skip attention mechanisms to align multi-resolution features and enhance local geometric consistency. Simultaneously, the IGAR module is designed for the fine matching phase by leveraging reliable correspondences established during coarse matching. This synergistic integration within the architecture allows IGASA to adapt effectively to diverse point cloud structures and intricate transformations. We evaluate the performance of IGASA on four widely recognized benchmark datasets including 3D(Lo)Match, KITTI, and nuScenes. Our extensive experiments consistently demonstrate that IGASA significantly surpasses state-of-the-art methods and achieves notable improvements in registration accuracy. This work provides a robust foundation for advancing point cloud registration techniques while offering valuable insights for practical 3D vision applications. The code for IGASA is available in \href{https://github.com/DongXu-Zhang/IGASA}{https://github.com/DongXu-Zhang/IGASA}.
Abstract（参考訳）: ポイントクラウド登録(PCR)は3Dビジョンの基本課題であり、自律運転、ロボット工学、環境モデリングなどのアプリケーションに不可欠なサポートを提供する。広く使われているにもかかわらず、既存の手法は、重騒音、重大な閉塞、大規模な変換といった現実世界の課題に直面したときに失敗することが多い。これらの制限はしばしば、複雑な環境における登録精度の妥協と不十分な堅牢性をもたらす。本稿では,階層ピラミッドアーキテクチャ (HPA) 上に構築された,マルチスケールの特徴抽出と融合のための新しい登録フレームワークとしてIGASAを提案する。このフレームワークは階層的クロスレイア・アテンション(HCLA)モジュールとイテレーティブ・ジオメトリ・アウェア・リファインメント(IGAR)モジュールからなる2つの重要なコンポーネントを統合している。 HCLAモジュールはスキップアテンション機構を利用して多重解像度の特徴を整列し、局所的な幾何学的整合性を高める。同時に、IGARモジュールは、粗いマッチング時に確立された信頼性の高い対応を利用して、きめ細かいマッチングフェーズのために設計されている。このアーキテクチャ内でのシナジスティックな統合により、IGASAは多様なポイントクラウド構造や複雑な変換に効果的に適応できる。我々は,3D(Lo)Match,KITTI,nuScenesなど,広く認識されている4つのベンチマークデータセット上でIGASAの性能を評価する。我々の広範な実験は、IGASAが最先端の手法をはるかに上回り、登録精度の顕著な改善を実現していることを一貫して示している。この作業は、ポイントクラウド登録技術を前進させ、実用的な3Dビジョンアプリケーションに価値ある洞察を提供するための堅牢な基盤を提供する。 IGASAのコードは \href{https://github.com/DongXu-Zhang/IGASA}{https://github.com/DongXu-Zhang/IGASA} で公開されている。

関連論文リスト

CMHANet: A Cross-Modal Hybrid Attention Network for Point Cloud Registration [26.457061044468915]
本稿では,クロスモーダルハイブリッドアテンションネットワークであるCMHANetを提案する。本手法は2次元画像からのリッチな文脈情報の融合と3次元点雲の幾何学的詳細を融合する。提案手法は,登録精度と総合ロバスト性の両方を大幅に向上し,現在の技術より優れていることを示す。
論文参考訳（メタデータ） (2026-03-13T07:09:22Z)
RDNet: Region Proportion-Aware Dynamic Adaptive Salient Object Detection Network in Optical Remote Sensing Images [78.19052099452695]
地域分布を考慮した動的適応型オブジェクト検出ネットワーク(RDNet)を提案する。 RDNetはグローバルコンテキストモデリングのためにCNNのバックボーンをSwinTransformerに置き換える。スケールの変動や正確なローカライゼーションに対して堅牢性を実現し、最先端の手法と比較して優れた検出性能を提供する。
論文参考訳（メタデータ） (2026-03-12T17:34:29Z)
Architecture-Aware Multi-Design Generation for Repository-Level Feature Addition [53.50448142467294]
RAIMは、リポジトリレベルの機能追加のための、多設計およびアーキテクチャ対応のフレームワークである。複数の多様な実装設計を生成することで、線形パッチから切り離される。 NoCode-bench Verifiedデータセットの実験では、RAIMが新しい最先端のパフォーマンスを確立することが示されている。
論文参考訳（メタデータ） (2026-03-02T12:50:40Z)
Lemon: A Unified and Scalable 3D Multimodal Model for Universal Spatial Understanding [80.66591664266744]
Lemonは3Dポイントクラウドパッチと言語トークンを単一のシーケンスとして処理する統合トランスフォーマーアーキテクチャである。 3次元データの複雑さに対処するため,空間的コンテキストを保存するための構造化パッチやトークン化方式を開発した。 Lemonは、総合的な3D理解と推論タスクにまたがって、最先端のパフォーマンスを確立する。
論文参考訳（メタデータ） (2025-12-14T20:02:43Z)
RangeSAM: Leveraging Visual Foundation Models for Range-View repesented LiDAR segmentation [6.513648249086729]
本稿では,SAM2を3次元セグメンテーションに適応させる最初のレンジビューフレームワークを提案する。提案手法は,2D中心パイプラインの速度,スケーラビリティ,デプロイメントの単純さを生かしながら,セマンティックKITTI上での競合性能を実現する。
論文参考訳（メタデータ） (2025-09-19T11:33:10Z)
H3R: Hybrid Multi-view Correspondence for Generalizable 3D Reconstruction [39.22287224290769]
H3Rは、潜在融合と注目に基づく機能集約を統合するハイブリッドフレームワークである。両パラダイムを統合することで,既存手法よりも2$times$高速に収束しながら,一般化が促進される。本手法は,ロバストなクロスデータセットの一般化を実証しながら,可変数および高分解能な入力ビューをサポートする。
論文参考訳（メタデータ） (2025-08-05T05:56:30Z)
Topology-Aware Modeling for Unsupervised Simulation-to-Reality Point Cloud Recognition [63.55828203989405]
我々はオブジェクトポイントクラウド上でSim2Real UDAのための新しいTopology-Aware Modeling (TAM)フレームワークを紹介する。提案手法は,低レベルの高周波3次元構造を特徴とするグローバル空間トポロジを利用して,領域間隙を緩和する。本稿では,クロスドメイン・コントラスト学習と自己学習を組み合わせた高度な自己学習戦略を提案する。
論文参考訳（メタデータ） (2025-06-26T11:53:59Z)
GERA: Geometric Embedding for Efficient Point Registration Analysis [20.690695788384517]
本稿では, 純幾何学的アーキテクチャを活用し, 幾何学的情報をオフラインで構築する新たなポイントクラウド登録ネットワークを提案する。本手法は, 3次元座標入力をオフライン構成の幾何符号化に置き換え, 一般化と安定性を改善した最初の方法である。
論文参考訳（メタデータ） (2024-10-01T11:19:56Z)
Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。 PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文参考訳（メタデータ） (2024-07-26T06:29:09Z)
FusionRCNN: LiDAR-Camera Fusion for Two-stage 3D Object Detection [11.962073589763676]
既存の3D検出器は、2段階のパラダイムを採用することで精度を大幅に向上させる。特に遠く離れた地点では、点雲の広がりは、LiDARのみの精製モジュールがオブジェクトを正確に認識し、配置することを困難にしている。 We propose a novel multi-modality two-stage approach called FusionRCNN, which is effective and efficient fuses point clouds and camera image in the Regions of Interest(RoI)。 FusionRCNNは、強力なSECONDベースラインを6.14%のmAPで大幅に改善し、競合する2段階アプローチよりも優れている。
論文参考訳（メタデータ） (2022-09-22T02:07:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。