論文の概要: FS-I2P:A Hierarchical Focus-Sweep Registration Network with Dynamically Allocated Depth
- arxiv url: http://arxiv.org/abs/2605.07607v1
- Date: Fri, 08 May 2026 11:33:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:39.01756
- Title: FS-I2P:A Hierarchical Focus-Sweep Registration Network with Dynamically Allocated Depth
- Title(参考訳): FS-I2P:動的アロケート深さを有する階層型フォーカススウィープ登録ネットワーク
- Authors: Zhixin Cheng, Yujia Chen, Xujing Tao, Bohao Liao, Xiaotian Yin, Baoqun Yin, Tianzhu Zhang,
- Abstract要約: イメージ・ツー・ポイント・クラウドの登録は、視点の変化、横断的な相違、反復的なテクスチャによってしばしば挑戦される。
近年, マルチスケール特徴とトランスフォーマーに基づくインタラクションを利用して, 検出不要な手法によりこの問題を緩和している。
人間の行動に触発され,多段階のクロスモーダル特徴関連性を高めるためのFocus-Sweep'のパラダイムを提案する。
- 参考スコア(独自算出の注目度): 23.96591843663943
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image-to-point cloud registration is often challenged by viewpoint changes, cross-modal discrepancies, and repetitive textures, which induce scale ambiguity and consequently lead to erroneous correspondences. Recent detection-free methods alleviate this issue by leveraging multi-scale features and transformer-based interactions. However, they still suffer from attention drift across layers and intra-scale inconsistencies, hindering precise registration. Inspired by human behavior, we propose a ``Focus--Sweep'' paradigm and develop a Hierarchical Focus--Sweep Interaction Module within an SSM-based framework to enhance multi-level cross-modal feature association. In addition, we introduce a Dynamic Layer Allocation Strategy that adaptively determines the iteration depth to better exploit geometric constraints and improve matching robustness. Extensive experiments and ablations on two benchmarks, RGB-D Scenes V2 and 7-Scenes, demonstrate that our approach achieves state-of-the-art performance.
- Abstract(参考訳): イメージ・ツー・ポイント・クラウドの登録は、視線の変化、横断的な不一致、反復的なテクスチャによってしばしば挑戦される。
近年, マルチスケール特徴とトランスフォーマーに基づくインタラクションを利用して, 検出不要な手法によりこの問題を緩和している。
しかし、彼らはいまだに層をまたいだ注意の漂流と大規模な不整合に悩まされており、正確な登録を妨げている。
人間の行動に触発されて,マルチレベル・クロスモーダルな特徴関連性を高めるため,我々は「Focus-Sweep」パラダイムを提案し,階層型フォーカス-スウィープインタラクション・モジュールをSSMベースのフレームワーク内で開発する。
さらに、幾何的制約をよりうまく活用し、整合性を改善するために、反復深さを適応的に決定する動的レイヤ割当戦略を導入します。
RGB-D Scenes V2 と 7-Scenes という2つのベンチマークの大規模な実験と改善は,我々のアプローチが最先端のパフォーマンスを実現することを実証している。
関連論文リスト
- UniV2D: Bridging Visual Restoration and Semantic Perception for Underwater Salient Object Detection [71.83097731030254]
視覚的回復と有能な物体検出を協調的に最適化するUnified Vision-to-Detection Network (UniV2D)を提案する。
UniV2Dは、セマンティック駆動学習パラダイムを導入している。
定量評価と定性評価の両方において最先端の手法を著しく上回る。
論文 参考訳(メタデータ) (2026-05-08T02:31:45Z) - Graph-Based Uncertainty Modeling and Multimodal Fusion for Salient Object Detection [12.743278093269325]
動的不確実性伝播とマルチモーダル協調推論ネットワーク(DUP-MCRNet)を提案する。
DUGCは空間意味距離に基づいて構築されたスパースグラフを通じて層間の不確実性を伝播するように設計されている。
MCFは学習可能なモダリティゲーティングウェイトを使用して、RGB、深さ、エッジの特徴の注意マップを重み付けする。
論文 参考訳(メタデータ) (2025-08-28T04:31:48Z) - YOLO-FDA: Integrating Hierarchical Attention and Detail Enhancement for Surface Defect Detection [0.32634122554914]
YOLO-FDAは、細かなディテールの強化と注意誘導機能融合を統合した、YOLOベースの新しい検出フレームワークである。
YOLO-FDAは、さまざまな種類の欠陥やスケールにおいて、精度と堅牢性の両方の観点から、既存の最先端の手法を一貫して上回ります。
論文 参考訳(メタデータ) (2025-06-26T10:32:37Z) - Divide-and-Conquer: Confluent Triple-Flow Network for RGB-T Salient Object Detection [70.84835546732738]
RGB-Thermal Salient Object Detectionは、目視と熱赤外画像のペア内の目立つ物体をピンポイントすることを目的としている。
従来のエンコーダ・デコーダアーキテクチャは、欠陥モードから生じるノイズに対する頑健さを十分に考慮していなかったかもしれない。
本稿では,Divide-and-Conquer戦略を用いた,堅牢なConfluent Triple-Flow NetworkであるConTriNetを提案する。
論文 参考訳(メタデータ) (2024-12-02T14:44:39Z) - HiH: A Multi-modal Hierarchy in Hierarchy Network for Unconstrained Gait Recognition [3.431054404120758]
本稿では,階層型ネットワーク(HiH)におけるマルチモーダル階層(Hierarchy in Hierarchy Network)について述べる。
HiH は階層的なゲイト・デコンポザ・モジュールを用いてシルエットデータから一般的なゲイト・パターンの深度的およびモジュール内階層的な検証を行う主ブランチを特徴とする。
2次元関節配列に基づく補助枝は、歩行解析の空間的側面と時間的側面を豊かにする。
論文 参考訳(メタデータ) (2023-11-19T03:25:14Z) - SAAN: Similarity-aware attention flow network for change detection with
VHR remote sensing images [41.27207121222832]
変化検出(CD)は、地球観測領域における陸面のダイナミクスを監視するための基本的かつ重要な課題である。
これらのCD法は通常、重み共有のシームズエンコーダネットワークを用いてバイテンポラル画像の特徴を抽出し、デコーダネットワークを用いて変化領域を同定する。
そこで我々は,効果的な変化検出を実現するために,新たな類似性認識型注意フローネットワーク(SAAN)を提案する。
論文 参考訳(メタデータ) (2023-08-28T13:35:07Z) - Object Segmentation by Mining Cross-Modal Semantics [68.88086621181628]
マルチモーダル特徴の融合と復号を導くために,クロスモーダル・セマンティックスをマイニングする手法を提案する。
具体的には,(1)全周減衰核融合(AF),(2)粗大デコーダ(CFD),(3)多層自己超越からなる新しいネットワークXMSNetを提案する。
論文 参考訳(メタデータ) (2023-05-17T14:30:11Z) - High-resolution Depth Maps Imaging via Attention-based Hierarchical
Multi-modal Fusion [84.24973877109181]
誘導DSRのための新しい注意に基づく階層型マルチモーダル融合ネットワークを提案する。
本手法は,再現精度,動作速度,メモリ効率の点で最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-04T03:28:33Z) - Deep Semantic Matching with Foreground Detection and Cycle-Consistency [103.22976097225457]
深層ネットワークに基づく弱い教師付きセマンティックマッチングに対処する。
本研究では,背景乱れの影響を抑えるために,前景領域を明示的に推定する。
複数の画像にまたがって予測変換を強制し、幾何的に可視かつ一貫したサイクル一貫性の損失を発生させる。
論文 参考訳(メタデータ) (2020-03-31T22:38:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。