論文の概要: SG-Reg: Generalizable and Efficient Scene Graph Registration
- arxiv url: http://arxiv.org/abs/2504.14440v1
- Date: Sun, 20 Apr 2025 01:22:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-30 00:32:47.695625
- Title: SG-Reg: Generalizable and Efficient Scene Graph Registration
- Title(参考訳): SG-Reg: 汎用的で効率的なシーングラフ登録
- Authors: Chuhao Liu, Zhijian Qiao, Jieqi Shi, Ke Wang, Peize Liu, Shaojie Shen,
- Abstract要約: セマンティックノードの複数モードを符号化するシーングラフネットワークを設計する。
バックエンドでは、対応に応じて変換を決定するために頑健なポーズ推定器を用いる。
提案手法は,クエリフレーム毎に52KBの通信帯域しか必要とせず,わずかに高い登録リコールを実現する。
- 参考スコア(独自算出の注目度): 23.3853919684438
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper addresses the challenges of registering two rigid semantic scene graphs, an essential capability when an autonomous agent needs to register its map against a remote agent, or against a prior map. The hand-crafted descriptors in classical semantic-aided registration, or the ground-truth annotation reliance in learning-based scene graph registration, impede their application in practical real-world environments. To address the challenges, we design a scene graph network to encode multiple modalities of semantic nodes: open-set semantic feature, local topology with spatial awareness, and shape feature. These modalities are fused to create compact semantic node features. The matching layers then search for correspondences in a coarse-to-fine manner. In the back-end, we employ a robust pose estimator to decide transformation according to the correspondences. We manage to maintain a sparse and hierarchical scene representation. Our approach demands fewer GPU resources and fewer communication bandwidth in multi-agent tasks. Moreover, we design a new data generation approach using vision foundation models and a semantic mapping module to reconstruct semantic scene graphs. It differs significantly from previous works, which rely on ground-truth semantic annotations to generate data. We validate our method in a two-agent SLAM benchmark. It significantly outperforms the hand-crafted baseline in terms of registration success rate. Compared to visual loop closure networks, our method achieves a slightly higher registration recall while requiring only 52 KB of communication bandwidth for each query frame. Code available at: \href{http://github.com/HKUST-Aerial-Robotics/SG-Reg}{http://github.com/HKUST-Aerial-Robotics/SG-Reg}.
- Abstract(参考訳): 本稿では、2つの厳密なセマンティックなシーングラフを登録する際の課題に対処する。これは、自律エージェントがそのマップを遠隔エージェント、または先行マップに対して登録する必要がある場合に必須の機能である。
古典的セマンティック・エイドド・登録における手書き記述子、あるいは学習に基づくシーングラフの登録に依存した真実的アノテーションは、現実的な実環境においてそれらの応用を妨げる。
課題に対処するため,セマンティックノードの複数モードを符号化するシーングラフネットワークを設計した。
これらのモダリティは、コンパクトなセマンティックノード機能を作成するために融合される。
一致する層は、粗い方法で対応を探索する。
バックエンドでは、対応に応じて変換を決定するために頑健なポーズ推定器を用いる。
スパースで階層的なシーン表現を何とか維持できます。
このアプローチでは、GPUリソースの削減とマルチエージェントタスクにおける通信帯域幅の削減が求められます。
さらに,視覚基盤モデルとセマンティックマッピングモジュールを用いた新たなデータ生成手法を設計し,セマンティックシーングラフを再構成する。
これは、データを生成するのに、地味なセマンティックアノテーションに依存する以前の作品とは大きく異なる。
本手法を2エージェントのSLAMベンチマークで検証する。
登録成功率において手作りのベースラインを著しく上回る。
ビジュアルループクロージャネットワークと比較して,クエリフレーム毎に52KBの通信帯域しか必要とせず,若干高い登録リコールを実現する。
コードは以下の通り。 \href{http://github.com/HKUST-Aerial-Robotics/SG-Reg}{http://github.com/HKUST-Aerial-Robotics/SG-Reg}。
関連論文リスト
- A-SCoRe: Attention-based Scene Coordinate Regression for wide-ranging scenarios [1.2093553114715083]
A-ScoReは、意味のある高セマンティックな2Dディスクリプタを生成するために、ディスクリプタマップレベルの注意を利用するアテンションベースのモデルである。
その結果,本手法はより軽量でフレキシブルでありながら,複数のベンチマークでState-of-the-artメソッドに匹敵する性能を示した。
論文 参考訳(メタデータ) (2025-03-18T07:39:50Z) - Open-Vocabulary Octree-Graph for 3D Scene Understanding [54.11828083068082]
Octree-Graphはオープンな3Dシーン理解のための新しいシーン表現である。
セマンティクスを記憶し、その形状に応じてオブジェクトの占有度を調節するアダプティブ・オクツリー構造を開発する。
論文 参考訳(メタデータ) (2024-11-25T10:14:10Z) - ZeroReg: Zero-Shot Point Cloud Registration with Foundation Models [77.84408427496025]
最先端の3Dポイントクラウド登録方法は、トレーニングのためにラベル付き3Dデータセットに依存している。
我々は2次元基礎モデルを用いて3次元対応を予測するゼロショット登録手法であるZeroRegを紹介する。
論文 参考訳(メタデータ) (2023-12-05T11:33:16Z) - Dynamic Graph Message Passing Networks for Visual Recognition [112.49513303433606]
長距離依存のモデリングは、コンピュータビジョンにおけるシーン理解タスクに不可欠である。
完全連結グラフはそのようなモデリングには有益であるが、計算オーバーヘッドは禁じられている。
本稿では,計算複雑性を大幅に低減する動的グラフメッセージパッシングネットワークを提案する。
論文 参考訳(メタデータ) (2022-09-20T14:41:37Z) - SARNet: Semantic Augmented Registration of Large-Scale Urban Point
Clouds [19.41446935340719]
本研究では,都市クラウドのためのセマンティック登録ネットワークであるSARNetを提案する。
提案手法は,登録精度の向上を支援するため,セマンティックな特徴をフル活用する。
提案するSARNetを,大都市景観の現実データを用いて広範に評価する。
論文 参考訳(メタデータ) (2022-06-27T08:49:11Z) - SIGMA: Semantic-complete Graph Matching for Domain Adaptive Object
Detection [26.0630601028093]
ドメイン適応オブジェクト検出(DAOD)は、ラベル付きドメインを利用して、アノテーションのない新しいドメインに一般化されたオブジェクト検出器を学ぶ。
クロスドメインプロトタイプ(クラスセンター)の縮小によるクラス条件分布の調整
本稿では,不一致のセマンティックスを補完し,グラフマッチングによる適応を再構築する,幻覚Dのための新しいSemantIc完全グラフマッチングフレームワークを提案する。
論文 参考訳(メタデータ) (2022-03-12T10:14:17Z) - Group-Wise Semantic Mining for Weakly Supervised Semantic Segmentation [49.90178055521207]
この研究は、画像レベルのアノテーションとピクセルレベルのセグメンテーションのギャップを埋めることを目標に、弱い監督されたセマンティックセグメンテーション(WSSS)に対処する。
画像群における意味的依存関係を明示的にモデル化し,より信頼性の高い擬似的基盤構造を推定する,新たなグループ学習タスクとしてWSSSを定式化する。
特に、入力画像がグラフノードとして表現されるグループ単位のセマンティックマイニングのためのグラフニューラルネットワーク(GNN)を考案する。
論文 参考訳(メタデータ) (2020-12-09T12:40:13Z) - Towards Efficient Scene Understanding via Squeeze Reasoning [71.1139549949694]
我々はSqueeze Reasoningと呼ばれる新しいフレームワークを提案する。
空間地図上の情報を伝播するのではなく、まず入力特徴をチャネルワイドなグローバルベクトルに絞ることを学ぶ。
提案手法はエンドツーエンドのトレーニングブロックとしてモジュール化可能であり,既存のネットワークに簡単に接続可能であることを示す。
論文 参考訳(メタデータ) (2020-11-06T12:17:01Z) - Representative Graph Neural Network [113.67254049938629]
いくつかの代表的特徴を動的にサンプリングするために、代表グラフ層を提示する。
すべての位置からメッセージを伝搬する代わりに、RepGraphレイヤは1つのノードの応答を数個の代表ノードで計算します。
論文 参考訳(メタデータ) (2020-08-12T09:46:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。