論文の概要: MSG-Loc: Multi-Label Likelihood-based Semantic Graph Matching for Object-Level Global Localization
- arxiv url: http://arxiv.org/abs/2512.03522v1
- Date: Wed, 03 Dec 2025 07:28:01 GMT
- ステータス: 情報取得中
- システム内更新日: 2025-12-04 11:57:42.969012
- Title: MSG-Loc: Multi-Label Likelihood-based Semantic Graph Matching for Object-Level Global Localization
- Title(参考訳): MSG-Loc:オブジェクトレベルグローバルローカライゼーションのためのマルチラベル類似型セマンティックグラフマッチング
- Authors: Gihyeon Lee, Jungwoo Lee, Juwon Kim, Young-Sik Shin, Younggun Cho,
- Abstract要約: オブジェクトレベルのグローバルなローカライゼーションのための多ラベル確率に基づくセマンティックグラフマッチングフレームワークを提案する。
提案手法は,各ノードの確率と近隣ノードの最大可能性を組み合わせることにより,グラフ間の意味対応を強化する。
- 参考スコア(独自算出の注目度): 10.590597091788064
- License:
- Abstract: Robots are often required to localize in environments with unknown object classes and semantic ambiguity. However, when performing global localization using semantic objects, high semantic ambiguity intensifies object misclassification and increases the likelihood of incorrect associations, which in turn can cause significant errors in the estimated pose. Thus, in this letter, we propose a multi-label likelihood-based semantic graph matching framework for object-level global localization. The key idea is to exploit multi-label graph representations, rather than single-label alternatives, to capture and leverage the inherent semantic context of object observations. Based on these representations, our approach enhances semantic correspondence across graphs by combining the likelihood of each node with the maximum likelihood of its neighbors via context-aware likelihood propagation. For rigorous validation, data association and pose estimation performance are evaluated under both closed-set and open-set detection configurations. In addition, we demonstrate the scalability of our approach to large-vocabulary object categories in both real-world indoor scenes and synthetic environments.
- Abstract(参考訳): ロボットは、未知のオブジェクトクラスと意味的曖昧さのある環境でローカライズする必要があることが多い。
しかし,意味的オブジェクトを用いたグローバルなローカライゼーションを行う場合,高い意味的曖昧さはオブジェクトの誤分類を増大させ,誤関連の可能性を高め,推定されたポーズにおいて重大な誤りを引き起こす可能性がある。
そこで本論文では,オブジェクトレベルのグローバルなローカライゼーションのための多ラベル確率に基づくセマンティックグラフマッチングフレームワークを提案する。
キーとなるアイデアは、シングルラベルの代替ではなく、マルチラベルグラフの表現を利用して、オブジェクト観察の固有の意味的コンテキストをキャプチャし、活用することである。
これらの表現に基づいて,各ノードの確率と近隣ノードの最大確率を文脈認識型確率伝搬により組み合わせることで,グラフ間の意味的対応性を高める。
厳密な検証のために、クローズドセットとオープンセットの両方の検知設定の下で、データアソシエーションとポーズ推定性能を評価する。
さらに,実際の屋内シーンと合成環境の両方において,大語彙オブジェクトカテゴリへのアプローチのスケーラビリティを実証した。
関連論文リスト
- Semantic-Aligned Learning with Collaborative Refinement for Unsupervised VI-ReID [82.12123628480371]
教師なしの人物再識別(USL-VI-ReID)は、モデル学習のための人間のアノテーションを使わずに、同じ人物の歩行者像を異なるモードでマッチングすることを目指している。
従来の手法では、ラベルアソシエーションアルゴリズムを用いて異質な画像の擬似ラベルを統一し、グローバルな特徴学習のためのコントラスト学習フレームワークを設計していた。
本稿では,各モダリティによって強調される特定のきめ細かいパターンを対象とするSALCR(Semantic-Aligned Learning with Collaborative Refinement)フレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-27T13:58:12Z) - Distilling Spectral Graph for Object-Context Aware Open-Vocabulary Semantic Segmentation [47.047267066525265]
画像にオブジェクトレベルの文脈知識を取り入れた新しいアプローチを導入する。
提案手法は,多種多様なデータセットにまたがる高い一般化性を有する最先端性能を実現する。
論文 参考訳(メタデータ) (2024-11-26T06:34:48Z) - CLIP-Clique: Graph-based Correspondence Matching Augmented by Vision Language Models for Object-based Global Localization [0.0]
オブジェクトマップ上のローカライズのための最も有望なアプローチの1つは、セマンティックグラフマッチングを使用することである。
従来の問題に対処するために、視覚言語モデルを用いた対応マッチングを強化する。
さらに、inlierはグラフ理論のアプローチを用いて決定的に推定される。
論文 参考訳(メタデータ) (2024-10-04T00:23:20Z) - Semantics Meets Temporal Correspondence: Self-supervised Object-centric Learning in Videos [63.94040814459116]
自己教師付き手法は、高レベルの意味論と低レベルの時間対応の学習において顕著な進歩を見せている。
融合した意味特徴と対応地図の上に,意味認識型マスキングスロットアテンションを提案する。
我々は、時間的コヒーレントなオブジェクト中心表現を促進するために、セマンティックおよびインスタンスレベルの時間的一貫性を自己スーパービジョンとして採用する。
論文 参考訳(メタデータ) (2023-08-19T09:12:13Z) - Exploiting Unlabeled Data with Vision and Language Models for Object
Detection [64.94365501586118]
堅牢で汎用的なオブジェクト検出フレームワークを構築するには、より大きなラベルスペースとより大きなトレーニングデータセットへのスケーリングが必要である。
本稿では,近年の視覚と言語モデルで利用可能なリッチなセマンティクスを利用して,未ラベル画像中のオブジェクトのローカライズと分類を行う手法を提案する。
生成した擬似ラベルの価値を,オープン語彙検出と半教師付きオブジェクト検出の2つのタスクで示す。
論文 参考訳(メタデータ) (2022-07-18T21:47:15Z) - In-Place Scene Labelling and Understanding with Implicit Scene
Representation [39.73806072862176]
ニューラルラジアンスフィールド(NeRF)を拡張して、外観とジオメトリでセマンティクスを共同エンコードします。
ルームスケールのシーンでは、ラベルがスパースまたは非常に騒々しい場合、このアプローチの利点を示します。
論文 参考訳(メタデータ) (2021-03-29T18:30:55Z) - Semantic SLAM with Autonomous Object-Level Data Association [31.707650560075976]
セマンティックレベルのSLAMシステムは,高精度なオブジェクトレベルのデータアソシエーションとリアルタイムなセマンティックマッピングを実現する。
オンラインのセマンティックマップ構築とセマンティックレベルのローカライズ機能は、事前の未知環境におけるセマンティックレベルのマッピングとタスク計画を容易にする。
論文 参考訳(メタデータ) (2020-11-20T20:33:39Z) - Universal-RCNN: Universal Object Detector via Transferable Graph R-CNN [117.80737222754306]
我々はUniversal-RCNNと呼ばれる新しいユニバーサルオブジェクト検出器を提案する。
まず、すべてのカテゴリの高レベルなセマンティック表現を統合することで、グローバルなセマンティックプールを生成する。
ドメイン内推論モジュールは、空間認識GCNによってガイドされる1つのデータセット内のスパースグラフ表現を学習し、伝播する。
論文 参考訳(メタデータ) (2020-02-18T07:57:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。