Fugu-MT 論文翻訳(概要): A Scene Graph Backed Approach to Open Set Semantic Mapping

論文の概要: A Scene Graph Backed Approach to Open Set Semantic Mapping

arxiv url: http://arxiv.org/abs/2602.03781v1
Date: Tue, 03 Feb 2026 17:41:51 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-23 08:17:41.145957
Title: A Scene Graph Backed Approach to Open Set Semantic Mapping
Title（参考訳）: Scene Graph Backed Approach to Open Set Semantic Mapping
Authors: Martin Günther, Felix Igelbrink, Oscar Lima, Lennart Niecksch, Marian Renz, Martin Atzmueller,
Abstract要約: オープンセットセマンティックマッピングと3次元シーングラフ(DSSG)はロボット知覚のパラダイムとして確立されている。本稿では,3DSSGが基本的なバックエンドとして機能し,主要な知識表現として機能するマッピングアーキテクチャを提案する。これにより、大規模な設定で拡張された操作であっても、地図が位相的に一貫性を持ち、計算的に効率的であることを保証する。
参考スコア（独自算出の注目度）: 1.8266902367595235
License: http://creativecommons.org/licenses/by/4.0/
Abstract: While Open Set Semantic Mapping and 3D Semantic Scene Graphs (3DSSGs) are established paradigms in robotic perception, deploying them effectively to support high-level reasoning in large-scale, real-world environments remains a significant challenge. Most existing approaches decouple perception from representation, treating the scene graph as a derivative layer generated post hoc. This limits both consistency and scalability. In contrast, we propose a mapping architecture where the 3DSSG serves as the foundational backend, acting as the primary knowledge representation for the entire mapping process. Our approach leverages prior work on incremental scene graph prediction to infer and update the graph structure in real-time as the environment is explored. This ensures that the map remains topologically consistent and computationally efficient, even during extended operations in large-scale settings. By maintaining an explicit, spatially grounded representation that supports both flat and hierarchical topologies, we bridge the gap between sub-symbolic raw sensor data and high-level symbolic reasoning. Consequently, this provides a stable, verifiable structure that knowledge-driven frameworks, ranging from knowledge graphs and ontologies to Large Language Models (LLMs), can directly exploit, enabling agents to operate with enhanced interpretability, trustworthiness, and alignment to human concepts.
Abstract（参考訳）: Open Set Semantic Mappingと3D Semantic Scene Graphs(3DSSGs)はロボット知覚のパラダイムとして確立されているが、大規模で現実世界の環境における高レベルの推論をサポートするために効果的にデプロイすることは依然として大きな課題である。既存のほとんどのアプローチは認識を表現から切り離し、シーングラフをホック後に生成されたデリバティブ層として扱う。これにより、一貫性とスケーラビリティの両方が制限される。対照的に、3DSSGが基本的なバックエンドとして機能し、マッピングプロセス全体の主要な知識表現として機能するマッピングアーキテクチャを提案する。提案手法では,環境を探索する上で,インクリメンタルなシーングラフ予測の先行作業を活用して,グラフ構造をリアルタイムで推定・更新する。これにより、大規模な設定で拡張された操作であっても、地図が位相的に一貫性を持ち、計算的に効率的であることを保証する。平面的および階層的トポロジをサポートする空間的接地表現を維持することにより,サブシンボリックな生センサデータと高レベルなシンボル推論のギャップを埋める。これにより、知識グラフやオントロジーから大規模言語モデル(LLM)まで、知識駆動フレームワークが直接的に活用できる安定した検証可能な構造が提供される。

関連論文リスト

OGScene3D: Incremental Open-Vocabulary 3D Gaussian Scene Graph Mapping for Scene Understanding [30.730672505996967]
OGScene3Dは,正確な3次元セマンティックマッピングとシーングラフ構築を段階的に行う,オープン語彙のシーン理解システムである。本システムは,セマンティック予測と信頼性を協調的にモデル化する自信に基づくガウス意味表現を用いている。 2D-3Dセマンティック一貫性とガウスレンダリングのコントリビューションを統合することで、この手法はシーン全体のセマンティック理解を継続的に洗練する。
論文参考訳（メタデータ） (2026-03-17T09:38:01Z)
SGR3 Model: Scene Graph Retrieval-Reasoning Model in 3D [51.32219731589742]
3Dシーングラフは、オブジェクトエンティティとその関連性の構造化された表現を提供する。 3次元シーングラフ生成のための既存のアプローチは、通常、シーン再構成とグラフニューラルネットワーク(GNN)を組み合わせる。本研究では,3次元のSGR3モデルを用いたScene Graph Retrieval-Reasoning Modelを提案する。
論文参考訳（メタデータ） (2026-03-04T21:19:54Z)
Relationship-Aware Hierarchical 3D Scene Graph for Task Reasoning [10.364779390403337]
本稿では,複数の抽象化レベルにまたがるオープン語彙機能を統合し,オブジェクト-リレーショナル推論をサポートする階層型3Dシーングラフを提案する。本稿では,Large Language Models(LLM)とVLM(Vision Language Model)を組み合わせて,シーングラフのセマンティックおよびリレーショナル情報を解釈するタスク推論モジュールを提案する。我々は,複数の環境やタスクにおいて,四足歩行ロボットに配置することで,その方法を検証する。
論文参考訳（メタデータ） (2026-02-02T18:47:02Z)
KeySG: Hierarchical Keyframe-Based 3D Scene Graphs [1.5134439544218246]
KeySGは3Dシーンを、床、部屋、オブジェクト、機能要素からなる階層的なグラフとして表現している。我々はVLMを利用してシーン情報を抽出し、オブジェクト間の関係エッジを明示的にモデル化する必要性を緩和する。我々のアプローチは、大規模シーングラフに関連するスケーラビリティ問題を緩和しながら、複雑であいまいなクエリを処理できる。
論文参考訳（メタデータ） (2025-10-01T15:53:27Z)
Graph-Guided Dual-Level Augmentation for 3D Scene Segmentation [21.553363236403822]
3Dポイントクラウドセグメンテーションは、シーン内の個々のポイントにセマンティックラベルを割り当てることを目的としている。既存の手法では、大規模なアノテーションの負担を軽減するためにデータ拡張を採用するのが一般的である。本稿では,現実的な3次元シーン合成のための2レベル制約付きグラフ誘導型データ拡張フレームワークを提案する。
論文参考訳（メタデータ） (2025-07-30T13:25:36Z)
Open-Vocabulary Octree-Graph for 3D Scene Understanding [54.11828083068082]
Octree-Graphはオープンな3Dシーン理解のための新しいシーン表現である。セマンティクスを記憶し、その形状に応じてオブジェクトの占有度を調節するアダプティブ・オクツリー構造を開発する。
論文参考訳（メタデータ） (2024-11-25T10:14:10Z)
On Support Relations Inference and Scene Hierarchy Graph Construction from Point Cloud in Clustered Environments [3.4535508414601344]
3Dシーンでは、リッチな空間幾何学的・トポロジ的情報はしばしばRGBベースのシーン理解アプローチによって無視される。本研究では,物体間の関係を推定する場面理解のためのボトムアップ手法を開発した。
論文参考訳（メタデータ） (2024-04-22T02:42:32Z)
Incremental 3D Semantic Scene Graph Prediction from RGB Sequences [86.77318031029404]
RGB画像列が与えられたシーンの一貫性のある3Dセマンティックシーングラフをインクリメンタルに構築するリアルタイムフレームワークを提案する。提案手法は,新たなインクリメンタルエンティティ推定パイプラインとシーングラフ予測ネットワークから構成される。提案するネットワークは,シーンエンティティから抽出した多視点および幾何学的特徴を用いて,反復的メッセージパッシングを用いた3次元セマンティックシーングラフを推定する。
論文参考訳（メタデータ） (2023-05-04T11:32:16Z)
GINet: Graph Interaction Network for Scene Parsing [58.394591509215005]
画像領域に対する文脈推論を促進するために,グラフインタラクションユニット(GIユニット)とセマンティックコンテキストロス(SC-loss)を提案する。提案されたGINetは、Pascal-ContextやCOCO Stuffなど、一般的なベンチマークにおける最先端のアプローチよりも優れている。
論文参考訳（メタデータ） (2020-09-14T02:52:45Z)
Spatial Pyramid Based Graph Reasoning for Semantic Segmentation [67.47159595239798]
セマンティックセグメンテーションタスクにグラフ畳み込みを適用し、改良されたラプラシアンを提案する。グラフ推論は、空間ピラミッドとして構成された元の特徴空間で直接実行される。計算とメモリのオーバーヘッドの利点で同等のパフォーマンスを実現しています。
論文参考訳（メタデータ） (2020-03-23T12:28:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。