論文の概要: INHerit-SG: Incremental Hierarchical Semantic Scene Graphs with RAG-Style Retrieval
- arxiv url: http://arxiv.org/abs/2602.12971v1
- Date: Fri, 13 Feb 2026 14:45:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.43572
- Title: INHerit-SG: Incremental Hierarchical Semantic Scene Graphs with RAG-Style Retrieval
- Title(参考訳): INHerit-SG:RAG-Style Retrieval付きインクリメンタル階層的セマンティックシーングラフ
- Authors: YukTungSamuel Fang, Zhikang Shi, Jiabin Qiu, Zixuan Chen, Jieqi Shi, Hao Xu, Jing Huo, Yang Gao,
- Abstract要約: INHerit-SGは、複雑な環境で解釈可能な人間の意図的推論をサポートするセマンティックなシーングラフである。
イベントトリガーマップ更新メカニズムは、意味のあるセマンティックイベントが発生した場合にのみグラフを再編成する。
この明示的な解釈可能性により、複雑な検索の成功率と信頼性が向上し、システムはより広範なヒューマンインタラクションタスクに適応できる。
- 参考スコア(独自算出の注目度): 32.38739911399099
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Driven by advancements in foundation models, semantic scene graphs have emerged as a prominent paradigm for high-level 3D environmental abstraction in robot navigation. However, existing approaches are fundamentally misaligned with the needs of embodied tasks. As they rely on either offline batch processing or implicit feature embeddings, the maps can hardly support interpretable human-intent reasoning in complex environments. To address these limitations, we present INHerit-SG. We redefine the map as a structured, RAG-ready knowledge base where natural-language descriptions are introduced as explicit semantic anchors to better align with human intent. An asynchronous dual-process architecture, together with a Floor-Room-Area-Object hierarchy, decouples geometric segmentation from time-consuming semantic reasoning. An event-triggered map update mechanism reorganizes the graph only when meaningful semantic events occur. This strategy enables our graph to maintain long-term consistency with relatively low computational overhead. For retrieval, we deploy multi-role Large Language Models (LLMs) to decompose queries into atomic constraints and handle logical negations, and employ a hard-to-soft filtering strategy to ensure robust reasoning. This explicit interpretability improves the success rate and reliability of complex retrievals, enabling the system to adapt to a broader spectrum of human interaction tasks. We evaluate INHerit-SG on a newly constructed dataset, HM3DSem-SQR, and in real-world environments. Experiments demonstrate that our system achieves state-of-the-art performance on complex queries, and reveal its scalability for downstream navigation tasks. Project Page: https://fangyuktung.github.io/INHeritSG.github.io/
- Abstract(参考訳): 基礎モデルの進歩にともなうセマンティックシーングラフは,ロボットナビゲーションにおける高レベルな3次元環境抽象化のパラダイムとして注目されている。
しかし、既存のアプローチは基本的に具体的タスクのニーズと一致していない。
オフラインのバッチ処理や暗黙的な機能の埋め込みに依存するため、複雑な環境では、マップは解釈可能なヒューマンインテリジェンスをほとんどサポートしない。
これらの制限に対処するため、INHerit-SGを提案する。
我々は、地図を構造化されたRAG対応の知識ベースとして再定義し、自然言語記述を明示的なセマンティックアンカーとして導入し、人間の意図に適合させる。
非同期のデュアルプロセスアーキテクチャとFloor-Room-Area-Object階層は、幾何学的セグメンテーションを時間を要するセマンティック推論から切り離す。
イベントトリガーマップ更新メカニズムは、意味のあるセマンティックイベントが発生した場合にのみグラフを再編成する。
この戦略により、グラフは比較的低い計算オーバーヘッドで長期の一貫性を維持することができる。
検索には,クエリをアトミックな制約に分解し,論理的否定を処理するためにLLM(Large Language Model)をデプロイし,ロバストな推論を保証するためにハード・ソフトなフィルタリング戦略を採用する。
この明示的な解釈可能性により、複雑な検索の成功率と信頼性が向上し、システムはより広範なヒューマンインタラクションタスクに適応できる。
新たに構築したデータセットHM3DSem-SQRと実環境におけるINHerit-SGの評価を行った。
実験により,本システムは複雑なクエリ上での最先端性能を実現し,下流ナビゲーションタスクのスケーラビリティを明らかにした。
プロジェクトページ: https://fangyuktung.github.io/INHeritSG.github.io/
関連論文リスト
- MDER-DR: Multi-Hop Question Answering with Entity-Centric Summaries [2.756584457554517]
Map-Disambiguate-Enrich-Reduce (MDER)はコンテキスト由来の3重記述を生成し、エンティティレベルの要約と統合する。
Decompose-Resolve (DR)は、ユーザクエリを解決可能なトリプルに分解し、知識グラフに格納する。
MDERとDRはLLM駆動のQAパイプラインを形成し、スパース、不完全、複雑なリレーショナルデータに対して堅牢である。
論文 参考訳(メタデータ) (2026-03-11T18:38:44Z) - OFA-MAS: One-for-All Multi-Agent System Topology Design based on Mixture-of-Experts Graph Generative Models [57.94189874119267]
マルチエージェントシステム(MAS)は複雑な問題を解決するための強力なパラダイムを提供する。
現在のグラフ学習に基づく設計手法は、しばしば「1対1」のパラダイムに準拠している。
自然言語で記述されたタスクに対して適応的な協調グラフを生成する一対一のフレームワークOFA-TADを提案する。
論文 参考訳(メタデータ) (2026-01-19T12:23:44Z) - Dynamic Generation of Multi-LLM Agents Communication Topologies with Graph Diffusion Models [99.85131798240808]
我々はtextitGuided Topology Diffusion (GTD) と呼ばれる新しい生成フレームワークを導入する。
条件付き離散グラフ拡散モデルにインスパイアされたGTD式は、反復的な構成過程としてトポロジー合成を行う。
各ステップで生成は、多目的報酬を予測する軽量プロキシモデルによって制御される。
実験により、GTDは高いタスク適応性、スパース、効率的な通信トポロジを生成できることが示されている。
論文 参考訳(メタデータ) (2025-10-09T05:28:28Z) - GRACE: Graph-Guided Repository-Aware Code Completion through Hierarchical Code Fusion [33.66085762717581]
LLMはローカライズされたコード補完に優れていますが、コンテキストウィンドウが限られているため、リポジトリレベルのタスクに苦労しています。
GRACEは、静的および動的コードセマンティクスの両方をキャプチャするために、マルチレベルでマルチセマンティックなコードグラフを構築する。
実験によると、GRACEはすべてのメトリクスで最先端のメソッドよりも大幅に優れています。
論文 参考訳(メタデータ) (2025-09-07T09:01:48Z) - Assemble Your Crew: Automatic Multi-agent Communication Topology Design via Autoregressive Graph Generation [91.17994756436259]
大規模言語モデル(LLM)に基づくマルチエージェントシステム(MAS)は、多様な領域にわたる複雑な問題を扱うための強力なソリューションとして登場した。
既存のアプローチは、事前に定義されたエージェントセットとハードコードされた相互作用構造を持つテンプレートグラフ修正パラダイムに依存しているため、基本的に制限されている。
協調グラフをスクラッチから構築することで、このパラダイムを運用する新しい自己回帰モデルであるARG-Designerを提案する。
論文 参考訳(メタデータ) (2025-07-24T09:17:41Z) - SlimRAG: Retrieval without Graphs via Entity-Aware Context Selection [38.200971604630524]
SlimRAGはグラフのない検索のための軽量フレームワークである。
構造が重いコンポーネントを、シンプルで効果的なエンティティ認識メカニズムで置き換える。
実験により、SlimRAGは強い平坦線とグラフベースのベースラインよりも精度が高いことが示された。
論文 参考訳(メタデータ) (2025-06-15T15:36:17Z) - Respecting Temporal-Causal Consistency: Entity-Event Knowledge Graphs for Retrieval-Augmented Generation [69.45495166424642]
我々は,物語文書における時間的,因果的,文字的整合性を理解するために,頑健で差別的なQAベンチマークを開発する。
次に、バイナリマッピングでリンクされたエンティティとイベントのサブグラフを分離したまま保持するデュアルグラフフレームワークであるEntity-Event RAG(E2RAG)を紹介します。
ChronoQA全体で、我々のアプローチは最先端の非構造化およびKGベースのRAGベースラインよりも優れており、因果一貫性クエリや文字整合性クエリが顕著である。
論文 参考訳(メタデータ) (2025-06-06T10:07:21Z) - Divide by Question, Conquer by Agent: SPLIT-RAG with Question-Driven Graph Partitioning [62.640169289390535]
SPLIT-RAGは、質問駆動セマンティックグラフ分割と協調サブグラフ検索による制限に対処するマルチエージェントRAGフレームワークである。
革新的なフレームワークは、まずリンク情報のセマンティック分割を作成し、次にタイプ特化知識ベースを使用してマルチエージェントRAGを実現する。
属性対応グラフセグメンテーションは、知識グラフを意味的に一貫性のあるサブグラフに分割し、サブグラフが異なるクエリタイプと整合することを保証する。
階層的なマージモジュールは、論理的検証を通じて、部分グラフ由来の解答間の矛盾を解消する。
論文 参考訳(メタデータ) (2025-05-20T06:44:34Z) - SG-Reg: Generalizable and Efficient Scene Graph Registration [23.3853919684438]
セマンティックノードの複数モードを符号化するシーングラフネットワークを設計する。
バックエンドでは、対応に応じて変換を決定するために頑健なポーズ推定器を用いる。
提案手法は,クエリフレーム毎に52KBの通信帯域しか必要とせず,わずかに高い登録リコールを実現する。
論文 参考訳(メタデータ) (2025-04-20T01:22:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。