論文の概要: MA3DSG: Multi-Agent 3D Scene Graph Generation for Large-Scale Indoor Environments
- arxiv url: http://arxiv.org/abs/2602.04152v1
- Date: Wed, 04 Feb 2026 02:39:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-05 19:45:11.343796
- Title: MA3DSG: Multi-Agent 3D Scene Graph Generation for Large-Scale Indoor Environments
- Title(参考訳): MA3DSG:大規模屋内環境のためのマルチエージェント3次元シーングラフ生成
- Authors: Yirum Kim, Jaewoo Kim, Ue-Hwan Kim,
- Abstract要約: 我々は,マルチエージェントを用いて,この拡張性に対処するための最初のフレームワークであるマルチエージェント3次元シーングラフ生成(MA3DSG)モデルを導入する。
我々は,個々のエージェントから部分グラフを効率よく統合したグローバルシーングラフにマージする学習自由グラフアライメントアルゴリズムを開発した。
- 参考スコア(独自算出の注目度): 6.071490877668865
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current 3D scene graph generation (3DSGG) approaches heavily rely on a single-agent assumption and small-scale environments, exhibiting limited scalability to real-world scenarios. In this work, we introduce Multi-Agent 3D Scene Graph Generation (MA3DSG) model, the first framework designed to tackle this scalability challenge using multiple agents. We develop a training-free graph alignment algorithm that efficiently merges partial query graphs from individual agents into a unified global scene graph. Leveraging extensive analysis and empirical insights, our approach enables conventional single-agent systems to operate collaboratively without requiring any learnable parameters. To rigorously evaluate 3DSGG performance, we propose MA3DSG-Bench-a benchmark that supports diverse agent configurations, domain sizes, and environmental conditions-providing a more general and extensible evaluation framework. This work lays a solid foundation for scalable, multi-agent 3DSGG research.
- Abstract(参考訳): 現在の3Dシーングラフ生成(3DSGG)アプローチは、単一エージェントの仮定と小規模環境に大きく依存しており、現実のシナリオに対するスケーラビリティに制限がある。
本研究では,マルチエージェントを用いて,この拡張性に対処するための最初のフレームワークであるマルチエージェント3次元シーングラフ生成(MA3DSG)モデルを提案する。
我々は,個々のエージェントから部分的なクエリグラフを効率よく統合したグローバルシーングラフにマージする学習自由グラフアライメントアルゴリズムを開発した。
本手法では, 学習可能なパラメータを必要とせずに, 従来の単エージェントシステムによる協調動作を可能にする。
3DSGの性能を厳格に評価するために,多様なエージェント構成,ドメインサイズ,環境条件をサポートするMA3DSG-Bench-aベンチマークを提案し,より汎用的で拡張可能な評価フレームワークを提案する。
この研究はスケーラブルでマルチエージェントな3DSGG研究の基盤となる。
関連論文リスト
- KeySG: Hierarchical Keyframe-Based 3D Scene Graphs [1.5134439544218246]
KeySGは3Dシーンを、床、部屋、オブジェクト、機能要素からなる階層的なグラフとして表現している。
我々はVLMを利用してシーン情報を抽出し、オブジェクト間の関係エッジを明示的にモデル化する必要性を緩和する。
我々のアプローチは、大規模シーングラフに関連するスケーラビリティ問題を緩和しながら、複雑であいまいなクエリを処理できる。
論文 参考訳(メタデータ) (2025-10-01T15:53:27Z) - Integrating Prior Observations for Incremental 3D Scene Graph Prediction [0.866627581195388]
3Dセマンティックシーングラフ(3DSSG)は、オブジェクト、属性、関係性を明示的にモデル化することで、環境のコンパクトな構造化表現を提供する。
本稿では,先行観測などの付加的なマルチモーダル情報を直接メッセージパッシングプロセスに統合する,インクリメンタルな3DSSG予測のための新しいグラフモデルを提案する。
我々は3DSSGデータセットに対する我々のアプローチを評価し、GNNがセマンティック埋め込み(例えばCLIP)や事前観測などのマルチモーダル情報に富んだことが、複雑な実環境に対してスケーラブルで一般化可能なソリューションを提供することを示す。
論文 参考訳(メタデータ) (2025-09-15T13:10:34Z) - SeqAffordSplat: Scene-level Sequential Affordance Reasoning on 3D Gaussian Splatting [85.87902260102652]
本稿では, 連続3次元ガウシアン・アフラマンス推論の課題について紹介する。
次に,SeqSplatNetを提案する。SqSplatNetは,命令を直接3Dアベイランスマスクのシーケンスにマッピングするエンドツーエンドフレームワークである。
本手法は,1段階のインタラクションから,シーンレベルでの複雑なシーケンシャルなタスクへの可利用性推論を効果的に向上させる。
論文 参考訳(メタデータ) (2025-07-31T17:56:55Z) - S^2Former-OR: Single-Stage Bi-Modal Transformer for Scene Graph Generation in OR [50.435592120607815]
外科手術のシーングラフ生成(SGG)は、手術室(OR)におけるホモロジー認知知能の増強に不可欠である
これまでの研究は主に多段階学習に依存しており、生成したセマンティックシーングラフはポーズ推定とオブジェクト検出を伴う中間プロセスに依存している。
本研究では,S2Former-OR(S2Former-OR)と呼ばれるORにおけるSGGのための新しいシングルステージバイモーダルトランスフォーマフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-22T11:40:49Z) - 3D-GPT: Procedural 3D Modeling with Large Language Models [47.72968643115063]
命令駆動3Dモデリングのための大規模言語モデル(LLM)を利用するフレームワークである3D-GPTを紹介する。
3D-GPTは、3Dモデリングタスクをアクセス可能なセグメントに分割し、各タスクにアプエージェントを割り当てる。
我々の実証調査では、3D-GPTが解釈し、指示を実行し、信頼性の高い結果を提供するだけでなく、人間デザイナーと効果的に協力することを確認した。
論文 参考訳(メタデータ) (2023-10-19T17:41:48Z) - SGAligner : 3D Scene Alignment with Scene Graphs [84.01002998166145]
3Dシーングラフの構築は、いくつかの具体的AIアプリケーションのためのシーン表現のトピックとして登場した。
オーバーラップ可能な3次元シーングラフのペアをゼロから部分的に整列させるという基本的な問題に着目する。
そこで我々はSGAlignerを提案する。SGAlignerは3次元シーングラフのペアを組合わせるための最初の方法であり、その組込みシナリオに対して堅牢である。
論文 参考訳(メタデータ) (2023-04-28T14:39:22Z) - Explore Contextual Information for 3D Scene Graph Generation [43.66442227874461]
3次元シーングラフ生成(SGG)はコンピュータビジョンに大きな関心を寄せている。
本稿では,3次元SGGタスクのコンテキスト情報を完全に探索するフレームワークを提案する。
提案手法は,従来の3DSSGデータセットの手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-10-12T14:26:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。