論文の概要: Generation of Uncertainty-Aware Emergent Concepts in Factorized 3D Scene Graphs via Graph Neural Networks
- arxiv url: http://arxiv.org/abs/2409.11972v2
- Date: Tue, 21 Oct 2025 14:52:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:02.352827
- Title: Generation of Uncertainty-Aware Emergent Concepts in Factorized 3D Scene Graphs via Graph Neural Networks
- Title(参考訳): グラフニューラルネットワークによる因子化3次元シーングラフにおける不確実性を考慮した創発的概念の生成
- Authors: Jose Andres Millan-Romera, Muhammad Shaheer, Miguel Fernandez-Cortizas, Martin R. Oswald, Holger Voos, Jose Luis Sanchez-Lopez,
- Abstract要約: 本稿では,SLAMバックエンド内の最適要素として,オンライン空間創発概念を学習ベースで生成する手法を提案する。
シミュレーションと実際の屋内シナリオの両方において,提案手法は複雑な概念検出を20.7%,5.3%,軌道推定を19.2%,地図再構成を12.3%,地図再構成を3.8%改善する。
- 参考スコア(独自算出の注目度): 14.276364545017222
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Enabling robots to autonomously discover emergent spatial concepts (e.g., rooms) from primitive geometric observations (e.g., planar surfaces) within 3D Scene Graphs is essential for robust indoor navigation and mapping. These graphs provide a hierarchical metric-semantic representation in which such concepts are organized. To further enhance graph-SLAM performance, Factorized 3D Scene Graphs incorporate these concepts as optimization factors that constrain relative geometry and enforce global consistency. However, both stages of this process remain largely manual: concepts are typically derived using hand-crafted, concept-specific heuristics, while factors and their covariances are likewise manually designed. This reliance on manual specification limits generalization across diverse environments and scalability to new concept classes. This paper presents, for the first time, a learning-based method to generate online spatial emergent concepts as optimizable factors within a SLAM backend, reducing the need to handcraft both concept generation and the definition of their corresponding factors and covariances. In both simulated and real indoor scenarios, our approach improves complex concept detection by 20.7% and 5.3%, trajectory estimation by 19.2%, and map reconstruction by 12.3% and 3.8%, respectively, highlighting the benefits of this integration for robust and adaptive spatial understanding.
- Abstract(参考訳): 3D Scene Graphs内の原始的な幾何学的観測(例えば平面面)から、創発的な空間概念(例えば部屋)を自律的に発見できるようにするロボットは、堅牢な屋内ナビゲーションとマッピングに不可欠である。
これらのグラフは、そのような概念が組織化される階層的な計量-意味表現を提供する。
グラフ-SLAMの性能をさらに向上するため、Factized 3D Scene Graphsはこれらの概念を、相対幾何学を制約し、グローバルな一貫性を強制する最適化要因として取り入れている。
しかし、この過程のどちらの段階も概ね手作業であり、概念は通常手作りの、概念固有のヒューリスティックを用いて導出され、因子とその共分散は同様に手作業で設計される。
この手動仕様への依存は、様々な環境における一般化と、新しい概念クラスへの拡張性を制限している。
本稿では,オンライン空間創発概念をSLAMバックエンド内で最適化可能な要素として生成する学習手法を初めて提案する。
シミュレーションと実際の屋内シナリオの両方において,本手法は複雑な概念検出を20.7%,5.3%,軌跡推定を19.2%,地図再構成を12.3%,地図再構成を3.8%改善し,堅牢性および適応性のある空間理解のためのこの統合の利点を強調した。
関連論文リスト
- SegSplat: Feed-forward Gaussian Splatting and Open-Set Semantic Segmentation [114.57192386025373]
SegSplatは、高速でフィードフォワードな3D再構成とリッチでオープンなセマンティック理解のギャップを埋めるために設計された、新しいフレームワークである。
この研究は、意味的に認識された3D環境の実践的でオンザフライな生成に向けた重要なステップである。
論文 参考訳(メタデータ) (2025-11-23T10:26:38Z) - GrOCE:Graph-Guided Online Concept Erasure for Text-to-Image Diffusion Models [24.278300091974085]
概念消去は、テキストから画像への拡散モデルから有害、不適切、または著作権のあるコンテンツを除去することを目的としている。
本稿では,GrOCE(Graph-Guided Online Concept Erasure)を提案する。
論文 参考訳(メタデータ) (2025-11-17T04:47:16Z) - Object-Centric Representation Learning for Enhanced 3D Scene Graph Prediction [3.7471945679132594]
3Dセマンティックシーングラフ予測は、3Dシーンにおけるオブジェクトとその意味的関係を検出することを目的としている。
これまでの研究はデータセットの制限に対処し、Open-Vocabulary設定など、さまざまなアプローチを模索してきた。
本研究では,オブジェクトの特徴の質が全体のシーングラフの精度を決定する上で重要な役割を担っていることを示す。
論文 参考訳(メタデータ) (2025-10-06T11:33:09Z) - Hierarchical Neural Semantic Representation for 3D Semantic Correspondence [72.8101601086805]
階層型ニューラルセマンティック表現(HNSR)を設計し,高次構造と多分解能局所幾何学的特徴を捉える。
第2に,グローバルなセマンティック特徴を用いた粗いセマンティック対応を確立する,プログレッシブなグローバル-ローカルマッチング戦略を設計する。
第3に,本フレームワークはトレーニングフリーで,様々なトレーニング済みの3D生成バックボーンと広範囲に互換性があり,多様な形状カテゴリにまたがる強力な一般化が示されている。
論文 参考訳(メタデータ) (2025-09-22T07:23:07Z) - Graph Concept Bottleneck Models [26.57626285653119]
概念ボトルネックモデル (Concept Bottleneck Models, CBM) は、概念を通したディープニューラルネットワークの明確な解釈を提供する。
提案するグラフCBMは,潜在概念グラフを構築することで概念関係を容易にするCBMの新たな変種である。
論文 参考訳(メタデータ) (2025-08-19T20:23:18Z) - Cross-Modal Geometric Hierarchy Fusion: An Implicit-Submap Driven Framework for Resilient 3D Place Recognition [9.411542547451193]
本稿では,密度に依存しない幾何学的推論により3次元位置認識を再定義するフレームワークを提案する。
具体的には、元のシーンポイント雲密度の干渉に免疫する弾性点に基づく暗黙の3次元表現を導入する。
これら2種類の情報を活用することで,鳥眼視と3Dセグメントの両視点から幾何学的情報を融合する記述子を得る。
論文 参考訳(メタデータ) (2025-06-17T07:04:07Z) - Interpretable 3D Neural Object Volumes for Robust Conceptual Reasoning [68.3379650993108]
CAVE(Concept Aware Volumes for Explanations)は、画像分類における解釈可能性と堅牢性を統一する新しい方向である。
本稿では,概念の空間的整合性を測定する尺度である3次元整合性(3D-C)を提案する。
CAVEは、様々なOOD設定における画像間の一貫性と意味のある概念を発見しながら、競争力のある分類性能を達成する。
論文 参考訳(メタデータ) (2025-03-17T17:55:15Z) - ALOcc: Adaptive Lifting-Based 3D Semantic Occupancy and Cost Volume-Based Flow Predictions [91.55655961014027]
シーン理解には3次元セマンティック占有とフロー予測が不可欠である。
本稿では,3つの改善点を目標とした視覚ベースのフレームワークを提案する。
我々の純粋な畳み込みアーキテクチャは、セマンティック占有率とジョイントセマンティックフロー予測の両方のために、複数のベンチマーク上で新しいSOTA性能を確立する。
論文 参考訳(メタデータ) (2024-11-12T11:32:56Z) - Structural Causality-based Generalizable Concept Discovery Models [29.932706137805713]
本稿では,変動オートエンコーダ(VAE)を用いて,与えられたデータセットに対して相互独立な生成因子を学習するためのアンタングル機構を提案する。
本手法は,生成因子から概念への因果関係を指向した2部グラフを形成するために生成因子と概念を仮定する。
提案手法は, 特定の下流タスクにおいて, 因果的要因からよく説明されるタスク固有の概念をうまく学習する。
論文 参考訳(メタデータ) (2024-10-20T20:09:47Z) - Graph Pooling via Ricci Flow [1.1126342180866644]
グラフプーリング演算子(ORC-Pool)を導入し,Ollivierの離散リッチ曲率とそれに付随する幾何流によるグラフの幾何学的特徴付けを利用する。
ORC-Poolはそのようなクラスタリングアプローチを属性付きグラフに拡張し、幾何学的粗大化をプール層としてグラフニューラルネットワークに統合する。
論文 参考訳(メタデータ) (2024-07-05T03:26:37Z) - LSEnet: Lorentz Structural Entropy Neural Network for Deep Graph Clustering [59.89626219328127]
グラフクラスタリングは機械学習の基本的な問題である。
近年、ディープラーニング手法は最先端の成果を達成しているが、事前に定義されたクラスタ番号なしでは動作できない。
本稿では,グラフ情報理論の新たな視点からこの問題に対処することを提案する。
論文 参考訳(メタデータ) (2024-05-20T05:46:41Z) - GeoWizard: Unleashing the Diffusion Priors for 3D Geometry Estimation from a Single Image [94.56927147492738]
単一画像から幾何学的属性を推定するための新しい生成基盤モデルであるGeoWizardを紹介する。
拡散前処理の活用は,資源利用における一般化,詳細な保存,効率性を著しく向上させることが示唆された。
本稿では,様々なシーンの複雑なデータ分布を,個別のサブディストリビューションに分離する,シンプルかつ効果的な戦略を提案する。
論文 参考訳(メタデータ) (2024-03-18T17:50:41Z) - S^2Former-OR: Single-Stage Bi-Modal Transformer for Scene Graph Generation in OR [50.435592120607815]
外科手術のシーングラフ生成(SGG)は、手術室(OR)におけるホモロジー認知知能の増強に不可欠である
これまでの研究は主に多段階学習に依存しており、生成したセマンティックシーングラフはポーズ推定とオブジェクト検出を伴う中間プロセスに依存している。
本研究では,S2Former-OR(S2Former-OR)と呼ばれるORにおけるSGGのための新しいシングルステージバイモーダルトランスフォーマフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-22T11:40:49Z) - Graph Transformer GANs with Graph Masked Modeling for Architectural
Layout Generation [153.92387500677023]
本稿では,グラフノード関係を効果的に学習するために,GTGAN(Graph Transformer Generative Adversarial Network)を提案する。
提案したグラフ変換器エンコーダは、局所的およびグローバルな相互作用をモデル化するために、Transformer内のグラフ畳み込みと自己アテンションを組み合わせる。
また,グラフ表現学習のための自己指導型事前学習手法を提案する。
論文 参考訳(メタデータ) (2024-01-15T14:36:38Z) - Graph Transformer GANs for Graph-Constrained House Generation [223.739067413952]
本稿では,グラフノード関係を効果的に学習するために,GTGAN(Graph Transformer Generative Adversarial Network)を提案する。
GTGANは、グラフ制約のある住宅生成タスクにおいて、エンドツーエンドで効率的なグラフノード関係を学習する。
論文 参考訳(メタデータ) (2023-03-14T20:35:45Z) - Graph Neural Networks with Feature and Structure Aware Random Walk [7.143879014059894]
典型的な好適なグラフでは、エッジを指向する可能性があり、エッジをそのまま扱うか、あるいは単純に非指向にするかは、GNNモデルの性能に大きな影響を与える。
そこで我々は,グラフの方向性を適応的に学習するモデルを開発し,ノード間の長距離相関を生かした。
論文 参考訳(メタデータ) (2021-11-19T08:54:21Z) - Factorizable Graph Convolutional Networks [90.59836684458905]
本稿では,グラフに符号化された相互に絡み合った関係を明示的に解消する新しいグラフ畳み込みネットワーク(GCN)を提案する。
FactorGCNは単純なグラフを入力として取り、それをいくつかの分解グラフに分解する。
提案したFacterGCNは,合成および実世界のデータセットに対して質的かつ定量的に評価する。
論文 参考訳(メタデータ) (2020-10-12T03:01:40Z) - Tensor Graph Convolutional Networks for Multi-relational and Robust
Learning [74.05478502080658]
本稿では,テンソルで表されるグラフの集合に関連するデータから,スケーラブルな半教師付き学習(SSL)を実現するためのテンソルグラフ畳み込みネットワーク(TGCN)を提案する。
提案アーキテクチャは、標準的なGCNと比較して大幅に性能が向上し、最先端の敵攻撃に対処し、タンパク質間相互作用ネットワーク上でのSSL性能が著しく向上する。
論文 参考訳(メタデータ) (2020-03-15T02:33:21Z) - Geom-GCN: Geometric Graph Convolutional Networks [15.783571061254847]
本稿では,この2つの弱点を克服するために,グラフニューラルネットワークのための新しい幾何集約手法を提案する。
提案したアグリゲーションスキームは置換不変であり、ノード埋め込み、構造近傍、二レベルアグリゲーションという3つのモジュールから構成される。
また,このスキームをGeom-GCNと呼ばれるグラフ畳み込みネットワークに実装し,グラフ上でトランスダクティブ学習を行う。
論文 参考訳(メタデータ) (2020-02-13T00:03:09Z) - EdgeNets:Edge Varying Graph Neural Networks [179.99395949679547]
本稿では、EdgeNetの概念を通じて、最先端グラフニューラルネットワーク(GNN)を統一する一般的なフレームワークを提案する。
EdgeNetはGNNアーキテクチャであり、異なるノードが異なるパラメータを使って異なる隣人の情報を測定することができる。
これは、ノードが実行でき、既存のグラフ畳み込みニューラルネットワーク(GCNN)とグラフアテンションネットワーク(GAT)の1つの定式化の下で包含できる一般的な線形で局所的な操作である。
論文 参考訳(メタデータ) (2020-01-21T15:51:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。