論文の概要: Metric-Semantic Factor Graph Generation based on Graph Neural Networks
- arxiv url: http://arxiv.org/abs/2409.11972v1
- Date: Wed, 18 Sep 2024 13:24:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-09-19 17:36:39.583750
- Title: Metric-Semantic Factor Graph Generation based on Graph Neural Networks
- Title(参考訳): グラフニューラルネットワークを用いたメトリック・セマンティック因子グラフ生成
- Authors: Jose Andres Millan-Romera, Hriday Bavle, Muhammad Shaheer, Holger Voos, Jose Luis Sanchez-Lopez,
- Abstract要約: 屋内では、平面の相対的な位置決めのような空間的制約は、レイアウトのばらつきにもかかわらず一貫している。
本稿では,部屋や壁といった高レベルな概念を表現することによって,これらの不変関係をグラフSLAMフレームワークで捉える方法について検討する。
いくつかの取り組みは、各概念生成のためのアドホックなソリューションと、手動で定義された要素によってこの問題に対処してきた。
本稿では,意味的シーングラフの定義,幾何学的情報の統合,相互接続因子の学習を含む,距離-意味因子グラフ生成のための新しい手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding the relationships between geometric structures and semantic concepts is crucial for building accurate models of complex environments. In indoors, certain spatial constraints, such as the relative positioning of planes, remain consistent despite variations in layout. This paper explores how these invariant relationships can be captured in a graph SLAM framework by representing high-level concepts like rooms and walls, linking them to geometric elements like planes through an optimizable factor graph. Several efforts have tackled this issue with add-hoc solutions for each concept generation and with manually-defined factors. This paper proposes a novel method for metric-semantic factor graph generation which includes defining a semantic scene graph, integrating geometric information, and learning the interconnecting factors, all based on Graph Neural Networks (GNNs). An edge classification network (G-GNN) sorts the edges between planes into same room, same wall or none types. The resulting relations are clustered, generating a room or wall for each cluster. A second family of networks (F-GNN) infers the geometrical origin of the new nodes. The definition of the factors employs the same F-GNN used for the metric attribute of the generated nodes. Furthermore, share the new factor graph with the S-Graphs+ algorithm, extending its graph expressiveness and scene representation with the ultimate goal of improving the SLAM performance. The complexity of the environments is increased to N-plane rooms by training the networks on L-shaped rooms. The framework is evaluated in synthetic and simulated scenarios as no real datasets of the required complex layouts are available.
- Abstract(参考訳): 幾何学構造と意味概念の関係を理解することは、複雑な環境の正確なモデルを構築する上で重要である。
屋内では、平面の相対的な位置決めのような空間的制約は、レイアウトのばらつきにもかかわらず一貫している。
本稿では,空間や壁といった高次概念を表現し,最適化可能な因子グラフを通じて平面などの幾何学的要素にリンクすることにより,これらの不変関係をグラフSLAMフレームワークで捉える方法について検討する。
いくつかの取り組みは、各概念生成のためのアドホックなソリューションと、手動で定義された要素によってこの問題に対処してきた。
本稿では,意味的シーングラフの定義,幾何学的情報の統合,およびグラフニューラルネットワーク(GNN)に基づく相互接続因子の学習を含む,メトリック・セマンティック・ファクターグラフ生成のための新しい手法を提案する。
エッジ分類ネットワーク(G-GNN)は、平面間のエッジを同じ部屋、同じ壁、または全くのタイプに分類する。
結果として生成された関係はクラスタ化され、各クラスタの部屋や壁を生成する。
第2のネットワークファミリー(F-GNN)は、新しいノードの幾何学的起源を推測する。
因子の定義は、生成されたノードのメートル法属性に使用されるのと同じF-GNNを使用する。
さらに、新しい因子グラフをS-Graphs+アルゴリズムと共有し、そのグラフ表現性とシーン表現を拡張し、SLAM性能を改善するという究極の目標を達成した。
環境の複雑さは、L字型の部屋のネットワークを訓練することで、N面の部屋へと増大する。
このフレームワークは、複雑なレイアウトの実際のデータセットが利用できないため、合成およびシミュレートされたシナリオで評価される。
関連論文リスト
- SegSplat: Feed-forward Gaussian Splatting and Open-Set Semantic Segmentation [114.57192386025373]
SegSplatは、高速でフィードフォワードな3D再構成とリッチでオープンなセマンティック理解のギャップを埋めるために設計された、新しいフレームワークである。
この研究は、意味的に認識された3D環境の実践的でオンザフライな生成に向けた重要なステップである。
論文 参考訳(メタデータ) (2025-11-23T10:26:38Z) - GrOCE:Graph-Guided Online Concept Erasure for Text-to-Image Diffusion Models [24.278300091974085]
概念消去は、テキストから画像への拡散モデルから有害、不適切、または著作権のあるコンテンツを除去することを目的としている。
本稿では,GrOCE(Graph-Guided Online Concept Erasure)を提案する。
論文 参考訳(メタデータ) (2025-11-17T04:47:16Z) - Object-Centric Representation Learning for Enhanced 3D Scene Graph Prediction [3.7471945679132594]
3Dセマンティックシーングラフ予測は、3Dシーンにおけるオブジェクトとその意味的関係を検出することを目的としている。
これまでの研究はデータセットの制限に対処し、Open-Vocabulary設定など、さまざまなアプローチを模索してきた。
本研究では,オブジェクトの特徴の質が全体のシーングラフの精度を決定する上で重要な役割を担っていることを示す。
論文 参考訳(メタデータ) (2025-10-06T11:33:09Z) - Hierarchical Neural Semantic Representation for 3D Semantic Correspondence [72.8101601086805]
階層型ニューラルセマンティック表現(HNSR)を設計し,高次構造と多分解能局所幾何学的特徴を捉える。
第2に,グローバルなセマンティック特徴を用いた粗いセマンティック対応を確立する,プログレッシブなグローバル-ローカルマッチング戦略を設計する。
第3に,本フレームワークはトレーニングフリーで,様々なトレーニング済みの3D生成バックボーンと広範囲に互換性があり,多様な形状カテゴリにまたがる強力な一般化が示されている。
論文 参考訳(メタデータ) (2025-09-22T07:23:07Z) - Graph Concept Bottleneck Models [26.57626285653119]
概念ボトルネックモデル (Concept Bottleneck Models, CBM) は、概念を通したディープニューラルネットワークの明確な解釈を提供する。
提案するグラフCBMは,潜在概念グラフを構築することで概念関係を容易にするCBMの新たな変種である。
論文 参考訳(メタデータ) (2025-08-19T20:23:18Z) - Cross-Modal Geometric Hierarchy Fusion: An Implicit-Submap Driven Framework for Resilient 3D Place Recognition [9.411542547451193]
本稿では,密度に依存しない幾何学的推論により3次元位置認識を再定義するフレームワークを提案する。
具体的には、元のシーンポイント雲密度の干渉に免疫する弾性点に基づく暗黙の3次元表現を導入する。
これら2種類の情報を活用することで,鳥眼視と3Dセグメントの両視点から幾何学的情報を融合する記述子を得る。
論文 参考訳(メタデータ) (2025-06-17T07:04:07Z) - Interpretable 3D Neural Object Volumes for Robust Conceptual Reasoning [68.3379650993108]
CAVE(Concept Aware Volumes for Explanations)は、画像分類における解釈可能性と堅牢性を統一する新しい方向である。
本稿では,概念の空間的整合性を測定する尺度である3次元整合性(3D-C)を提案する。
CAVEは、様々なOOD設定における画像間の一貫性と意味のある概念を発見しながら、競争力のある分類性能を達成する。
論文 参考訳(メタデータ) (2025-03-17T17:55:15Z) - ALOcc: Adaptive Lifting-Based 3D Semantic Occupancy and Cost Volume-Based Flow Predictions [91.55655961014027]
シーン理解には3次元セマンティック占有とフロー予測が不可欠である。
本稿では,3つの改善点を目標とした視覚ベースのフレームワークを提案する。
我々の純粋な畳み込みアーキテクチャは、セマンティック占有率とジョイントセマンティックフロー予測の両方のために、複数のベンチマーク上で新しいSOTA性能を確立する。
論文 参考訳(メタデータ) (2024-11-12T11:32:56Z) - Structural Causality-based Generalizable Concept Discovery Models [29.932706137805713]
本稿では,変動オートエンコーダ(VAE)を用いて,与えられたデータセットに対して相互独立な生成因子を学習するためのアンタングル機構を提案する。
本手法は,生成因子から概念への因果関係を指向した2部グラフを形成するために生成因子と概念を仮定する。
提案手法は, 特定の下流タスクにおいて, 因果的要因からよく説明されるタスク固有の概念をうまく学習する。
論文 参考訳(メタデータ) (2024-10-20T20:09:47Z) - Graph Pooling via Ricci Flow [1.1126342180866644]
グラフプーリング演算子(ORC-Pool)を導入し,Ollivierの離散リッチ曲率とそれに付随する幾何流によるグラフの幾何学的特徴付けを利用する。
ORC-Poolはそのようなクラスタリングアプローチを属性付きグラフに拡張し、幾何学的粗大化をプール層としてグラフニューラルネットワークに統合する。
論文 参考訳(メタデータ) (2024-07-05T03:26:37Z) - LSEnet: Lorentz Structural Entropy Neural Network for Deep Graph Clustering [59.89626219328127]
グラフクラスタリングは機械学習の基本的な問題である。
近年、ディープラーニング手法は最先端の成果を達成しているが、事前に定義されたクラスタ番号なしでは動作できない。
本稿では,グラフ情報理論の新たな視点からこの問題に対処することを提案する。
論文 参考訳(メタデータ) (2024-05-20T05:46:41Z) - GeoWizard: Unleashing the Diffusion Priors for 3D Geometry Estimation from a Single Image [94.56927147492738]
単一画像から幾何学的属性を推定するための新しい生成基盤モデルであるGeoWizardを紹介する。
拡散前処理の活用は,資源利用における一般化,詳細な保存,効率性を著しく向上させることが示唆された。
本稿では,様々なシーンの複雑なデータ分布を,個別のサブディストリビューションに分離する,シンプルかつ効果的な戦略を提案する。
論文 参考訳(メタデータ) (2024-03-18T17:50:41Z) - S^2Former-OR: Single-Stage Bi-Modal Transformer for Scene Graph Generation in OR [50.435592120607815]
外科手術のシーングラフ生成(SGG)は、手術室(OR)におけるホモロジー認知知能の増強に不可欠である
これまでの研究は主に多段階学習に依存しており、生成したセマンティックシーングラフはポーズ推定とオブジェクト検出を伴う中間プロセスに依存している。
本研究では,S2Former-OR(S2Former-OR)と呼ばれるORにおけるSGGのための新しいシングルステージバイモーダルトランスフォーマフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-22T11:40:49Z) - Graph Transformer GANs with Graph Masked Modeling for Architectural
Layout Generation [153.92387500677023]
本稿では,グラフノード関係を効果的に学習するために,GTGAN(Graph Transformer Generative Adversarial Network)を提案する。
提案したグラフ変換器エンコーダは、局所的およびグローバルな相互作用をモデル化するために、Transformer内のグラフ畳み込みと自己アテンションを組み合わせる。
また,グラフ表現学習のための自己指導型事前学習手法を提案する。
論文 参考訳(メタデータ) (2024-01-15T14:36:38Z) - Graph Transformer GANs for Graph-Constrained House Generation [223.739067413952]
本稿では,グラフノード関係を効果的に学習するために,GTGAN(Graph Transformer Generative Adversarial Network)を提案する。
GTGANは、グラフ制約のある住宅生成タスクにおいて、エンドツーエンドで効率的なグラフノード関係を学習する。
論文 参考訳(メタデータ) (2023-03-14T20:35:45Z) - Graph Neural Networks with Feature and Structure Aware Random Walk [7.143879014059894]
典型的な好適なグラフでは、エッジを指向する可能性があり、エッジをそのまま扱うか、あるいは単純に非指向にするかは、GNNモデルの性能に大きな影響を与える。
そこで我々は,グラフの方向性を適応的に学習するモデルを開発し,ノード間の長距離相関を生かした。
論文 参考訳(メタデータ) (2021-11-19T08:54:21Z) - Factorizable Graph Convolutional Networks [90.59836684458905]
本稿では,グラフに符号化された相互に絡み合った関係を明示的に解消する新しいグラフ畳み込みネットワーク(GCN)を提案する。
FactorGCNは単純なグラフを入力として取り、それをいくつかの分解グラフに分解する。
提案したFacterGCNは,合成および実世界のデータセットに対して質的かつ定量的に評価する。
論文 参考訳(メタデータ) (2020-10-12T03:01:40Z) - Tensor Graph Convolutional Networks for Multi-relational and Robust
Learning [74.05478502080658]
本稿では,テンソルで表されるグラフの集合に関連するデータから,スケーラブルな半教師付き学習(SSL)を実現するためのテンソルグラフ畳み込みネットワーク(TGCN)を提案する。
提案アーキテクチャは、標準的なGCNと比較して大幅に性能が向上し、最先端の敵攻撃に対処し、タンパク質間相互作用ネットワーク上でのSSL性能が著しく向上する。
論文 参考訳(メタデータ) (2020-03-15T02:33:21Z) - Geom-GCN: Geometric Graph Convolutional Networks [15.783571061254847]
本稿では,この2つの弱点を克服するために,グラフニューラルネットワークのための新しい幾何集約手法を提案する。
提案したアグリゲーションスキームは置換不変であり、ノード埋め込み、構造近傍、二レベルアグリゲーションという3つのモジュールから構成される。
また,このスキームをGeom-GCNと呼ばれるグラフ畳み込みネットワークに実装し,グラフ上でトランスダクティブ学習を行う。
論文 参考訳(メタデータ) (2020-02-13T00:03:09Z) - EdgeNets:Edge Varying Graph Neural Networks [179.99395949679547]
本稿では、EdgeNetの概念を通じて、最先端グラフニューラルネットワーク(GNN)を統一する一般的なフレームワークを提案する。
EdgeNetはGNNアーキテクチャであり、異なるノードが異なるパラメータを使って異なる隣人の情報を測定することができる。
これは、ノードが実行でき、既存のグラフ畳み込みニューラルネットワーク(GCNN)とグラフアテンションネットワーク(GAT)の1つの定式化の下で包含できる一般的な線形で局所的な操作である。
論文 参考訳(メタデータ) (2020-01-21T15:51:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。