論文の概要: HSG: Hyperbolic Scene Graph
- arxiv url: http://arxiv.org/abs/2604.17454v1
- Date: Sun, 19 Apr 2026 14:11:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.532195
- Title: HSG: Hyperbolic Scene Graph
- Title(参考訳): HSG:ハイパーボリックなシーングラフ
- Authors: Liyang Wang, Zeyu Zhang, Hao Tang,
- Abstract要約: シーングラフ表現は、オブジェクトとその関係をモデル化することで、構造化された視覚的理解を可能にする。
MSGのような既存の手法では、ユークリッド空間におけるシーングラフの埋め込みをコントラスト学習とアテンションベースアソシエーションを用いて学習する。
本稿では,階層関係が自然に幾何学的距離で符号化される双曲空間におけるシーングラフの埋め込みを学習するハイパーボリックシーングラフ(HSG)を提案する。
- 参考スコア(独自算出の注目度): 13.342320682399402
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Scene graph representations enable structured visual understanding by modeling objects and their relationships, and have been widely used for multiview and 3D scene reasoning. Existing methods such as MSG learn scene graph embeddings in Euclidean space using contrastive learning and attention based association. However, Euclidean geometry does not explicitly capture hierarchical entailment relationships between places and objects, limiting the structural consistency of learned representations. To address this, we propose Hyperbolic Scene Graph (HSG), which learns scene graph embeddings in hyperbolic space where hierarchical relationships are naturally encoded through geometric distance. Our results show that HSG improves hierarchical structure quality while maintaining strong retrieval performance. The largest gains are observed in graph level metrics: HSG achieves a PP IoU of 33.17 and the highest Graph IoU of 33.51, outperforming the best AoMSG variant (25.37) by 8.14, highlighting the effectiveness of hyperbolic representation learning for scene graph modeling. Code: https://github.com/AIGeeksGroup/HSG.
- Abstract(参考訳): シーングラフ表現は、オブジェクトとその関係をモデル化することで、構造化された視覚的理解を可能にし、マルチビューや3Dシーンの推論に広く利用されている。
MSGのような既存の手法では、ユークリッド空間におけるシーングラフの埋め込みをコントラスト学習とアテンションベースアソシエーションを用いて学習する。
しかしながら、ユークリッド幾何学は、場所と対象の間の階層的包含関係を明示的に捉えておらず、学習された表現の構造的一貫性を制限している。
これを解決するために,階層的関係が自然に幾何学的距離で符号化される双曲空間におけるシーングラフの埋め込みを学習するハイパーボリックシーングラフ(HSG)を提案する。
以上の結果から,HSGは高い検索性能を維持しつつ階層構造の品質を向上させることが示唆された。
HSG は 33.17 の PP IoU と 33.51 のグラフ IoU を達成し、最高の AoMSG 変種 (25.37) を8.14 で上回り、シーングラフモデリングにおける双曲表現学習の有効性を強調している。
コード:https://github.com/AIGeeksGroup/HSG。
関連論文リスト
- Open-Vocabulary Octree-Graph for 3D Scene Understanding [54.11828083068082]
Octree-Graphはオープンな3Dシーン理解のための新しいシーン表現である。
セマンティクスを記憶し、その形状に応じてオブジェクトの占有度を調節するアダプティブ・オクツリー構造を開発する。
論文 参考訳(メタデータ) (2024-11-25T10:14:10Z) - An Efficient Loop and Clique Coarsening Algorithm for Graph Classification [14.602474387096244]
本稿では,GTアーキテクチャ上でのグラフ分類(LCC4GC)の線形複雑度を考慮した効率的なループおよび斜め粗大化アルゴリズムを提案する。
具体的には、完全な構造表現を学ぶために、オリジナル、粗い、変換の3つのユニークなビューを構築します。
8つの実世界のデータセットの実験では、さまざまなアーキテクチャから31のベースラインを越えるLCC4GCの改善が示されている。
論文 参考訳(メタデータ) (2024-04-18T03:03:37Z) - SGFormer: Semantic Graph Transformer for Point Cloud-based 3D Scene
Graph Generation [46.14140601855313]
本稿では,ポイントクラウドベースの3Dシーングラフ生成のためのSGFormer,Semantic Graph TransFormerという新しいモデルを提案する。
このタスクは、ポイントクラウドベースのシーンをセマンティックな構造グラフに解析することを目的としている。
論文 参考訳(メタデータ) (2023-03-20T11:59:23Z) - Scene Graph Modification as Incremental Structure Expanding [61.84291817776118]
本研究では,既存のシーングラフを自然言語クエリに基づいて更新する方法を学習するために,シーングラフ修正(SGM)に注目した。
インクリメンタル構造拡張(ISE)の導入によるグラフ拡張タスクとしてのSGM
既存のデータセットよりも複雑なクエリと大きなシーングラフを含む、挑戦的なデータセットを構築します。
論文 参考訳(メタデータ) (2022-09-15T16:26:14Z) - Hierarchical Graph Networks for 3D Human Pose Estimation [50.600944798627786]
最近の2次元から3次元の人間のポーズ推定は、人間の骨格のトポロジーによって形成されたグラフ構造を利用する傾向がある。
この骨格トポロジーは体の構造を反映するには小さすぎるため、重度の2次元から3次元のあいまいさに悩まされていると我々は主張する。
本稿では,これらの弱点を克服するために,新しいグラフ畳み込みネットワークアーキテクチャである階層グラフネットワークを提案する。
論文 参考訳(メタデータ) (2021-11-23T15:09:03Z) - Spatial-spectral Hyperspectral Image Classification via Multiple Random
Anchor Graphs Ensemble Learning [88.60285937702304]
本稿では,複数のランダムアンカーグラフアンサンブル学習(RAGE)を用いた空間スペクトルHSI分類手法を提案する。
まず、各選択されたバンドのより記述的な特徴を抽出し、局所的な構造と領域の微妙な変化を保存するローカルバイナリパターンを採用する。
次に,アンカーグラフの構成に適応隣接代入を導入し,計算複雑性を低減した。
論文 参考訳(メタデータ) (2021-03-25T09:31:41Z) - Learning 3D Semantic Scene Graphs from 3D Indoor Reconstructions [94.17683799712397]
我々は、グラフ内のシーンのエンティティを整理するデータ構造であるシーングラフに焦点を当てる。
本研究では,シーンの点雲からシーングラフを回帰する学習手法を提案する。
本稿では,3D-3Dおよび2D-3Dマッチングの中間表現としてグラフが機能するドメインに依存しない検索タスクにおける本手法の適用について述べる。
論文 参考訳(メタデータ) (2020-04-08T12:25:25Z) - Bridging Knowledge Graphs to Generate Scene Graphs [49.69377653925448]
本稿では,2つのグラフ間の情報伝達を反復的に行う新しいグラフベースニューラルネットワークを提案する。
我々のグラフブリッジネットワークであるGB-Netは、エッジとノードを連続的に推論し、相互接続されたシーンとコモンセンスグラフのリッチでヘテロジニアスな構造を同時に活用し、洗練する。
論文 参考訳(メタデータ) (2020-01-07T23:35:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。