論文の概要: GEMS: Scene Expansion using Generative Models of Graphs
- arxiv url: http://arxiv.org/abs/2207.03729v1
- Date: Fri, 8 Jul 2022 07:41:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-11 14:09:19.417594
- Title: GEMS: Scene Expansion using Generative Models of Graphs
- Title(参考訳): GEMS:グラフの生成モデルを用いたシーン拡張
- Authors: Rishi Agarwal, Tirupati Saketh Chandra, Vaidehi Patil, Aniruddha
Mahapatra, Kuldeep Kulkarni, Vishwa Vinay
- Abstract要約: 本稿では,その表現,シーングラフに着目し,新たなシーン拡張タスクを提案する。
まず、まず新しいノードを予測し、次にグラフ内の新しく予測されたノードと以前のノードの関係を予測します。
我々は、拡張されたシーングラフを評価するために、Visual GenomeとVRDデータセットに関する広範な実験を行う。
- 参考スコア(独自算出の注目度): 3.5998698847215165
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Applications based on image retrieval require editing and associating in
intermediate spaces that are representative of the high-level concepts like
objects and their relationships rather than dense, pixel-level representations
like RGB images or semantic-label maps. We focus on one such representation,
scene graphs, and propose a novel scene expansion task where we enrich an input
seed graph by adding new nodes (objects) and the corresponding relationships.
To this end, we formulate scene graph expansion as a sequential prediction task
involving multiple steps of first predicting a new node and then predicting the
set of relationships between the newly predicted node and previous nodes in the
graph. We propose a sequencing strategy for observed graphs that retains the
clustering patterns amongst nodes. In addition, we leverage external knowledge
to train our graph generation model, enabling greater generalization of node
predictions. Due to the inefficiency of existing maximum mean discrepancy (MMD)
based metrics for graph generation problems in evaluating predicted
relationships between nodes (objects), we design novel metrics that
comprehensively evaluate different aspects of predicted relations. We conduct
extensive experiments on Visual Genome and VRD datasets to evaluate the
expanded scene graphs using the standard MMD-based metrics and our proposed
metrics. We observe that the graphs generated by our method, GEMS, better
represent the real distribution of the scene graphs than the baseline methods
like GraphRNN.
- Abstract(参考訳): 画像検索に基づくアプリケーションは、RGB画像やセマンティックラベルマップのような密度の高いピクセルレベルの表現ではなく、オブジェクトやそれらの関係のような高レベルな概念を表す中間空間の編集と連想を必要とする。
我々は,このような表現であるシーングラフに注目し,新たなノード(オブジェクト)と対応する関係を追加することにより,入力シードグラフを充実させる新たなシーン展開タスクを提案する。
そこで我々は,まず新しいノードを予測し,新たに予測されたノードとグラフ内の前のノードとの関係を予測するための複数のステップを含む逐次予測タスクとしてシーングラフの拡張を定式化する。
本稿では,ノード間のクラスタリングパターンを保持する観察グラフのシーケンシング戦略を提案する。
さらに、外部知識を活用してグラフ生成モデルをトレーニングし、ノード予測をより一般化します。
ノード間の予測関係(オブジェクト)の評価におけるグラフ生成問題に対する既存の最大平均差分法(MMD)に基づくメトリクスの不効率のため、予測関係の異なる側面を包括的に評価する新しいメトリクスを設計する。
視覚ゲノムとvrdデータセットに関する広範な実験を行い、標準mmdベースのメトリクスと提案するメトリクスを用いて拡張されたシーングラフを評価した。
提案手法であるGEMSにより生成されたグラフは,GraphRNNのようなベースライン法よりもシーングラフの実際の分布をよりよく表現する。
関連論文リスト
- Graph Transformer GANs with Graph Masked Modeling for Architectural
Layout Generation [153.92387500677023]
本稿では,グラフノード関係を効果的に学習するために,GTGAN(Graph Transformer Generative Adversarial Network)を提案する。
提案したグラフ変換器エンコーダは、局所的およびグローバルな相互作用をモデル化するために、Transformer内のグラフ畳み込みと自己アテンションを組み合わせる。
また,グラフ表現学習のための自己指導型事前学習手法を提案する。
論文 参考訳(メタデータ) (2024-01-15T14:36:38Z) - Graph Transformer GANs for Graph-Constrained House Generation [223.739067413952]
本稿では,グラフノード関係を効果的に学習するために,GTGAN(Graph Transformer Generative Adversarial Network)を提案する。
GTGANは、グラフ制約のある住宅生成タスクにおいて、エンドツーエンドで効率的なグラフノード関係を学習する。
論文 参考訳(メタデータ) (2023-03-14T20:35:45Z) - GrannGAN: Graph annotation generative adversarial networks [72.66289932625742]
本稿では,高次元分布をモデル化し,グラフスケルトンと整合した複雑な関係特徴構造を持つデータの新しい例を生成することの問題点を考察する。
提案するモデルは,タスクを2つのフェーズに分割することで,各データポイントのグラフ構造に制約されたデータ特徴を生成する問題に対処する。
第一に、与えられたグラフのノードに関連する機能の分布をモデル化し、第二に、ノードのフィーチャに条件付きでエッジ機能を補完する。
論文 参考訳(メタデータ) (2022-12-01T11:49:07Z) - Scene Graph Modification as Incremental Structure Expanding [61.84291817776118]
本研究では,既存のシーングラフを自然言語クエリに基づいて更新する方法を学習するために,シーングラフ修正(SGM)に注目した。
インクリメンタル構造拡張(ISE)の導入によるグラフ拡張タスクとしてのSGM
既存のデータセットよりも複雑なクエリと大きなシーングラフを含む、挑戦的なデータセットを構築します。
論文 参考訳(メタデータ) (2022-09-15T16:26:14Z) - Embedding Graphs on Grassmann Manifold [31.42901131602713]
本稿では,グラスマン多様体に近似した2階グラフ特性を組み込んだ新しいグラフ表現学習手法EGGを提案する。
EGGの有効性はノードレベルとグラフレベルでのクラスタリングと分類タスクの両方を用いて示される。
論文 参考訳(メタデータ) (2022-05-30T12:56:24Z) - A Robust and Generalized Framework for Adversarial Graph Embedding [73.37228022428663]
本稿では,AGE という逆グラフ埋め込みのための頑健なフレームワークを提案する。
AGEは、暗黙の分布から強化された負のサンプルとして偽の隣接ノードを生成する。
本フレームワークでは,3種類のグラフデータを扱う3つのモデルを提案する。
論文 参考訳(メタデータ) (2021-05-22T07:05:48Z) - Graph Entropy Guided Node Embedding Dimension Selection for Graph Neural
Networks [74.26734952400925]
ノード埋め込み次元選択(NEDS)のための最小グラフエントロピー(MinGE)アルゴリズムを提案する。
ミンゲは、グラフ上の特徴エントロピーと構造エントロピーの両方を考えており、それらはそれらのリッチな情報の特徴に従って慎重に設計されている。
ベンチマークデータセット上で人気のグラフニューラルネットワーク(GNN)を用いた実験は,提案したMinGEの有効性と一般化性を示す。
論文 参考訳(メタデータ) (2021-05-07T11:40:29Z) - Optimal Transport Graph Neural Networks [31.191844909335963]
現在のグラフニューラルネットワーク(GNN)アーキテクチャは、集約グラフ表現に平均または総和ノードを埋め込む。
本稿では,パラメトリックプロトタイプを用いたグラフ埋め込み計算モデルOT-GNNを紹介する。
論文 参考訳(メタデータ) (2020-06-08T14:57:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。