論文の概要: Unconditional Scene Graph Generation
- arxiv url: http://arxiv.org/abs/2108.05884v1
- Date: Thu, 12 Aug 2021 17:57:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-13 14:30:29.451168
- Title: Unconditional Scene Graph Generation
- Title(参考訳): 非条件シーングラフ生成
- Authors: Sarthak Garg, Helisa Dhamo, Azade Farshad, Sabrina Musatian, Nassir
Navab, Federico Tombari
- Abstract要約: 我々はラベル付きおよび有向グラフ上の確率分布を学習できるSceneGraphGenと呼ばれる深層自己回帰モデルを開発した。
SceneGraphGenによって生成されたシーングラフは多様であり、実世界のシーンのセマンティックなパターンに従う。
- 参考スコア(独自算出の注目度): 72.53624470737712
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite recent advancements in single-domain or single-object image
generation, it is still challenging to generate complex scenes containing
diverse, multiple objects and their interactions. Scene graphs, composed of
nodes as objects and directed-edges as relationships among objects, offer an
alternative representation of a scene that is more semantically grounded than
images. We hypothesize that a generative model for scene graphs might be able
to learn the underlying semantic structure of real-world scenes more
effectively than images, and hence, generate realistic novel scenes in the form
of scene graphs. In this work, we explore a new task for the unconditional
generation of semantic scene graphs. We develop a deep auto-regressive model
called SceneGraphGen which can directly learn the probability distribution over
labelled and directed graphs using a hierarchical recurrent architecture. The
model takes a seed object as input and generates a scene graph in a sequence of
steps, each step generating an object node, followed by a sequence of
relationship edges connecting to the previous nodes. We show that the scene
graphs generated by SceneGraphGen are diverse and follow the semantic patterns
of real-world scenes. Additionally, we demonstrate the application of the
generated graphs in image synthesis, anomaly detection and scene graph
completion.
- Abstract(参考訳): 単一ドメインや単一オブジェクトの画像生成の進歩にもかかわらず、多様な複数のオブジェクトとその相互作用を含む複雑なシーンを生成することは依然として困難である。
オブジェクトとしてのノードとオブジェクト間の関係としての有向エッジで構成されるシーングラフは、イメージよりも意味的に接地されたシーンの代替表現を提供する。
我々は,シーングラフの生成モデルが,実世界のシーンの基盤となる意味構造を,画像よりも効果的に学習できるかもしれないことを仮定し,シーングラフの形で現実的な新しいシーンを生成する。
本研究では,セマンティックシーングラフの非条件生成のための新しいタスクについて検討する。
階層的リカレントアーキテクチャを用いてラベル付きおよび有向グラフ上の確率分布を直接学習できる,scenegraphgenと呼ばれる深い自己回帰モデルを開発した。
モデルはシードオブジェクトを入力として、ステップのシーケンスでシーングラフを生成し、各ステップがオブジェクトノードを生成し、その後、前のノードに接続する関係エッジのシーケンスを生成する。
SceneGraphGenによって生成されたシーングラフは多様であり、実世界のシーンのセマンティックなパターンに従う。
さらに,生成したグラフの画像合成,異常検出,シーングラフ補完への応用を実演する。
関連論文リスト
- Scene Graph Disentanglement and Composition for Generalizable Complex Image Generation [44.457347230146404]
我々は、複雑な画像生成に強力な構造化表現であるシーングラフを利用する。
本稿では,変分オートエンコーダと拡散モデルの生成能力を一般化可能な方法で活用する。
本手法は,テキスト,レイアウト,シーングラフに基づいて,近年の競合より優れています。
論文 参考訳(メタデータ) (2024-10-01T07:02:46Z) - Joint Generative Modeling of Scene Graphs and Images via Diffusion
Models [37.788957749123725]
共同シーングラフ - 画像生成という,新しい生成タスクを提案する。
本稿では,隣接行列と不均一なノードとエッジ属性を併用した新しい拡散モデルDiffuseSGを提案する。
グラフ変換器をデノイザとし、DiffuseSGは連続空間におけるシーングラフ表現を連続的にデノイズし、最終表現を識別してクリーンなシーングラフを生成する。
論文 参考訳(メタデータ) (2024-01-02T10:10:29Z) - Iterative Scene Graph Generation with Generative Transformers [6.243995448840211]
シーングラフは、エンティティ(オブジェクト)とその空間関係をグラフィカルなフォーマットで符号化することで、シーンのリッチで構造化された表現を提供する。
現在のアプローチでは、シーン内のオブジェクト間のすべての可能なエッジのラベル付けを通じてシーングラフを生成する、世代別分類アプローチを採用している。
この研究は、リンク予測を超えたシーングラフを生成するための生成トランスフォーマーベースのアプローチを導入する。
論文 参考訳(メタデータ) (2022-11-30T00:05:44Z) - Diffusion-Based Scene Graph to Image Generation with Masked Contrastive
Pre-Training [112.94542676251133]
画像とのアライメントを直接最適化することで,シーングラフの埋め込みを学習する。
具体的には,シーングラフからグローバル情報とローカル情報の両方を抽出するエンコーダを事前訓練する。
SGDiffと呼ばれる結果の方法は、シーングラフノードと接続を変更することによって生成された画像のセマンティックな操作を可能にする。
論文 参考訳(メタデータ) (2022-11-21T01:11:19Z) - Scene Graph Modification as Incremental Structure Expanding [61.84291817776118]
本研究では,既存のシーングラフを自然言語クエリに基づいて更新する方法を学習するために,シーングラフ修正(SGM)に注目した。
インクリメンタル構造拡張(ISE)の導入によるグラフ拡張タスクとしてのSGM
既存のデータセットよりも複雑なクエリと大きなシーングラフを含む、挑戦的なデータセットを構築します。
論文 参考訳(メタデータ) (2022-09-15T16:26:14Z) - Iterative Scene Graph Generation [55.893695946885174]
シーングラフ生成は、オブジェクトエンティティとその対応する相互作用述語を所定の画像(またはビデオ)で識別する。
シーングラフ生成への既存のアプローチは、推定イテレーションの実現を可能にするために、関節分布の特定の因子化を前提としている。
本稿では,この制限に対処する新しいフレームワークを提案するとともに,画像に動的条件付けを導入する。
論文 参考訳(メタデータ) (2022-07-27T10:37:29Z) - Graph-to-3D: End-to-End Generation and Manipulation of 3D Scenes Using
Scene Graphs [85.54212143154986]
制御可能なシーン合成は、基本的な仕様を満たす3D情報を生成することで構成される。
シーングラフは、オブジェクト(ノード)とオブジェクト間の関係(エッジ)からなるシーンの表現である
本稿では,シーングラフから形状を直接エンドツーエンドに生成する手法を提案する。
論文 参考訳(メタデータ) (2021-08-19T17:59:07Z) - Bridging Knowledge Graphs to Generate Scene Graphs [49.69377653925448]
本稿では,2つのグラフ間の情報伝達を反復的に行う新しいグラフベースニューラルネットワークを提案する。
我々のグラフブリッジネットワークであるGB-Netは、エッジとノードを連続的に推論し、相互接続されたシーンとコモンセンスグラフのリッチでヘテロジニアスな構造を同時に活用し、洗練する。
論文 参考訳(メタデータ) (2020-01-07T23:35:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。