論文の概要: Bipartite Graph Reasoning GANs for Person Pose and Facial Image
Synthesis
- arxiv url: http://arxiv.org/abs/2211.06719v1
- Date: Sat, 12 Nov 2022 18:27:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 16:11:45.182446
- Title: Bipartite Graph Reasoning GANs for Person Pose and Facial Image
Synthesis
- Title(参考訳): 人物姿勢と顔画像合成のための二部グラフ推論GAN
- Authors: Hao Tang, Ling Shao, Philip H.S. Torr, Nicu Sebe
- Abstract要約: 本稿では、人物のポーズと顔画像合成という2つの課題に対して、生成的敵対ネットワーク(BiGraphGAN)を推論する新しい二部グラフを提案する。
提案するグラフ生成器は,ポーズ・ツー・ポーズ関係とポーズ・ツー・イメージ関係をモデル化する2つの新しいブロックから構成される。
- 参考スコア(独自算出の注目度): 201.39323496042527
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a novel bipartite graph reasoning Generative Adversarial Network
(BiGraphGAN) for two challenging tasks: person pose and facial image synthesis.
The proposed graph generator consists of two novel blocks that aim to model the
pose-to-pose and pose-to-image relations, respectively. Specifically, the
proposed bipartite graph reasoning (BGR) block aims to reason the long-range
cross relations between the source and target pose in a bipartite graph, which
mitigates some of the challenges caused by pose deformation. Moreover, we
propose a new interaction-and-aggregation (IA) block to effectively update and
enhance the feature representation capability of both a person's shape and
appearance in an interactive way. To further capture the change in pose of each
part more precisely, we propose a novel part-aware bipartite graph reasoning
(PBGR) block to decompose the task of reasoning the global structure
transformation with a bipartite graph into learning different local
transformations for different semantic body/face parts. Experiments on two
challenging generation tasks with three public datasets demonstrate the
effectiveness of the proposed methods in terms of objective quantitative scores
and subjective visual realness. The source code and trained models are
available at https://github.com/Ha0Tang/BiGraphGAN.
- Abstract(参考訳): 本稿では,人物のポーズと顔画像合成という2つの課題に対して,二部グラフによる生成的逆ネットワーク(bigraphgan)を提案する。
提案するグラフ生成器は,ポーズ-ポーズ関係とポーズ-イメージ関係をそれぞれモデル化する2つの新しいブロックから構成される。
特に,提案する二部グラフ推論(bgr)ブロックは,二部グラフにおけるソースとターゲットポーズの長距離交叉関係を推論することを目的としており,ポーズ変形に起因する課題を軽減している。
さらに,対話的な方法で人物の形状と外観の両方の特徴表現能力を効果的に更新し,強化する,新たなインタラクション・アンド・アグリゲーション(IA)ブロックを提案する。
さらに,各部分のポーズの変化をより正確に把握するために,二部グラフによる大域構造変換を異なる意味体/顔部分の異なる局所変換を学習するタスクを分解する,新しい部分認識二部グラフ推論(pbgr)ブロックを提案する。
3つの公開データセットを用いた2つの課題生成タスクの実験は、客観的な定量的スコアと主観的視覚的現実性の観点から提案手法の有効性を示す。
ソースコードとトレーニングされたモデルはhttps://github.com/ha0tang/bigraphganで入手できる。
関連論文リスト
- Graph Transformer GANs with Graph Masked Modeling for Architectural
Layout Generation [153.92387500677023]
本稿では,グラフノード関係を効果的に学習するために,GTGAN(Graph Transformer Generative Adversarial Network)を提案する。
提案したグラフ変換器エンコーダは、局所的およびグローバルな相互作用をモデル化するために、Transformer内のグラフ畳み込みと自己アテンションを組み合わせる。
また,グラフ表現学習のための自己指導型事前学習手法を提案する。
論文 参考訳(メタデータ) (2024-01-15T14:36:38Z) - Graph Transformer GANs for Graph-Constrained House Generation [223.739067413952]
本稿では,グラフノード関係を効果的に学習するために,GTGAN(Graph Transformer Generative Adversarial Network)を提案する。
GTGANは、グラフ制約のある住宅生成タスクにおいて、エンドツーエンドで効率的なグラフノード関係を学習する。
論文 参考訳(メタデータ) (2023-03-14T20:35:45Z) - Bipartite Graph Reasoning GANs for Person Image Generation [159.00654368677513]
本稿では,難易度の高い人物画像生成タスクのための新しいBipartite Graph Reasoning GAN(BiGraphGAN)を提案する。
提案するグラフ生成器は,主にポーズ・ツー・プレイスとポーズ・ツー・イメージの関係をモデル化する2つの新しいブロックから構成される。
論文 参考訳(メタデータ) (2020-08-10T19:37:10Z) - XingGAN for Person Image Generation [149.54517767056382]
本稿では,人物画像生成タスクのための新しいジェネレーティブ・アドバイザリアル・ネットワーク(XingGAN)を提案する。
XingGANは、人物の外観と形状をモデル化する2世代ブランチで構成されている。
提案したXingGANは,客観的な定量的スコアと主観的視覚的現実性の観点から,最先端のパフォーマンスを向上することを示す。
論文 参考訳(メタデータ) (2020-07-17T23:40:22Z) - Interpretable Deep Graph Generation with Node-Edge Co-Disentanglement [55.2456981313287]
本稿では,属性グラフの深部生成モデルのための新しいアンタングルメント拡張フレームワークを提案する。
ノードとエッジのデコンボリューションのための新しいアーキテクチャを用いて、上記の3種類の潜伏因子を解離する新しい変分的目的を提案する。
各タイプ内では、画像の既存のフレームワークの一般化が示され、個々の因子のゆがみがさらに強化される。
論文 参考訳(メタデータ) (2020-06-09T16:33:49Z) - Bridging Knowledge Graphs to Generate Scene Graphs [49.69377653925448]
本稿では,2つのグラフ間の情報伝達を反復的に行う新しいグラフベースニューラルネットワークを提案する。
我々のグラフブリッジネットワークであるGB-Netは、エッジとノードを連続的に推論し、相互接続されたシーンとコモンセンスグラフのリッチでヘテロジニアスな構造を同時に活用し、洗練する。
論文 参考訳(メタデータ) (2020-01-07T23:35:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。