論文の概要: Structure-aware Person Image Generation with Pose Decomposition and
Semantic Correlation
- arxiv url: http://arxiv.org/abs/2102.02972v1
- Date: Fri, 5 Feb 2021 03:07:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-08 18:43:21.966774
- Title: Structure-aware Person Image Generation with Pose Decomposition and
Semantic Correlation
- Title(参考訳): ポーズ分解と意味相関による人物画像の構造認識
- Authors: Jilin Tang, Yi Yuan, Tianjia Shao, Yong Liu, Mengmeng Wang, Kun Zhou
- Abstract要約: 高品質な人物画像生成のための構造認識フローベース手法を提案する。
人体を異なる意味部分に分解し、異なるネットワークを適用してこれらの部分のフロー場を別々に予測する。
提案手法は,ポーズの相違が大きい場合に高品質な結果を生成することができ,定性比較と定量的比較の両方において最先端の手法より優れる。
- 参考スコア(独自算出の注目度): 29.727033198797518
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper we tackle the problem of pose guided person image generation,
which aims to transfer a person image from the source pose to a novel target
pose while maintaining the source appearance. Given the inefficiency of
standard CNNs in handling large spatial transformation, we propose a
structure-aware flow based method for high-quality person image generation.
Specifically, instead of learning the complex overall pose changes of human
body, we decompose the human body into different semantic parts (e.g., head,
torso, and legs) and apply different networks to predict the flow fields for
these parts separately. Moreover, we carefully design the network modules to
effectively capture the local and global semantic correlations of features
within and among the human parts respectively. Extensive experimental results
show that our method can generate high-quality results under large pose
discrepancy and outperforms state-of-the-art methods in both qualitative and
quantitative comparisons.
- Abstract(参考訳): 本稿では,人物像を音源位置から新たな対象位置へ移動させることを目的とした姿勢誘導型人物画像生成の課題を,音源の外観を維持しながら解決する。
大規模空間変換処理における標準CNNの非効率性から,高品質人像生成のための構造認識フローに基づく手法を提案する。
具体的には、人体の複雑な全体的なポーズの変化を学習する代わりに、人体を異なる意味部分(例えば、頭、胴体、脚)に分解し、異なるネットワークを適用して、これらの部分のフローフィールドを別々に予測する。
さらに, ネットワークモジュールを慎重に設計し, ヒトの部位内および部位間の特徴の局所的およびグローバル的意味的相関を効果的に把握する。
実験結果から,提案手法はポーズの相違が大きい場合に高品質な結果が得られ,定性比較と定量的比較の両方において最先端の手法よりも優れることが示された。
関連論文リスト
- GRPose: Learning Graph Relations for Human Image Generation with Pose Priors [21.971188335727074]
人間の画像生成のための制御情報を提供するために,ポーズ前のグラフ関係を探索するフレームワークを提案する。
提案モデルでは,最新のベンチマークモデルと比較して,ポーズ平均精度が9.98%向上した。
論文 参考訳(メタデータ) (2024-08-29T13:58:34Z) - Towards Effective Usage of Human-Centric Priors in Diffusion Models for
Text-based Human Image Generation [24.49857926071974]
バニラテキスト画像拡散モデルでは、正確な人間の画像を生成するのに苦労する。
既存のメソッドは、主に余分なイメージでモデルを微調整したり、追加のコントロールを追加することでこの問題に対処する。
本稿では,人間中心の先行概念のモデル微調整段階への直接統合について検討する。
論文 参考訳(メタデータ) (2024-03-08T11:59:32Z) - HumanDiffusion: a Coarse-to-Fine Alignment Diffusion Framework for
Controllable Text-Driven Person Image Generation [73.3790833537313]
制御可能な人物画像生成は、デジタルヒューマンインタラクションや仮想トライオンといった幅広い応用を促進する。
テキスト駆動型人物画像生成のための粗大なアライメント拡散フレームワークHumanDiffusionを提案する。
論文 参考訳(メタデータ) (2022-11-11T14:30:34Z) - Pose Guided Human Image Synthesis with Partially Decoupled GAN [25.800174118151638]
Pose Guided Human Image Synthesis (PGHIS) は、人間のイメージを基準ポーズから目標ポーズへ変換する難しいタスクである。
本研究では,人体を複数の部分に分解し,現実的な人物像の合成を誘導する手法を提案する。
さらに,PGHISのためのマルチヘッドアテンションベースモジュールを設計する。
論文 参考訳(メタデータ) (2022-10-07T15:31:37Z) - NeuralReshaper: Single-image Human-body Retouching with Deep Neural
Networks [50.40798258968408]
本稿では,深部生成ネットワークを用いた単一画像における人体の意味的再構成手法であるNeuralReshaperを提案する。
われわれのアプローチは、まずパラメトリックな3次元人間モデルと元の人間の画像とを適合させるフィッティング・セイン・リフォーム・パイプラインに従う。
ペアデータが存在しないデータ不足に対処するために,ネットワークをトレーニングするための新たな自己教師型戦略を導入する。
論文 参考訳(メタデータ) (2022-03-20T09:02:13Z) - Structure-Aware Flow Generation for Human Body Reshaping [15.365236395118982]
我々は,任意のポーズや服装で前例のない制御可能な性能を実現するために,エンドツーエンドのフロー生成アーキテクチャを開発した。
包括的評価のために, BR-5Kという, 初めての大規模ボディーリフォーミングデータセットを構築した。
提案手法は, 視覚性能, 制御性, 効率の面で, 既存の最先端手法を著しく上回っている。
論文 参考訳(メタデータ) (2022-03-09T12:22:38Z) - Controllable Person Image Synthesis with Spatially-Adaptive Warped
Normalization [72.65828901909708]
制御可能な人物画像生成は、望ましい属性を持つ現実的な人間の画像を作成することを目的としている。
本稿では,学習フロー場とワープ変調パラメータを統合した空間適応型ワープ正規化(SAWN)を提案する。
本稿では,テクスチャ・トランスファータスクの事前学習モデルを洗練するための,新たな自己学習部分置換戦略を提案する。
論文 参考訳(メタデータ) (2021-05-31T07:07:44Z) - HumanGAN: A Generative Model of Humans Images [78.6284090004218]
本研究では,ポーズ,局所的な身体部分の外観,衣料品スタイルを制御できる服装者の画像生成モデルを提案する。
本モデルでは,正規化されたポーズ非依存空間に部分的潜在性出現ベクトルをエンコードし,異なるポーズに誘導し,様々な姿勢で身体や衣服の外観を保っている。
論文 参考訳(メタデータ) (2021-03-11T19:00:38Z) - PoNA: Pose-guided Non-local Attention for Human Pose Transfer [105.14398322129024]
本稿では, 簡易ブロックを用いたGAN(Generative Adversarial Network)を用いた新しいポーズ転送手法を提案する。
我々のモデルはより鮮明でよりリアルな画像を生成するが、パラメータは少なく、速度も速い。
論文 参考訳(メタデータ) (2020-12-13T12:38:29Z) - Person image generation with semantic attention network for person
re-identification [9.30413920076019]
本稿では,意味的注意ネットワークと呼ばれる新しい人物のポーズ誘導画像生成手法を提案する。
ネットワークはいくつかのセマンティックアテンションブロックで構成されており、各ブロックはポーズコードと衣服のテクスチャを保存および更新する。
他の方法と比較して、我々のネットワークはより優れた身体形状を特徴付けることができ、同時に衣服の属性を保持することができる。
論文 参考訳(メタデータ) (2020-08-18T12:18:51Z) - Generating Person Images with Appearance-aware Pose Stylizer [66.44220388377596]
本稿では,人物のポーズや外見に基づいてリアルな人物画像を生成する,新しいエンドツーエンドフレームワークを提案する。
本フレームワークのコアとなるのは、ターゲットポーズと条件付き人物の外観を段階的に結合して人体画像を生成する、APS(Appearance-aware Pose Stylizer)と呼ばれる新しいジェネレータである。
論文 参考訳(メタデータ) (2020-07-17T15:58:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。