論文の概要: Progressive and Aligned Pose Attention Transfer for Person Image
Generation
- arxiv url: http://arxiv.org/abs/2103.11622v1
- Date: Mon, 22 Mar 2021 07:24:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-23 14:30:16.041718
- Title: Progressive and Aligned Pose Attention Transfer for Person Image
Generation
- Title(参考訳): 人物画像生成のためのプログレッシブ・アライメントポッドアテンション転送
- Authors: Zhen Zhu, Tengteng Huang, Mengde Xu, Baoguang Shi, Wenqing Cheng,
Xiang Bai
- Abstract要約: 本稿では,ある人物のポーズを対象のポーズに移す,新たなポーズ移動のための生成的広告ネットワークを提案する。
Pose-Attentional Transfer Block (PATB) と Aligned Pose-Attentional Transfer Bloc (APATB) の2種類のブロックを使用します。
Market-1501およびDeepFashionデータセットにおけるモデルの有効性を定量的および定性測定を用いて検証する。
- 参考スコア(独自算出の注目度): 59.87492938953545
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes a new generative adversarial network for pose transfer,
i.e., transferring the pose of a given person to a target pose. We design a
progressive generator which comprises a sequence of transfer blocks. Each block
performs an intermediate transfer step by modeling the relationship between the
condition and the target poses with attention mechanism. Two types of blocks
are introduced, namely Pose-Attentional Transfer Block (PATB) and Aligned
Pose-Attentional Transfer Bloc ~(APATB). Compared with previous works, our
model generates more photorealistic person images that retain better appearance
consistency and shape consistency compared with input images. We verify the
efficacy of the model on the Market-1501 and DeepFashion datasets, using
quantitative and qualitative measures. Furthermore, we show that our method can
be used for data augmentation for the person re-identification task,
alleviating the issue of data insufficiency. Code and pretrained models are
available at https://github.com/tengteng95/Pose-Transfer.git.
- Abstract(参考訳): 本稿では,ある人物のポーズを対象のポーズに移す,新たなポーズ移動のための生成的広告ネットワークを提案する。
我々は転送ブロックのシーケンスからなるプログレッシブジェネレータを設計する。
各ブロックは、状態とターゲット間の関係をアテンション機構でモデル化して中間転送ステップを実行する。
Pose-Attentional Transfer Block (PATB)とAligned Pose-Attentional Transfer Bloc ~ (APATB)の2種類のブロックが導入された。
従来のモデルと比較すると,入力画像に比べて外観の整合性や形状の整合性が向上した人物画像がより多く生成される。
定量的および質的尺度を用いて,マーケット1501およびディープファッションデータセットにおけるモデルの有効性を検証する。
また,本手法は,データ不足の問題を軽減するため,人物再識別タスクのためのデータ拡張に使用できることを示す。
コードと事前トレーニングされたモデルはhttps://github.com/tengteng95/pose-transfer.gitで入手できる。
関連論文リスト
- Person Image Synthesis via Denoising Diffusion Model [116.34633988927429]
本研究では,高忠実度人物画像合成に拡散モデルをいかに応用できるかを示す。
2つの大規模ベンチマークとユーザスタディの結果は、挑戦的なシナリオ下で提案したアプローチのフォトリアリズムを実証している。
論文 参考訳(メタデータ) (2022-11-22T18:59:50Z) - FixMyPose: Pose Correctional Captioning and Retrieval [67.20888060019028]
本稿では,自動ポーズ修正システムに対応する新しいキャプションデータセットfixmyposeを提案する。
我々は「現在の」ポーズを「ターゲット」ポーズのように見えるように修正する記述を収集する。
MLバイアスを避けるため、さまざまな階層を持つキャラクタ間のバランスを維持します。
論文 参考訳(メタデータ) (2021-04-04T21:45:44Z) - PoNA: Pose-guided Non-local Attention for Human Pose Transfer [105.14398322129024]
本稿では, 簡易ブロックを用いたGAN(Generative Adversarial Network)を用いた新しいポーズ転送手法を提案する。
我々のモデルはより鮮明でよりリアルな画像を生成するが、パラメータは少なく、速度も速い。
論文 参考訳(メタデータ) (2020-12-13T12:38:29Z) - Human Pose Transfer by Adaptive Hierarchical Deformation [24.70009597455219]
階層的変形レベルが2つある適応型ポーズ転送ネットワークを提案する。
最初のレベルは、ターゲットポーズに沿った人間の意味解析を生成します。
第2のレベルは、セマンティックガイダンスでターゲットポーズにおける最終テクスチャ化された人物画像を生成する。
論文 参考訳(メタデータ) (2020-12-13T01:49:26Z) - MUST-GAN: Multi-level Statistics Transfer for Self-driven Person Image
Generation [13.06676286691587]
姿勢誘導型人物画像生成は通常、トレーニングを監督するためにペアのソースターゲット画像を使用する。
本稿では,人物画像から多段階の外観特徴を分離・伝達する,新しい多段階統計伝達モデルを提案する。
提案手法は,人物の外観を柔軟に操作し,ポーズ・トランスファーや衣服スタイル・トランスファー・タスクを行う。
論文 参考訳(メタデータ) (2020-11-18T04:38:48Z) - Person image generation with semantic attention network for person
re-identification [9.30413920076019]
本稿では,意味的注意ネットワークと呼ばれる新しい人物のポーズ誘導画像生成手法を提案する。
ネットワークはいくつかのセマンティックアテンションブロックで構成されており、各ブロックはポーズコードと衣服のテクスチャを保存および更新する。
他の方法と比較して、我々のネットワークはより優れた身体形状を特徴付けることができ、同時に衣服の属性を保持することができる。
論文 参考訳(メタデータ) (2020-08-18T12:18:51Z) - XingGAN for Person Image Generation [149.54517767056382]
本稿では,人物画像生成タスクのための新しいジェネレーティブ・アドバイザリアル・ネットワーク(XingGAN)を提案する。
XingGANは、人物の外観と形状をモデル化する2世代ブランチで構成されている。
提案したXingGANは,客観的な定量的スコアと主観的視覚的現実性の観点から,最先端のパフォーマンスを向上することを示す。
論文 参考訳(メタデータ) (2020-07-17T23:40:22Z) - Neural Pose Transfer by Spatially Adaptive Instance Normalization [73.04483812364127]
本稿では,最新の画像スタイル転送技術を用いてポーズ転送を解く,最初のニューラルポーズ転送モデルを提案する。
私たちのモデルは、ソースとターゲットメッシュ間の通信を一切必要としません。
実験により, 提案モデルでは, 対象メッシュへの変形を効果的に伝達することができ, 未確認の同一性やメッシュのポーズに対処できる優れた一般化能力を有することが示された。
論文 参考訳(メタデータ) (2020-03-16T14:33:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。