論文の概要: PoNA: Pose-guided Non-local Attention for Human Pose Transfer
- arxiv url: http://arxiv.org/abs/2012.07049v1
- Date: Sun, 13 Dec 2020 12:38:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-09 12:44:06.020999
- Title: PoNA: Pose-guided Non-local Attention for Human Pose Transfer
- Title(参考訳): PoNA: Pose-guided Non-local Attention for Human Pose Transfer
- Authors: Kun Li, Jinsong Zhang, Yebin Liu, Yu-Kun Lai, Qionghai Dai
- Abstract要約: 本稿では, 簡易ブロックを用いたGAN(Generative Adversarial Network)を用いた新しいポーズ転送手法を提案する。
我々のモデルはより鮮明でよりリアルな画像を生成するが、パラメータは少なく、速度も速い。
- 参考スコア(独自算出の注目度): 105.14398322129024
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human pose transfer, which aims at transferring the appearance of a given
person to a target pose, is very challenging and important in many
applications. Previous work ignores the guidance of pose features or only uses
local attention mechanism, leading to implausible and blurry results. We
propose a new human pose transfer method using a generative adversarial network
(GAN) with simplified cascaded blocks. In each block, we propose a pose-guided
non-local attention (PoNA) mechanism with a long-range dependency scheme to
select more important regions of image features to transfer. We also design
pre-posed image-guided pose feature update and post-posed pose-guided image
feature update to better utilize the pose and image features. Our network is
simple, stable, and easy to train. Quantitative and qualitative results on
Market-1501 and DeepFashion datasets show the efficacy and efficiency of our
model. Compared with state-of-the-art methods, our model generates sharper and
more realistic images with rich details, while having fewer parameters and
faster speed. Furthermore, our generated images can help to alleviate data
insufficiency for person re-identification.
- Abstract(参考訳): ヒトのポーズ転送は、特定の人物の外観をターゲットのポーズに移すことを目的としており、多くのアプリケーションにおいて非常に困難で重要なものである。
以前の作業では、ポーズ機能のガイダンスを無視したり、ローカルアテンションメカニズムのみを使用していたりすることで、不明瞭でぼやけた結果につながる。
本稿では, 簡易ブロックを用いたGAN(Generative Adversarial Network)を用いた新しいポーズ転送手法を提案する。
各ブロックにおいて、より重要な画像特徴の領域を選択するための長距離依存スキームを備えたポーズ誘導非局所注意機構(PoNA)を提案する。
また、ポーズ機能や画像機能をより活用するために、予め設定されたポーズ機能更新とポーズ機能更新をデザインする。
私たちのネットワークはシンプルで安定しており、トレーニングも簡単です。
Market-1501およびDeepFashionデータセットの定量的および定性的な結果から,本モデルの有効性と有効性を示した。
我々のモデルは最先端の手法と比較して、よりシャープでよりリアルな画像を生成するが、パラメータは少なく、高速である。
さらに、生成した画像は、人物の再識別におけるデータ不足を軽減するのに役立つ。
関連論文リスト
- DiffUHaul: A Training-Free Method for Object Dragging in Images [78.93531472479202]
DiffUHaulと呼ばれるオブジェクトドラッグタスクのためのトレーニング不要な手法を提案する。
まず、各認知段階に注意マスキングを適用して、各生成を異なるオブジェクトにまたがってよりゆがみやすくする。
初期のデノナイジングステップでは、ソース画像とターゲット画像の注意特徴を補間して、新しいレイアウトを元の外観とスムーズに融合させる。
論文 参考訳(メタデータ) (2024-06-03T17:59:53Z) - Pose Guided Human Image Synthesis with Partially Decoupled GAN [25.800174118151638]
Pose Guided Human Image Synthesis (PGHIS) は、人間のイメージを基準ポーズから目標ポーズへ変換する難しいタスクである。
本研究では,人体を複数の部分に分解し,現実的な人物像の合成を誘導する手法を提案する。
さらに,PGHISのためのマルチヘッドアテンションベースモジュールを設計する。
論文 参考訳(メタデータ) (2022-10-07T15:31:37Z) - Pose-driven Attention-guided Image Generation for Person
Re-Identification [39.605062525247135]
複数人のポーズを生成するために,エンドツーエンドのポーズ駆動型ジェネレーション対人ネットワークを提案する。
ポーズ転送中の人のセマンティック情報を保存するためにセマンティック一貫性損失が提案される。
提案手法を人物再識別フレームワークに組み込むことにより,リアルなポーズ転送画像と最先端の再識別結果を実現できることを示した。
論文 参考訳(メタデータ) (2021-04-28T14:02:24Z) - Learning Semantic Person Image Generation by Region-Adaptive
Normalization [81.52223606284443]
ポーズと外観の翻訳を扱う新しい2段階フレームワークを提案する。
第1段階では,対象意味解析マップを予測し,ポーズ転送の難しさを解消する。
第2段階では,領域適応正規化を組み込んだ新たな人物画像生成手法を提案する。
論文 参考訳(メタデータ) (2021-04-14T06:51:37Z) - Progressive and Aligned Pose Attention Transfer for Person Image
Generation [59.87492938953545]
本稿では,ある人物のポーズを対象のポーズに移す,新たなポーズ移動のための生成的広告ネットワークを提案する。
Pose-Attentional Transfer Block (PATB) と Aligned Pose-Attentional Transfer Bloc (APATB) の2種類のブロックを使用します。
Market-1501およびDeepFashionデータセットにおけるモデルの有効性を定量的および定性測定を用いて検証する。
論文 参考訳(メタデータ) (2021-03-22T07:24:57Z) - MUST-GAN: Multi-level Statistics Transfer for Self-driven Person Image
Generation [13.06676286691587]
姿勢誘導型人物画像生成は通常、トレーニングを監督するためにペアのソースターゲット画像を使用する。
本稿では,人物画像から多段階の外観特徴を分離・伝達する,新しい多段階統計伝達モデルを提案する。
提案手法は,人物の外観を柔軟に操作し,ポーズ・トランスファーや衣服スタイル・トランスファー・タスクを行う。
論文 参考訳(メタデータ) (2020-11-18T04:38:48Z) - Person image generation with semantic attention network for person
re-identification [9.30413920076019]
本稿では,意味的注意ネットワークと呼ばれる新しい人物のポーズ誘導画像生成手法を提案する。
ネットワークはいくつかのセマンティックアテンションブロックで構成されており、各ブロックはポーズコードと衣服のテクスチャを保存および更新する。
他の方法と比較して、我々のネットワークはより優れた身体形状を特徴付けることができ、同時に衣服の属性を保持することができる。
論文 参考訳(メタデータ) (2020-08-18T12:18:51Z) - Adversarially-Trained Deep Nets Transfer Better: Illustration on Image
Classification [53.735029033681435]
トランスファーラーニングは、訓練済みのディープニューラルネットワークを画像認識タスクに新しいドメインに適用するための強力な方法論である。
本研究では,非逆学習モデルよりも逆学習モデルの方が優れていることを示す。
論文 参考訳(メタデータ) (2020-07-11T22:48:42Z) - Neural Pose Transfer by Spatially Adaptive Instance Normalization [73.04483812364127]
本稿では,最新の画像スタイル転送技術を用いてポーズ転送を解く,最初のニューラルポーズ転送モデルを提案する。
私たちのモデルは、ソースとターゲットメッシュ間の通信を一切必要としません。
実験により, 提案モデルでは, 対象メッシュへの変形を効果的に伝達することができ, 未確認の同一性やメッシュのポーズに対処できる優れた一般化能力を有することが示された。
論文 参考訳(メタデータ) (2020-03-16T14:33:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。