論文の概要: Deep Image Spatial Transformation for Person Image Generation
- arxiv url: http://arxiv.org/abs/2003.00696v2
- Date: Wed, 18 Mar 2020 09:42:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-27 04:13:03.850834
- Title: Deep Image Spatial Transformation for Person Image Generation
- Title(参考訳): 人物画像生成のための深部画像空間変換
- Authors: Yurui Ren, Xiaoming Yu, Junming Chen, Thomas H. Li, Ge Li
- Abstract要約: 本稿では,機能レベルでのインプットを再構築するグローバルフロー局所アテンションフレームワークを提案する。
本モデルでは,まずソースとターゲット間の大域的相関を計算し,流れ場を予測する。
得られた局所的注意係数を用いたコンテンツ認識サンプリング手法を用いて,ソース特性のワープを行う。
- 参考スコア(独自算出の注目度): 31.966927317737873
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pose-guided person image generation is to transform a source person image to
a target pose. This task requires spatial manipulations of source data.
However, Convolutional Neural Networks are limited by the lack of ability to
spatially transform the inputs. In this paper, we propose a differentiable
global-flow local-attention framework to reassemble the inputs at the feature
level. Specifically, our model first calculates the global correlations between
sources and targets to predict flow fields. Then, the flowed local patch pairs
are extracted from the feature maps to calculate the local attention
coefficients. Finally, we warp the source features using a content-aware
sampling method with the obtained local attention coefficients. The results of
both subjective and objective experiments demonstrate the superiority of our
model. Besides, additional results in video animation and view synthesis show
that our model is applicable to other tasks requiring spatial transformation.
Our source code is available at
https://github.com/RenYurui/Global-Flow-Local-Attention.
- Abstract(参考訳): ポーズ誘導人物画像生成は、対象人物画像から対象人物画像への変換である。
このタスクはソースデータの空間的操作を必要とする。
しかし、畳み込みニューラルネットワークは、入力を空間的に変換する能力の欠如によって制限される。
本稿では,インプットを機能レベルで再アセンブルするための微分可能なグローバルフローローカルアテンションフレームワークを提案する。
具体的には、まずソースとターゲットのグローバルな相関を計算し、流れ場を予測する。
そして、特徴地図からフローした局所パッチ対を抽出して局所注意係数を算出する。
最後に,得られた局所的注意係数を用いたコンテンツ認識サンプリング手法を用いて,ソース特性を警告する。
主観的および客観的実験の結果から,モデルの優越性が示された。
さらに,映像アニメーションとビュー合成のさらなる結果は,我々のモデルは空間変換を必要とする他のタスクに適用可能であることを示している。
ソースコードはhttps://github.com/RenYurui/Global-Flow-Local-Attentionで公開しています。
関連論文リスト
- Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - TopNet: Transformer-based Object Placement Network for Image Compositing [43.14411954867784]
背景画像の局所的な手がかりは、特定の位置/スケールにオブジェクトを置くことの互換性を決定するために重要である。
本稿では,トランスモジュールを用いてオブジェクト特徴とすべてのローカル背景特徴の相関関係を学習することを提案する。
我々の新しい定式化は、1つのネットワークフォワードパスにおけるすべての位置/スケールの組み合わせの妥当性を示す3Dヒートマップを生成する。
論文 参考訳(メタデータ) (2023-04-06T20:58:49Z) - Global and Local Alignment Networks for Unpaired Image-to-Image
Translation [170.08142745705575]
未ペア画像から画像への変換の目的は、対象領域のスタイルを反映した出力画像を作成することである。
既存の手法では内容変化に注意が払われていないため、ソース画像からの意味情報は翻訳中の劣化に悩まされる。
我々はGLA-Net(Global and Local Alignment Networks)という新しいアプローチを導入する。
本手法は既存の手法よりもシャープでリアルな画像を効果的に生成する。
論文 参考訳(メタデータ) (2021-11-19T18:01:54Z) - Monocular Human Shape and Pose with Dense Mesh-borne Local Image
Features [8.422257363944295]
本稿では,人物形状に対するグラフ畳み込みに基づくアプローチの改善と,画素配列の局所像特徴を用いたポーズ推定を提案する。
標準ベンチマークの結果から,グローバルな環境における局所的特徴の利用が向上し,最先端技術に対する競争性能が向上することが示された。
論文 参考訳(メタデータ) (2021-11-09T18:43:18Z) - Liquid Warping GAN with Attention: A Unified Framework for Human Image
Synthesis [58.05389586712485]
我々は、人間の動きの模倣、外見の移入、新しい視点の合成など、人間の画像合成に取り組む。
本稿では,ポーズと形状を乱す3次元ボディーメッシュ回収モジュールを提案する。
我々はまた、人間の動きの模倣、外観伝達、新しいビュー合成を評価するために、新しいデータセット、すなわちiPERデータセットを構築した。
論文 参考訳(メタデータ) (2020-11-18T02:57:47Z) - Deep Spatial Transformation for Pose-Guided Person Image Generation and
Animation [50.10989443332995]
ポーズ誘導型人物画像生成とアニメーションは、元人物画像をターゲットポーズに変換することを目的としている。
畳み込みニューラルネットワークは、入力を空間的に変換する能力の欠如によって制限される。
本稿では,機能レベルでのインプットを再構築するグローバルフロー局所アテンションフレームワークを提案する。
論文 参考訳(メタデータ) (2020-08-27T08:59:44Z) - Set Based Stochastic Subsampling [85.5331107565578]
本稿では,2段階間ニューラルサブサンプリングモデルを提案する。
画像分類,画像再構成,機能再構築,少数ショット分類など,様々なタスクにおいて,低いサブサンプリング率で関連ベースラインを上回っていることを示す。
論文 参考訳(メタデータ) (2020-06-25T07:36:47Z) - Neural Pose Transfer by Spatially Adaptive Instance Normalization [73.04483812364127]
本稿では,最新の画像スタイル転送技術を用いてポーズ転送を解く,最初のニューラルポーズ転送モデルを提案する。
私たちのモデルは、ソースとターゲットメッシュ間の通信を一切必要としません。
実験により, 提案モデルでは, 対象メッシュへの変形を効果的に伝達することができ, 未確認の同一性やメッシュのポーズに対処できる優れた一般化能力を有することが示された。
論文 参考訳(メタデータ) (2020-03-16T14:33:59Z) - Unifying Deep Local and Global Features for Image Search [9.614694312155798]
グローバルおよびローカルな画像特徴を1つのディープモデルに統一し、効率的な特徴抽出による正確な検索を可能にする。
我々のモデルは、改訂されたオックスフォードとパリのデータセットにおける最先端の画像検索と、Google Landmarksデータセットv2における最先端の単一モデルインスタンスレベルの認識を実現している。
論文 参考訳(メタデータ) (2020-01-14T19:59:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。