論文の概要: Pose Guided Person Image Generation with Hidden p-Norm Regression
- arxiv url: http://arxiv.org/abs/2102.10033v1
- Date: Fri, 19 Feb 2021 17:03:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-22 13:26:38.395113
- Title: Pose Guided Person Image Generation with Hidden p-Norm Regression
- Title(参考訳): 隠れたp-norm回帰による人物画像生成
- Authors: Ting-Yao Hu, Alexander G. Hauptmann
- Abstract要約: ポーズ誘導者画像生成タスクを解くための新しいアプローチを提案する。
提案手法では,各アイデンティティに対するポーズ不変特徴行列を推定し,対象ポーズに条件づけられたターゲットの出現を予測できる。
提案手法は, 上記すべての変種シナリオにおいて, 競合性能を示す。
- 参考スコア(独自算出の注目度): 113.41144529452663
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In this paper, we propose a novel approach to solve the pose guided person
image generation task. We assume that the relation between pose and appearance
information can be described by a simple matrix operation in hidden space.
Based on this assumption, our method estimates a pose-invariant feature matrix
for each identity, and uses it to predict the target appearance conditioned on
the target pose. The estimation process is formulated as a p-norm regression
problem in hidden space. By utilizing the differentiation of the solution of
this regression problem, the parameters of the whole framework can be trained
in an end-to-end manner. While most previous works are only applicable to the
supervised training and single-shot generation scenario, our method can be
easily adapted to unsupervised training and multi-shot generation. Extensive
experiments on the challenging Market-1501 dataset show that our method yields
competitive performance in all the aforementioned variant scenarios.
- Abstract(参考訳): 本稿では,ポーズガイドによる人物画像生成課題を解決するための新しいアプローチを提案する。
ポーズ情報と外観情報の関係は隠れた空間における単純な行列演算によって記述できると仮定する。
この仮定に基づいて,各アイデンティティに対するポーズ不変な特徴行列を推定し,それを用いて対象ポーズで条件付けされた対象の外観を予測する。
推定過程は隠れ空間におけるpノルム回帰問題として定式化される。
この回帰問題の解の差別化を利用して、フレームワーク全体のパラメータをエンドツーエンドでトレーニングすることができます。
先行研究のほとんどは教師付きトレーニングとシングルショット生成シナリオにのみ適用できるが,教師なしトレーニングやマルチショット生成に容易に適応できる。
Market-1501データセットの大規模な実験は、上記のすべてのバリエーションシナリオにおいて、我々の手法が競合性能をもたらすことを示している。
関連論文リスト
- EnsIR: An Ensemble Algorithm for Image Restoration via Gaussian Mixture Models [70.60381055741391]
画像復元の課題は、説明された問題に関連し、単一のモデル予測と地道のずれをもたらす。
アンサンブル学習は、複数のベースモデルの予測を組み合わせることで、これらの偏差に対処することを目的としている。
我々は予測候補のアンサンブル重みを推定するために予測(EM)に基づくアルゴリズムを用いる。
我々のアルゴリズムは、モデルに依存しない訓練不要であり、様々なトレーニング済み画像復元モデルのシームレスな統合と強化を可能にする。
論文 参考訳(メタデータ) (2024-10-30T12:16:35Z) - Conditional Variational Autoencoders for Probabilistic Pose Regression [45.563533339332615]
観測画像からカメラポーズの後方分布を予測するための確率的手法を提案する。
提案したトレーニング戦略は,画像が与えられたカメラポーズの生成モデルとなり,ポーズ後部分布からサンプルを抽出することができる。
論文 参考訳(メタデータ) (2024-10-07T12:43:50Z) - Meta-Prior: Meta learning for Adaptive Inverse Problem Solvers [9.364509804053275]
現実のイメージングの課題は、しばしば真実のデータを欠いているため、従来の監督されたアプローチは効果がない。
本手法では,様々な画像処理タスクに対してメタモデルを訓練し,特定のタスクに対して効率的に微調整を行う。
簡単な設定で、このアプローチはベイズ最適推定器を復元し、我々のアプローチの健全性を示す。
論文 参考訳(メタデータ) (2023-11-30T17:02:27Z) - Towards Robust and Unconstrained Full Range of Rotation Head Pose
Estimation [2.915868985330569]
本稿では,非拘束型終端頭部ポーズ推定のための新しい手法を提案する。
効率的かつロバストな直接回帰のための連続6次元回転行列表現を提案する。
提案手法は,他の最先端手法よりも効率的かつロバストに優れる。
論文 参考訳(メタデータ) (2023-09-14T12:17:38Z) - Weakly-supervised 3D Pose Transfer with Keypoints [57.66991032263699]
3Dポーズ転送の主な課題は、1) 異なる文字で同じポーズを行うペアトレーニングデータの欠如、2) ターゲットメッシュからポーズと形状情報を分離すること、3) 異なるトポロジを持つメッシュに適用することの難しさである。
本稿では,これらの課題を克服するためのキーポイントベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-25T12:40:24Z) - UMat: Uncertainty-Aware Single Image High Resolution Material Capture [2.416160525187799]
本研究では, 物体の単一拡散像から正規性, 特異性, 粗さを復元する学習手法を提案する。
本手法は材料デジタル化における不確実性をモデル化する問題に最初に対処する手法である。
論文 参考訳(メタデータ) (2023-05-25T17:59:04Z) - PoseMatcher: One-shot 6D Object Pose Estimation by Deep Feature Matching [51.142988196855484]
本稿では,PoseMatcherを提案する。
3ビューシステムに基づくオブジェクトと画像のマッチングのための新しいトレーニングパイプラインを作成します。
PoseMatcherは、画像とポイントクラウドの異なる入力モダリティに対応できるように、IO-Layerを導入します。
論文 参考訳(メタデータ) (2023-04-03T21:14:59Z) - Poseur: Direct Human Pose Regression with Transformers [119.79232258661995]
単一画像からの2次元人間のポーズ推定に対する直接回帰に基づくアプローチを提案する。
私たちのフレームワークはエンドツーエンドの差別化が可能で、キーポイント間の依存関係を自然に活用することを学びます。
我々のアプローチは、最も優れたヒートマップベースのポーズ推定手法と比較して好意的に機能する最初の回帰ベースのアプローチである。
論文 参考訳(メタデータ) (2022-01-19T04:31:57Z) - Reassessing the Limitations of CNN Methods for Camera Pose Regression [27.86655424544118]
本稿では,カメラのポーズを直接画像から復元できるモデルを提案する。
まず、レグレッションメソッドがまだ最先端にある理由を分析し、新しいアプローチでパフォーマンスギャップを埋める。
論文 参考訳(メタデータ) (2021-08-16T17:55:26Z) - TFPose: Direct Human Pose Estimation with Transformers [83.03424247905869]
ポーズ推定タスクを変換器で効果的に解くことができるシーケンス予測問題に定式化します。
我々のフレームワークは単純で直接的であり、ヒートマップに基づくポーズ推定の欠点を回避している。
MS-COCOおよびMPIIデータセットの実験は、この手法が回帰ベースのポーズ推定の最先端を大幅に改善できることを示しています。
論文 参考訳(メタデータ) (2021-03-29T04:18:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。