論文の概要: FlexPose: Pose Distribution Adaptation with Limited Guidance
- arxiv url: http://arxiv.org/abs/2412.13463v1
- Date: Wed, 18 Dec 2024 03:18:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-19 16:49:05.484483
- Title: FlexPose: Pose Distribution Adaptation with Limited Guidance
- Title(参考訳): FlexPose: 限定ガイダンスによるPose Distribution Adaptation
- Authors: Zixiao Wang, Junwu Weng, Mengyuan Liu, Bei Yu,
- Abstract要約: 本稿では,事前学習したポーズ生成器を,新しいポーズ分布に従って適応したポーズに調整する手法を提案する。
提案手法を定性的に,定量的に評価した。
- 参考スコア(独自算出の注目度): 15.79919667308626
- License:
- Abstract: Numerous well-annotated human key-point datasets are publicly available to date. However, annotating human poses for newly collected images is still a costly and time-consuming progress. Pose distributions from different datasets share similar pose hinge-structure priors with different geometric transformations, such as pivot orientation, joint rotation, and bone length ratio. The difference between Pose distributions is essentially the difference between the transformation distributions. Inspired by this fact, we propose a method to calibrate a pre-trained pose generator in which the pose prior has already been learned to an adapted one following a new pose distribution. We treat the representation of human pose joint coordinates as skeleton image and transfer a pre-trained pose annotation generator with only a few annotation guidance. By fine-tuning a limited number of linear layers that closely related to the pose transformation, the adapted generator is able to produce any number of pose annotations that are similar to the target poses. We evaluate our proposed method, FlexPose, on several cross-dataset settings both qualitatively and quantitatively, which demonstrates that our approach achieves state-of-the-art performance compared to the existing generative-model-based transfer learning methods when given limited annotation guidance.
- Abstract(参考訳): たくさんのよく注釈付けされた人間のキーポイントデータセットが、現在までに公開されている。
しかし、新たに収集された画像に人間のポーズを付加することは、依然としてコストと時間を要する進歩である。
異なるデータセットからのポース分布は、ピボット配向、関節回転、骨長比など、異なる幾何学的変換を持つヒンジ構造に類似している。
ポース分布の違いは、基本的に変換分布の違いである。
そこで本研究では,事前学習したポーズ生成器を,新しいポーズ分布に従って適応したポーズに適応させる手法を提案する。
人間のポーズ関節座標の表現をスケルトン画像として扱い,事前訓練されたポーズアノテーション生成器をわずかなガイダンスで転送する。
ポーズ変換と密接な関係を持つ限られた数の線形層を微調整することで、適応されたジェネレータはターゲットのポーズに類似したポーズアノテーションを生成できる。
提案手法であるFlexPoseを定性的かつ定量的に複数のクロスデータセット設定で評価し,本手法が従来の生成モデルに基づくトランスファー学習法と比較して最先端の性能を達成できることを実証した。
関連論文リスト
- GRPose: Learning Graph Relations for Human Image Generation with Pose Priors [21.971188335727074]
人間の画像生成のための制御情報を提供するために,ポーズ前のグラフ関係を探索するフレームワークを提案する。
提案モデルでは,最新のベンチマークモデルと比較して,ポーズ平均精度が9.98%向上した。
論文 参考訳(メタデータ) (2024-08-29T13:58:34Z) - Stable-Pose: Leveraging Transformers for Pose-Guided Text-to-Image Generation [32.190055780969466]
Stable-Poseは、粗い注目マスキング戦略を視覚変換器に導入する新しいアダプタモデルである。
我々は、ViTのクエリキー自己保持機構を利用して、人間のポーズスケルトンにおける異なる解剖学的部分間の相互接続を探索する。
Stable-PoseはLAION-HumanデータセットのAPスコア57.1を達成し、確立したControlNetよりも約13%改善した。
論文 参考訳(メタデータ) (2024-06-04T16:54:28Z) - RePoseDM: Recurrent Pose Alignment and Gradient Guidance for Pose Guided Image Synthesis [14.50214193838818]
ポーズ誘導された人物画像合成タスクは、フォトリアリスティックな外観と欠陥のないポーズ転送を備えた参照イメージを再レンダリングする必要がある。
条件付きガイダンスとしてポーズアラインメントのテクスチャ特徴を提供するために,繰り返しポーズアライメントを提案する。
これは、フォトリアリズムと非歪なテクスチャの詳細をもたらす、もっともらしいポーズ伝達軌跡の学習に役立ちます。
論文 参考訳(メタデータ) (2023-10-24T15:16:19Z) - Human Pose as Compositional Tokens [88.28348144244131]
本稿では,PoseをPCT(Compincial Tokens)と名づけた構造的表現について述べる。
これはM個の離散トークンによるポーズを表し、それぞれがいくつかの相互依存結合を持つ部分構造を特徴づける。
事前に学習したデコーダネットワークを使用してトークンからのポーズを後処理なしで復元する。
論文 参考訳(メタデータ) (2023-03-21T07:14:18Z) - Open-World Pose Transfer via Sequential Test-Time Adaption [92.67291699304992]
典型的なポーズ転送フレームワークは、通常、識別モデルをトレーニングするために代表的データセットを使用する。
テスト時間適応(TTA)は、自己スーパービジョンで本質的な特徴を学習する事前学習モデルを使用することで、OODデータに対して実現可能なソリューションを提供する。
実験では、まず、Tiktokの再現や有名人による動き合成など、オープンワールドの応用に、ポーズ転送が適用可能であることを示す。
論文 参考訳(メタデータ) (2023-03-20T09:01:23Z) - PoseTrans: A Simple Yet Effective Pose Transformation Augmentation for
Human Pose Estimation [40.50255017107963]
我々は多彩なポーズを持つ新しいトレーニングサンプルを作成するために、Pose Transformation (PoseTrans)を提案する。
また,ポーズの規則性を測定するためにPose Clustering Module (PCM)を提案する。
提案手法は効率的で実装が容易であり,既存のポーズ推定モデルのトレーニングパイプラインに容易に組み込むことができる。
論文 参考訳(メタデータ) (2022-08-16T14:03:01Z) - Few Shot Generative Model Adaption via Relaxed Spatial Structural
Alignment [130.84010267004803]
限られたデータでGAN(Generative Adversarial Network)を訓練することは難しい課題である。
実現可能な解決策は、大規模なソースドメインで十分に訓練されたGANから始め、ターゲットドメインにいくつかのサンプルで適応することである。
本研究では,適応時の対象生成モデルのキャリブレーションを行うための緩和された空間構造アライメント手法を提案する。
論文 参考訳(メタデータ) (2022-03-06T14:26:25Z) - Progressive and Aligned Pose Attention Transfer for Person Image
Generation [59.87492938953545]
本稿では,ある人物のポーズを対象のポーズに移す,新たなポーズ移動のための生成的広告ネットワークを提案する。
Pose-Attentional Transfer Block (PATB) と Aligned Pose-Attentional Transfer Bloc (APATB) の2種類のブロックを使用します。
Market-1501およびDeepFashionデータセットにおけるモデルの有効性を定量的および定性測定を用いて検証する。
論文 参考訳(メタデータ) (2021-03-22T07:24:57Z) - Pose Guided Person Image Generation with Hidden p-Norm Regression [113.41144529452663]
ポーズ誘導者画像生成タスクを解くための新しいアプローチを提案する。
提案手法では,各アイデンティティに対するポーズ不変特徴行列を推定し,対象ポーズに条件づけられたターゲットの出現を予測できる。
提案手法は, 上記すべての変種シナリオにおいて, 競合性能を示す。
論文 参考訳(メタデータ) (2021-02-19T17:03:54Z) - Adversarial Transfer of Pose Estimation Regression [11.117357750374035]
本研究では,シーン不変の画像表現を学習するための深層適応ネットワークを開発し,モデル転送のための表現を生成する。
我々は、Cambridge Landmarksと7Sceneの2つの公開データセット上でネットワークを評価し、いくつかのベースラインよりもその優位性を実証し、アート手法の状況と比較した。
論文 参考訳(メタデータ) (2020-06-20T21:16:37Z) - Neural Pose Transfer by Spatially Adaptive Instance Normalization [73.04483812364127]
本稿では,最新の画像スタイル転送技術を用いてポーズ転送を解く,最初のニューラルポーズ転送モデルを提案する。
私たちのモデルは、ソースとターゲットメッシュ間の通信を一切必要としません。
実験により, 提案モデルでは, 対象メッシュへの変形を効果的に伝達することができ, 未確認の同一性やメッシュのポーズに対処できる優れた一般化能力を有することが示された。
論文 参考訳(メタデータ) (2020-03-16T14:33:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。