論文の概要: Open-World Pose Transfer via Sequential Test-Time Adaption
- arxiv url: http://arxiv.org/abs/2303.10945v1
- Date: Mon, 20 Mar 2023 09:01:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-21 16:11:53.925309
- Title: Open-World Pose Transfer via Sequential Test-Time Adaption
- Title(参考訳): 逐次テスト時間適応によるオープンワールドポス転送
- Authors: Junyang Chen, Xiaoyu Xian, Zhijing Yang, Tianshui Chen, Yongyi Lu,
Yukai Shi, Jinshan Pan, Liang Lin
- Abstract要約: 典型的なポーズ転送フレームワークは、通常、識別モデルをトレーニングするために代表的データセットを使用する。
テスト時間適応(TTA)は、自己スーパービジョンで本質的な特徴を学習する事前学習モデルを使用することで、OODデータに対して実現可能なソリューションを提供する。
実験では、まず、Tiktokの再現や有名人による動き合成など、オープンワールドの応用に、ポーズ転送が適用可能であることを示す。
- 参考スコア(独自算出の注目度): 92.67291699304992
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Pose transfer aims to transfer a given person into a specified posture, has
recently attracted considerable attention. A typical pose transfer framework
usually employs representative datasets to train a discriminative model, which
is often violated by out-of-distribution (OOD) instances. Recently, test-time
adaption (TTA) offers a feasible solution for OOD data by using a pre-trained
model that learns essential features with self-supervision. However, those
methods implicitly make an assumption that all test distributions have a
unified signal that can be learned directly. In open-world conditions, the pose
transfer task raises various independent signals: OOD appearance and skeleton,
which need to be extracted and distributed in speciality. To address this
point, we develop a SEquential Test-time Adaption (SETA). In the test-time
phrase, SETA extracts and distributes external appearance texture by augmenting
OOD data for self-supervised training. To make non-Euclidean similarity among
different postures explicit, SETA uses the image representations derived from a
person re-identification (Re-ID) model for similarity computation. By
addressing implicit posture representation in the test-time sequentially, SETA
greatly improves the generalization performance of current pose transfer
models. In our experiment, we first show that pose transfer can be applied to
open-world applications, including Tiktok reenactment and celebrity motion
synthesis.
- Abstract(参考訳): ポース転送は、ある人物を特定の姿勢に移すことを目的としており、最近かなりの注目を集めている。
典型的なポーズ転送フレームワークは、通常、識別モデルのトレーニングに代表データセットを使用するが、これは、しばしばout-of-distribution (ood)インスタンスによって違反される。
近年,テスト時間適応(TTA)は,自己スーパービジョンで本質的な特徴を学習する事前学習モデルを用いて,OODデータに対して実現可能なソリューションを提供する。
しかし、これらの手法は暗黙的に全てのテスト分布が直接学習できる統一されたシグナルを持つという仮定を与える。
オープンワールド環境では、ポーズ伝達タスクはOODの外観と骨格を抽出し、特殊に分散する必要がある様々な独立したシグナルを発生させる。
そこで我々はSETA (Sequential Test-Time Adaption) を開発した。
テスト時間フレーズにおいて、SETAは、自己教師付きトレーニングのためのOODデータを増強することにより、外見のテクスチャを抽出し、分配する。
異なる姿勢間の非ユークリッド類似性を明示するために、SETAは人物再識別(Re-ID)モデルに由来する画像表現を類似性計算に使用する。
テスト時間における暗黙の姿勢表現に逐次対応することで、SETAは現在のポーズ転送モデルの一般化性能を大幅に改善する。
実験では、まず、Tiktokの再現や有名人の動き合成など、オープンワールドの応用にポーズ転送が適用可能であることを示す。
関連論文リスト
- Exploring Stronger Transformer Representation Learning for Occluded Person Re-Identification [2.552131151698595]
我々はトランスフォーマーに基づく人物識別フレームワークであるSSSC-TransReIDを組み合わせた新しい自己監督・監督手法を提案した。
我々は、ネガティブなサンプルや追加の事前学習なしに、人物の再識別のための特徴表現を強化することができる自己教師付きコントラスト学習ブランチを設計した。
提案モデルでは, 平均平均精度(mAP) とランク1の精度において, 最先端のReID手法よりも優れたRe-ID性能が得られ, 高いマージンで性能が向上する。
論文 参考訳(メタデータ) (2024-10-21T03:17:25Z) - Time-series Generation by Contrastive Imitation [87.51882102248395]
モーメントマッチングの目的によってモチベーションされ、複合的エラーを軽減し、局所的(しかし前方的な)遷移ポリシーを最適化する。
推論において、学習されたポリシーは反復的なサンプリングのジェネレータとして機能し、学習されたエネルギーはサンプルの品質を評価するための軌道レベル尺度として機能する。
論文 参考訳(メタデータ) (2023-11-02T16:45:25Z) - From Global to Local: Multi-scale Out-of-distribution Detection [129.37607313927458]
アウト・オブ・ディストリビューション(OOD)検出は、イン・ディストリビューション(ID)トレーニングプロセス中にラベルが見られない未知のデータを検出することを目的としている。
近年の表現学習の進歩により,距離に基づくOOD検出がもたらされる。
グローバルな視覚情報と局所的な情報の両方を活用する第1のフレームワークであるマルチスケールOOD検出(MODE)を提案する。
論文 参考訳(メタデータ) (2023-08-20T11:56:25Z) - DIVERSIFY: A General Framework for Time Series Out-of-distribution
Detection and Generalization [58.704753031608625]
時系列は、機械学習研究における最も困難なモダリティの1つである。
時系列上でのOODの検出と一般化は、その非定常性によって悩まされる傾向がある。
時系列の動的分布のOOD検出と一般化のためのフレームワークであるDIVERSIFYを提案する。
論文 参考訳(メタデータ) (2023-08-04T12:27:11Z) - Learning by Erasing: Conditional Entropy based Transferable Out-Of-Distribution Detection [17.31471594748061]
トレーニングとテストシナリオ間の分散シフトを処理するためには、アウト・オブ・ディストリビューション(OOD)検出が不可欠である。
既存の方法は、データセット固有の特徴表現やデータ分散をキャプチャするために、再トレーニングを必要とする。
我々は,新しいIDデータセットで再トレーニングする必要がない,DGMに基づく転送可能なOOD検出手法を提案する。
論文 参考訳(メタデータ) (2022-04-23T10:19:58Z) - Listen, Adapt, Better WER: Source-free Single-utterance Test-time
Adaptation for Automatic Speech Recognition [65.84978547406753]
Test-time Adaptationは、ソースドメインでトレーニングされたモデルに適応して、テストサンプルの予測を改善することを目的としている。
単一発話テスト時間適応 (SUTA) は音声領域における最初のTTA研究である。
論文 参考訳(メタデータ) (2022-03-27T06:38:39Z) - OODformer: Out-Of-Distribution Detection Transformer [15.17006322500865]
現実世界の安全クリティカルなアプリケーションでは、新しいデータポイントがOODであるかどうかを認識することが重要です。
本稿では,OODformer というファースト・オブ・ザ・キンドな OOD 検出アーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-07-19T15:46:38Z) - MUTANT: A Training Paradigm for Out-of-Distribution Generalization in
Visual Question Answering [58.30291671877342]
MUTANTは、モデルが知覚的に類似しているが意味的に異なる入力の変異に露出する訓練パラダイムである。
MUTANTは、VQA-CPに新しい最先端の精度を確立し、10.57%$改善した。
論文 参考訳(メタデータ) (2020-09-18T00:22:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。