論文の概要: Neural Head Reenactment with Latent Pose Descriptors
- arxiv url: http://arxiv.org/abs/2004.12000v2
- Date: Fri, 30 Oct 2020 13:37:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-10 03:08:48.410223
- Title: Neural Head Reenactment with Latent Pose Descriptors
- Title(参考訳): 潜在ポーズ記述子を用いた神経頭部再生
- Authors: Egor Burkov, Igor Pasechnik, Artur Grigorev, Victor Lempitsky
- Abstract要約: 潜在ポーズ表現は、全再現システムの一部として学習される。
結果は、運転者の模倣を再現することができ、さらに、対人再現を行うことができる。
- 参考スコア(独自算出の注目度): 11.133251384474363
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a neural head reenactment system, which is driven by a latent pose
representation and is capable of predicting the foreground segmentation
alongside the RGB image. The latent pose representation is learned as a part of
the entire reenactment system, and the learning process is based solely on
image reconstruction losses. We show that despite its simplicity, with a large
and diverse enough training dataset, such learning successfully decomposes pose
from identity. The resulting system can then reproduce mimics of the driving
person and, furthermore, can perform cross-person reenactment. Additionally, we
show that the learned descriptors are useful for other pose-related tasks, such
as keypoint prediction and pose-based retrieval.
- Abstract(参考訳): 本稿では,rgb画像と並行して前景セグメンテーションを予測可能な,潜在的なポーズ表現によるニューラルヘッド再現システムを提案する。
潜在ポーズ表現は、再現システム全体の一部として学習され、学習プロセスは、画像再構成損失のみに基づいて行われる。
その単純さにもかかわらず、大規模で多種多様なトレーニングデータセットを持つ学習は、アイデンティティからポーズを適切に分解する。
得られたシステムは、運転者の模倣を再現することができ、さらに、対人再現を行うことができる。
さらに,学習した記述子は,キーポイント予測やポーズに基づく検索など,他のポーズ関連タスクに有用であることを示す。
関連論文リスト
- Pose-disentangled Contrastive Learning for Self-supervised Facial
Representation [12.677909048435408]
本稿では,汎用的な自己監督型顔表情表現のための,Pose-disentangled Contrastive Learning (PCL) 手法を提案する。
当社のPCLは、まず、顔認識機能からポーズ関連機能を切り離した、ポーズ異形デコーダ(PDD)を考案した。
次に、同じ画像のデータ拡張に基づいてポーズ関連情報を学習する、ポーズ関連コントラスト学習手法を提案する。
論文 参考訳(メタデータ) (2022-11-24T09:30:51Z) - A domain adaptive deep learning solution for scanpath prediction of
paintings [66.46953851227454]
本稿では,ある絵画の視覚的体験における視聴者の眼球運動分析に焦点を当てた。
我々は、人間の視覚的注意を予測するための新しいアプローチを導入し、人間の認知機能に影響を及ぼす。
提案した新しいアーキテクチャは、画像を取り込んでスキャンパスを返す。
論文 参考訳(メタデータ) (2022-09-22T22:27:08Z) - An Empirical Investigation of Representation Learning for Imitation [76.48784376425911]
視覚、強化学習、NLPにおける最近の研究は、補助的な表現学習の目的が、高価なタスク固有の大量のデータの必要性を減らすことを示している。
本稿では,表現学習アルゴリズムを構築するためのモジュラーフレームワークを提案する。
論文 参考訳(メタデータ) (2022-05-16T11:23:42Z) - Physically Disentangled Representations [13.234029150635658]
逆レンダリングは、監督なしで、物理的に歪んだシーンの表現を学ぶために使用することができる。
本稿では,下流クラスタリング,線形分類,セグメンテーションタスクの精度を向上させる学習表現における逆レンダリングの有用性を示す。
論文 参考訳(メタデータ) (2022-04-11T17:36:40Z) - Compositional Scene Representation Learning via Reconstruction: A Survey [48.33349317481124]
構成シーン表現学習はそのような能力を実現するタスクである。
ディープニューラルネットワークは表現学習において有利であることが証明されている。
大量のラベルのないデータを使用し、費用がかかるデータアノテーションを避けることができるため、再構築による学習は有利である。
論文 参考訳(メタデータ) (2022-02-15T02:14:05Z) - Is Deep Image Prior in Need of a Good Education? [57.3399060347311]
画像再構成に有効な先行画像として, 奥行き画像が導入された。
その印象的な再建性にもかかわらず、学習技術や伝統的な再建技術と比べてアプローチは遅い。
計算課題に対処する2段階の学習パラダイムを開発する。
論文 参考訳(メタデータ) (2021-11-23T15:08:26Z) - Self-Supervised Representation Learning from Flow Equivariance [97.13056332559526]
本稿では,複雑なシーンの映像ストリームに直接展開可能な,自己教師型学習表現フレームワークを提案する。
高分解能rawビデオから学んだ我々の表現は、静的画像の下流タスクに簡単に使用できます。
論文 参考訳(メタデータ) (2021-01-16T23:44:09Z) - Unsupervised Landmark Learning from Unpaired Data [117.81440795184587]
教師なしランドマーク学習の最近の試みは、外観は似ているがポーズでは異なる合成画像対を活用する。
本稿では,2回スワッピング・リコンストラクション・ストラテジーを適用して最終監視を行うクロスイメージ・サイクル整合性フレームワークを提案する。
提案するフレームワークは,強いベースラインを大きなマージンで上回ることを示す。
論文 参考訳(メタデータ) (2020-06-29T13:57:20Z) - Pseudo Rehearsal using non photo-realistic images [0.0]
ディープニューラルネットワークは、新しいタスクの学習に直面しているときに、以前の学習タスクを忘れる。
ニューラルネットワークを以前のタスクのトレーニングデータでリハーサルすることで、ネットワークが破滅的な忘れ物から保護することができる。
画像分類設定において、現在の手法は、フォトリアリスティックな合成データを生成しようとするが、ニューラルネットワークは、写真リアリスティックではなく、以前のタスクの良好な保持を実現しているデータに基づいてリハーサルできることを実証した。
論文 参考訳(メタデータ) (2020-04-28T10:44:57Z) - VAE/WGAN-Based Image Representation Learning For Pose-Preserving
Seamless Identity Replacement In Facial Images [15.855376604558977]
We present a novel variational generative adversarial network (VGAN) based on Wasserstein loss。
我々のネットワークは、ポーズ保存されたアイデンティティ・モーフィングとアイデンティティ保存されたポーズ・モーフィングの実行に利用できることを示す。
論文 参考訳(メタデータ) (2020-03-02T03:35:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。