Fugu-MT 論文翻訳(概要): 3D Shape Variational Autoencoder Latent Disentanglement via Mini-Batch Feature Swapping for Bodies and Faces

論文の概要: 3D Shape Variational Autoencoder Latent Disentanglement via Mini-Batch Feature Swapping for Bodies and Faces

arxiv url: http://arxiv.org/abs/2111.12448v2
Date: Thu, 25 Nov 2021 15:20:32 GMT
ステータス: 翻訳完了
システム内更新日: 2021-11-29 12:51:31.213631
Title: 3D Shape Variational Autoencoder Latent Disentanglement via Mini-Batch Feature Swapping for Bodies and Faces
Title（参考訳）: 身体と顔のミニバッチ特徴スワップによる3次元形状可変オートエンコーダ潜入乱れ
Authors: Simone Foti, Bongjin Koo, Danail Stoyanov, Matthew J. Clarkson
Abstract要約: 本稿では,3次元形状変化型オートエンコーダを訓練する自己教師型アプローチを提案する。 3Dメッシュで行った実験結果から,潜伏不整合に対する最先端の手法では顔と身体の同一性を取り除けないことが明らかとなった。
参考スコア（独自算出の注目度）: 12.114711258010367
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Learning a disentangled, interpretable, and structured latent representation in 3D generative models of faces and bodies is still an open problem. The problem is particularly acute when control over identity features is required. In this paper, we propose an intuitive yet effective self-supervised approach to train a 3D shape variational autoencoder (VAE) which encourages a disentangled latent representation of identity features. Curating the mini-batch generation by swapping arbitrary features across different shapes allows to define a loss function leveraging known differences and similarities in the latent representations. Experimental results conducted on 3D meshes show that state-of-the-art methods for latent disentanglement are not able to disentangle identity features of faces and bodies. Our proposed method properly decouples the generation of such features while maintaining good representation and reconstruction capabilities.
Abstract（参考訳）: 顔と体の3次元生成モデルにおける不連続、解釈、構造化された潜在表現の学習は、いまだに未解決の問題である。アイデンティティ機能をコントロールする必要がある場合、問題は特に深刻である。本稿では,3次元形状変化型オートエンコーダ(VAE)を訓練する直感的かつ効果的な自己教師型手法を提案する。任意の特徴を異なる形状に置き換えることでミニバッチ生成を計算することで、潜在表現の既知の相違と類似性を利用した損失関数を定義することができる。 3dメッシュを用いた実験の結果,潜伏性乱れに対する最先端手法では顔と身体の同一性特徴を分離できないことがわかった。提案手法は,優れた表現能力と復元能力を維持しつつ,これらの特徴を適切に分離する。

関連論文リスト

StdGEN++: A Comprehensive System for Semantic-Decomposed 3D Character Generation [57.06461272772509]
StdGEN++は、多種多様な入力から高忠実で意味的に分解された3D文字を生成するための、新しく包括的なシステムである。最先端の性能を達成し、幾何学的精度と意味的絡み合いにおいて既存の手法を著しく上回っている。結果として、非破壊的な編集、物理学に準拠したアニメーション、視線追跡など、より進んだ下流の機能をアンロックする。
論文参考訳（メタデータ） (2026-01-12T15:41:27Z)
DiffSwap++: 3D Latent-Controlled Diffusion for Identity-Preserving Face Swapping [16.846179110602737]
そこで我々は,DiffSwap++を提案する。DiffSwap++は,トレーニング中に3D顔の潜伏機能を組み込んだ,拡散型フェイススワッピングパイプラインである。本手法は, 形状整合性を高め, 外観特性から顔の識別のゆがみを改善する。 CelebA、FFHQ、CelebV-Textの実験では、DiffSwap++はターゲットのポーズと表現を維持しながらソースのアイデンティティを保ちながら、以前のメソッドよりも優れていた。
論文参考訳（メタデータ） (2025-11-04T18:56:49Z)
ImHead: A Large-scale Implicit Morphable Model for Localized Head Modeling [71.3859346921118]
imHeadは、表現力のある3Dヘッドアバターだけでなく、顔の特徴の局所的な編集を容易にする新しい3DMMである。 imHeadをトレーニングするために、4Kの異なるアイデンティティの大規模なデータセットをキュレートする。
論文参考訳（メタデータ） (2025-10-12T20:17:34Z)
Mesh-Gait: A Unified Framework for Gait Recognition Through Multi-Modal Representation Learning from 2D Silhouettes [36.964703204465664]
我々は、新しいエンドツーエンドの歩行認識フレームワークであるMesh-Gaitを紹介する。 2Dシルエットから3D表現を直接再構成する。 Mesh-Gaitは最先端の精度を実現する。
論文参考訳（メタデータ） (2025-10-12T01:49:05Z)
JADE: Joint-aware Latent Diffusion for 3D Human Generative Modeling [62.77347895550087]
JADEは人体形状の変化を微粒化制御で学習する生成フレームワークである。私たちの重要な洞察は、人体を骨格構造に分解する共同認識の潜伏表現です。提案した分解条件下でのコヒーレントで可塑性な人体形状を生成するため,カスケードパイプラインも提案する。
論文参考訳（メタデータ） (2024-12-29T14:18:35Z)
GaussianAnything: Interactive Point Cloud Latent Diffusion for 3D Generation [75.39457097832113]
本稿では,インタラクティブなポイントクラウド構造ラテント空間を備えたスケーラブルで高品質な3D生成を実現する,新しい3D生成フレームワークを提案する。本フレームワークでは,複数ビューのRGB-D(epth)-N(ormal)レンダリングを入力として使用する変分オートエンコーダを,3次元形状情報を保存する独自のラテント空間設計を用いて構成する。提案手法であるGaussianAnythingは,複数モード条件付き3D生成をサポートし,ポイントクラウド,キャプション,シングル/マルチビュー画像入力を可能にする。
論文参考訳（メタデータ） (2024-11-12T18:59:32Z)
Deformable 3D Shape Diffusion Model [21.42513407755273]
包括的3次元形状操作を容易にする新しい変形可能な3次元形状拡散モデルを提案する。点雲生成における最先端性能とメッシュ変形の競争結果を示す。本手法は,バーチャルリアリティの領域において,3次元形状操作の進展と新たな機会の解放のためのユニークな経路を提供する。
論文参考訳（メタデータ） (2024-07-31T08:24:42Z)
3D Face Modeling via Weakly-supervised Disentanglement Network joint Identity-consistency Prior [62.80458034704989]
切り離された制御因子を特徴とする3次元顔モデルの生成は、コンピュータビジョンやコンピュータグラフィックスの多様な応用において大きな可能性を秘めている。従来の3D顔モデリング手法は、これらの要因を効果的に解消するために特定のラベルを要求するため、課題に直面している。本稿では,WSDF(Wakly Supervised Disentanglement Framework)を導入し,過度に拘束的なラベル付けを必要とせず,制御可能な3次元顔モデルのトレーニングを容易にする。
論文参考訳（メタデータ） (2024-04-25T11:50:47Z)
DrFER: Learning Disentangled Representations for 3D Facial Expression Recognition [28.318304721838096]
本稿では,3D FERの分野に非交叉表現学習の概念を取り入れた,革新的なDrFER法を提案する。 DrFERは、表現情報をID情報から効果的に切り離すために、デュアルブランチフレームワークを使用している。この適応は、顔の表情を認識する際の枠組みの能力を高める。
論文参考訳（メタデータ） (2024-03-13T08:00:07Z)
OmniAvatar: Geometry-Guided Controllable 3D Head Synthesis [81.70922087960271]
我々は,非構造画像から学習した新しい幾何学誘導型3次元頭部合成モデルであるOmniAvatarを提案する。我々のモデルは、最先端の手法と比較して、魅力的なダイナミックディテールで、より好ましいID保存された3Dヘッドを合成することができる。
論文参考訳（メタデータ） (2023-03-27T18:36:53Z)
Controllable 3D Generative Adversarial Face Model via Disentangling Shape and Appearance [63.13801759915835]
3次元顔モデリングはコンピュータビジョンとコンピュータグラフィックスの研究の活発な領域である。本稿では,識別と表現を分離できる新しい3次元顔生成モデルを提案する。
論文参考訳（メタデータ） (2022-08-30T13:40:48Z)
Learning Canonical 3D Object Representation for Fine-Grained Recognition [77.33501114409036]
本研究では,1枚の画像から3次元空間における物体の変動を再現する微粒な物体認識のための新しいフレームワークを提案する。我々は,物体を3次元形状とその外観の合成として表現し,カメラ視点の影響を排除した。深部表現に3次元形状と外観を併用することにより,物体の識別表現を学習する。
論文参考訳（メタデータ） (2021-08-10T12:19:34Z)
Reconstructing Recognizable 3D Face Shapes based on 3D Morphable Models [20.381926248856452]
本稿では,形状パラメータと形状幾何学領域の識別性を高めることを目的とした,形状パラメータに対する新しい形状認識正規化(SIR)損失を提案する。提案手法は, 形状パラメータの再構成誤差, 視覚的識別性, 顔認識精度の観点から, 既存の手法と比較する。
論文参考訳（メタデータ） (2021-04-08T05:11:48Z)
gradSim: Differentiable simulation for system identification and visuomotor control [66.37288629125996]
本稿では,微分可能マルチフィジカルシミュレーションと微分可能レンダリングを活用し,3次元監督への依存を克服するフレームワークであるgradsimを提案する。当社の統合グラフは、状態ベースの(3D)監督に頼ることなく、挑戦的なバイスモメータ制御タスクで学習を可能にします。
論文参考訳（メタデータ） (2021-04-06T16:32:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。