論文の概要: Unsupervised Geometric Disentanglement for Surfaces via CFAN-VAE
- arxiv url: http://arxiv.org/abs/2005.11622v2
- Date: Thu, 10 Dec 2020 01:50:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 03:19:37.672010
- Title: Unsupervised Geometric Disentanglement for Surfaces via CFAN-VAE
- Title(参考訳): CFAN-VAEによる表面の非教師付き幾何学的歪み
- Authors: N. Joseph Tatro, Stefan C. Schonsheck, Rongjie Lai
- Abstract要約: CFAN機能を用いて識別とポーズをアンタングル化する新しいアーキテクチャであるCFAN-VAEを提案する。
CFAN-VAEは、訓練中にアイデンティティやポーズに関するラベル情報を必要としないため、教師なし経路における幾何学的ゆがみを実現する。
また,xyz座標を直接符号化するメッシュ畳み込みオートエンコーダにおいて,その潜在空間をCFAN-VAEに登録することで,幾何学的歪みのレベルを検出することに成功した。
- 参考スコア(独自算出の注目度): 7.5714374873825765
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Geometric disentanglement, the separation of latent codes for intrinsic (i.e.
identity) and extrinsic(i.e. pose) geometry, is a prominent task for generative
models of non-Euclidean data such as 3D deformable models. It provides greater
interpretability of the latent space, and leads to more control in generation.
This work introduces a mesh feature, the conformal factor and normal feature
(CFAN),for use in mesh convolutional autoencoders. We further propose CFAN-VAE,
a novel architecture that disentangles identity and pose using the CFAN
feature. Requiring no label information on the identity or pose during
training, CFAN-VAE achieves geometric disentanglement in an unsupervisedway.
Our comprehensive experiments, including reconstruction, interpolation,
generation, and identity/pose transfer, demonstrate CFAN-VAE achieves
state-of-the-art performance on unsupervised geometric disentanglement. We also
successfully detect a level of geometric disentanglement in mesh convolutional
autoencoders that encode xyz-coordinates directly by registering its latent
space to that of CFAN-VAE.
- Abstract(参考訳): 幾何学的非絡み合い(geometric disentanglement)とは、内在的(アイデンティティ)と外在的(ポーズ)幾何学の遅延符号の分離であり、3次元変形可能なモデルのような非ユークリッドデータの生成モデルのための顕著なタスクである。
これは潜在空間のより深い解釈可能性を提供し、世代におけるさらなる制御をもたらす。
この研究は、メッシュ畳み込みオートエンコーダで使用するメッシュ機能、コンフォーマルファクタ、正規機能(CFAN)を導入している。
さらに、CFAN機能を用いて識別とポーズをアンタングル化する新しいアーキテクチャであるCFAN-VAEを提案する。
CFAN-VAEは、訓練中にアイデンティティやポーズに関するラベル情報を必要としないため、教師なし経路における幾何学的ゆがみを実現する。
再構成,補間,生成,同一性/目的移動を含む包括的実験により,CFAN-VAEが非教師視的幾何学的歪曲に対する最先端の性能を実証した。
また,xyz座標を直接符号化するメッシュ畳み込みオートエンコーダにおいて,その潜在空間をCFAN-VAEに登録することで,幾何学的歪みのレベルを検出することに成功した。
関連論文リスト
- Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - Grounding Continuous Representations in Geometry: Equivariant Neural Fields [26.567143650213225]
そこで我々は,幾何インフォームド・クロスアテンションを用いた新しいCNFアーキテクチャを提案する。
このアプローチは、フィールドと潜伏剤の両方を幾何学的にグラウンド化することによって、ステアビリティ特性を誘導することを示す。
分類,セグメンテーション,予測,再構築など,様々なタスクにおいて,これらの主な特性を検証する。
論文 参考訳(メタデータ) (2024-06-09T12:16:30Z) - 3D Face Modeling via Weakly-supervised Disentanglement Network joint Identity-consistency Prior [62.80458034704989]
切り離された制御因子を特徴とする3次元顔モデルの生成は、コンピュータビジョンやコンピュータグラフィックスの多様な応用において大きな可能性を秘めている。
従来の3D顔モデリング手法は、これらの要因を効果的に解消するために特定のラベルを要求するため、課題に直面している。
本稿では,WSDF(Wakly Supervised Disentanglement Framework)を導入し,過度に拘束的なラベル付けを必要とせず,制御可能な3次元顔モデルのトレーニングを容易にする。
論文 参考訳(メタデータ) (2024-04-25T11:50:47Z) - Self-supervised Learning for Enhancing Geometrical Modeling in 3D-Aware
Generative Adversarial Network [42.16520614686877]
3D-GANは、メッシュの不完全性や穴などの3D幾何学的モデリングにおいて、アーティファクトを示す。
これらの欠点は、主にアノテーション付き3Dデータの可用性が制限されているためである。
本稿では,任意の3D-GANの補助的損失を補うセルフ・スーパーバイザード・ラーニング手法を提案する。
論文 参考訳(メタデータ) (2023-12-19T04:55:33Z) - Surface Vision Transformers: Attention-Based Modelling applied to
Cortical Analysis [8.20832544370228]
球面多様体上に投影された任意の曲面データを研究するために、ドメインに依存しないアーキテクチャを導入する。
ビジョントランスモデルは、連続したマルチヘッド自己アテンション層を介してパッチのシーケンスを符号化する。
実験の結果、SiTは一般的に表面CNNよりも優れており、登録データと未登録データで比較可能であることがわかった。
論文 参考訳(メタデータ) (2022-03-30T15:56:11Z) - Geometry-Contrastive Transformer for Generalized 3D Pose Transfer [95.56457218144983]
この研究の直感は、与えられたメッシュ間の幾何学的不整合を強力な自己認識機構で知覚することである。
本研究では,グローバルな幾何学的不整合に対する3次元構造的知覚能力を有する新しい幾何学コントラスト変換器を提案する。
本稿では, クロスデータセット3次元ポーズ伝達タスクのための半合成データセットとともに, 潜時等尺正則化モジュールを提案する。
論文 参考訳(メタデータ) (2021-12-14T13:14:24Z) - Deep Implicit Surface Point Prediction Networks [49.286550880464866]
暗黙の関数としての3次元形状の深い神経表現は、高忠実度モデルを生成することが示されている。
本稿では,CSP(Nest Surface-point)表現と呼ばれる新しい種類の暗黙の表現を用いて,そのような曲面をモデル化する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-10T14:31:54Z) - DSG-Net: Learning Disentangled Structure and Geometry for 3D Shape
Generation [98.96086261213578]
DSG-Netは3次元形状の非交叉構造と幾何学的メッシュ表現を学習するディープニューラルネットワークである。
これは、幾何(構造)を不変に保ちながら構造(幾何学)のような不整合制御を持つ新しい形状生成アプリケーションの範囲をサポートする。
本手法は,制御可能な生成アプリケーションだけでなく,高品質な合成形状を生成できる。
論文 参考訳(メタデータ) (2020-08-12T17:06:51Z) - Dense Non-Rigid Structure from Motion: A Manifold Viewpoint [162.88686222340962]
Non-Rigid Structure-from-Motion (NRSfM) 問題は、複数のフレームにまたがる2次元特徴対応から変形物体の3次元形状を復元することを目的としている。
提案手法は,ノイズに対する精度,スケーラビリティ,堅牢性を大幅に向上させる。
論文 参考訳(メタデータ) (2020-06-15T09:15:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。