論文の概要: Geometry-Contrastive Transformer for Generalized 3D Pose Transfer
- arxiv url: http://arxiv.org/abs/2112.07374v1
- Date: Tue, 14 Dec 2021 13:14:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-15 16:01:49.360144
- Title: Geometry-Contrastive Transformer for Generalized 3D Pose Transfer
- Title(参考訳): 一般化3次元ポーズ伝達のための幾何コントラストトランス
- Authors: Haoyu Chen, Hao Tang, Zitong Yu, Nicu Sebe, Guoying Zhao
- Abstract要約: この研究の直感は、与えられたメッシュ間の幾何学的不整合を強力な自己認識機構で知覚することである。
本研究では,グローバルな幾何学的不整合に対する3次元構造的知覚能力を有する新しい幾何学コントラスト変換器を提案する。
本稿では, クロスデータセット3次元ポーズ伝達タスクのための半合成データセットとともに, 潜時等尺正則化モジュールを提案する。
- 参考スコア(独自算出の注目度): 95.56457218144983
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a customized 3D mesh Transformer model for the pose transfer task.
As the 3D pose transfer essentially is a deformation procedure dependent on the
given meshes, the intuition of this work is to perceive the geometric
inconsistency between the given meshes with the powerful self-attention
mechanism. Specifically, we propose a novel geometry-contrastive Transformer
that has an efficient 3D structured perceiving ability to the global geometric
inconsistencies across the given meshes. Moreover, locally, a simple yet
efficient central geodesic contrastive loss is further proposed to improve the
regional geometric-inconsistency learning. At last, we present a latent
isometric regularization module together with a novel semi-synthesized dataset
for the cross-dataset 3D pose transfer task towards unknown spaces. The massive
experimental results prove the efficacy of our approach by showing
state-of-the-art quantitative performances on SMPL-NPT, FAUST and our new
proposed dataset SMG-3D datasets, as well as promising qualitative results on
MG-cloth and SMAL datasets. It's demonstrated that our method can achieve
robust 3D pose transfer and be generalized to challenging meshes from unknown
spaces on cross-dataset tasks. The code and dataset are made available. Code is
available: https://github.com/mikecheninoulu/CGT.
- Abstract(参考訳): ポーズ転送タスク用にカスタマイズされた3Dメッシュトランスフォーマーモデルを提案する。
3dポーズ移動は、本質的に与えられたメッシュに依存する変形手順であるため、この研究の直観は、与えられたメッシュ間の幾何学的不整合と強力な自己着脱機構を知覚することである。
具体的には,与えられたメッシュ全体にわたる大域的な幾何学的不整合に対して,効率的な3次元構造化知覚能力を有する,新しい幾何コントラスト変換器を提案する。
さらに,地域的幾何学的不整合学習を改善するために,局所的に,単純で効率的な中心測地線のコントラスト損失を提案する。
最後に,未知空間に対するクロスデータセット3dポーズ転送タスクのための,新しい半合成データセットと共に,潜在等尺正規化モジュールを提案する。
SMPL-NPT, FAUST, 新たに提案したデータセットSMG-3Dと, MG-cloth および SMAL データセットの定性的結果を示すことによって, 本手法の有効性を実証した。
提案手法はロバストな3次元ポーズ転送を実現し, クロスデータセットタスクにおける未知空間からのメッシュへの挑戦に一般化できることを実証した。
コードとデータセットは利用可能である。
コードはhttps://github.com/mikecheninoulu/cgt。
関連論文リスト
- Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - Enhancing Generalizability of Representation Learning for Data-Efficient 3D Scene Understanding [50.448520056844885]
本研究では,実世界のパターンを持つ多様な合成シーンを生成可能なベイズネットワークを提案する。
一連の実験は、既存の最先端の事前学習手法に比べて、我々の手法が一貫した優位性を示す。
論文 参考訳(メタデータ) (2024-06-17T07:43:53Z) - Self-supervised Learning for Enhancing Geometrical Modeling in 3D-Aware
Generative Adversarial Network [42.16520614686877]
3D-GANは、メッシュの不完全性や穴などの3D幾何学的モデリングにおいて、アーティファクトを示す。
これらの欠点は、主にアノテーション付き3Dデータの可用性が制限されているためである。
本稿では,任意の3D-GANの補助的損失を補うセルフ・スーパーバイザード・ラーニング手法を提案する。
論文 参考訳(メタデータ) (2023-12-19T04:55:33Z) - MeT: A Graph Transformer for Semantic Segmentation of 3D Meshes [10.667492516216887]
本稿では3次元メッシュのセマンティックセグメンテーションのためのトランスフォーマーに基づく手法を提案する。
隣接行列のラプラシア固有ベクトルを用いて位置符号化を行う。
提案手法は,3次元メッシュのセマンティックセグメンテーションにおける最先端の性能を示す。
論文 参考訳(メタデータ) (2023-07-03T15:45:14Z) - OcTr: Octree-based Transformer for 3D Object Detection [30.335788698814444]
LiDARベースの3Dオブジェクト検出の重要な課題は、大規模な3Dシーンから十分な特徴をキャプチャすることだ。
我々はこの問題に対処するためにOcTrというOcreeベースのトランスフォーマーを提案する。
本研究では,前景の知覚性を高めるために,セマンティック・アウェアな位置埋め込みとアテンションマスクを組み合わせたハイブリッドな位置埋め込みを提案する。
論文 参考訳(メタデータ) (2023-03-22T15:01:20Z) - Normal Transformer: Extracting Surface Geometry from LiDAR Points
Enhanced by Visual Semantics [6.516912796655748]
本稿では,3次元点雲と2次元カラー画像から正規分布を推定する手法を提案する。
我々は,視覚的セマンティクスと3次元幾何データのハイブリッド情報を活用することを学ぶトランスフォーマーニューラルネットワークを開発した。
論文 参考訳(メタデータ) (2022-11-19T03:55:09Z) - Unsupervised Geodesic-preserved Generative Adversarial Networks for
Unconstrained 3D Pose Transfer [84.04540436494011]
任意の任意の任意の3次元メッシュ間のポーズ転送を行うための教師なしアプローチを提案する。
具体的には、内因性(形状)と外因性(ポーズ)の情報保存について、新規な内因性-外因性保存生成ネットワーク(IEP-GAN)を提示する。
提案手法は,最近の最先端手法と比較して,より優れた結果が得られ,より効率的である。
論文 参考訳(メタデータ) (2021-08-17T09:08:21Z) - Adjoint Rigid Transform Network: Task-conditioned Alignment of 3D Shapes [86.2129580231191]
Adjoint Rigid Transform (ART) Networkは、さまざまな3Dネットワークと統合可能なニューラルネットワークモジュールである。
ARTは入力の形状を学習した標準方向に回転させることを学び、多くのタスクに欠かせない。
さらなる研究のために、コードと事前訓練されたモデルをリリースします。
論文 参考訳(メタデータ) (2021-02-01T20:58:45Z) - Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。
従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。
我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。
これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文 参考訳(メタデータ) (2020-08-31T17:10:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。