論文の概要: Disentangled Human Body Representation Based on Unsupervised Semantic-Aware Learning
- arxiv url: http://arxiv.org/abs/2505.19049v1
- Date: Sun, 25 May 2025 09:03:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:42.862486
- Title: Disentangled Human Body Representation Based on Unsupervised Semantic-Aware Learning
- Title(参考訳): 教師なしセマンティック・アウェアラーニングに基づく非教師付き人体表現
- Authors: Lu Wang, Xishuai Peng, S. Kevin Zhou,
- Abstract要約: 教師なし学習フレームワークにおいて,制御可能な微粒なセマンティクスと高精度な再構築による人体表現を提案する。
骨格群全体を意識したエンコーダと教師なしの非教師付きアンタングル化損失の助けを借りて,我々の表現モデルは教師なしの方法で学習される。
幾何学的に意味のある潜在符号のため、幅広い用途で使用することができる。
- 参考スコア(独自算出の注目度): 17.998440914139188
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In recent years, more and more attention has been paid to the learning of 3D human representation. However, the complexity of lots of hand-defined human body constraints and the absence of supervision data limit that the existing works controllably and accurately represent the human body in views of semantics and representation ability. In this paper, we propose a human body representation with controllable fine-grained semantics and high precison of reconstruction in an unsupervised learning framework. In particularly, we design a whole-aware skeleton-grouped disentangle strategy to learn a correspondence between geometric semantical measurement of body and latent codes, which facilitates the control of shape and posture of human body by modifying latent coding paramerers. With the help of skeleton-grouped whole-aware encoder and unsupervised disentanglement losses, our representation model is learned by an unsupervised manner. Besides, a based-template residual learning scheme is injected into the encoder to ease of learning human body latent parameter in complicated body shape and pose spaces. Because of the geometrically meaningful latent codes, it can be used in a wide range of applications, from human body pose transfer to bilinear latent code interpolation. Further more, a part-aware decoder is utlized to promote the learning of controllable fine-grained semantics. The experimental results on public 3D human datasets show that the method has the ability of precise reconstruction.
- Abstract(参考訳): 近年,3次元表現の学習に注目が集まっている。
しかし、多くの人体制約の複雑さと監督データの欠如は、既存の作業が意味論や表現能力の観点から人体を制御的かつ正確に表現することを制限する。
本稿では、制御可能な微粒なセマンティクスと、教師なし学習フレームワークにおける高精度な再構築による人体表現を提案する。
特に,身体と潜伏符号の幾何学的意味的測定の対応を学習するための骨格群アンタングル戦略を設計し,潜伏符号パラマーの修正による人体形状と姿勢の制御を容易にする。
骨格群全体を意識したエンコーダと教師なしの非教師付きアンタングル化損失の助けを借りて,我々の表現モデルは教師なしの方法で学習される。
さらに、複雑な身体形状とポーズ空間において人体潜伏パラメータを学習し易いように、ベーステンポレート残差学習スキームをエンコーダに注入する。
幾何学的に意味のある潜時符号のため、人体から双線形潜時符号補間まで幅広い用途で使用できる。
さらに、制御可能な微粒なセマンティクスの学習を促進するために、部分認識デコーダが使用される。
パブリックな3次元人体データセットによる実験結果から,本手法は正確な再構築が可能であることが示唆された。
関連論文リスト
- JADE: Joint-aware Latent Diffusion for 3D Human Generative Modeling [62.77347895550087]
JADEは人体形状の変化を微粒化制御で学習する生成フレームワークである。
私たちの重要な洞察は、人体を骨格構造に分解する共同認識の潜伏表現です。
提案した分解条件下でのコヒーレントで可塑性な人体形状を生成するため,カスケードパイプラインも提案する。
論文 参考訳(メタデータ) (2024-12-29T14:18:35Z) - Topology-aware Human Avatars with Semantically-guided Gaussian Splatting [18.421585526595944]
本研究では, セマンティクスを組み込んだ3次元ガウス, 骨格駆動型剛性変形, および非剛性布の動的変形を用いて, フォトリアリスティックな人間のアバターを創出するSG-GSを提案する。
我々は,人間のアバター変形にトポロジカルおよび幾何学的アソシエーションを統合する3Dネットワークを採用している。
論文 参考訳(メタデータ) (2024-08-19T02:58:20Z) - HINT: Learning Complete Human Neural Representations from Limited Viewpoints [69.76947323932107]
我々は、限られた視野角から詳細な人間のモデルを学習できるNeRFベースのアルゴリズムを提案する。
その結果,数個の視角からでも完全な人間の再構築が可能となり,性能は15%以上向上した。
論文 参考訳(メタデータ) (2024-05-30T05:43:09Z) - COAP: Compositional Articulated Occupancy of People [28.234772596912162]
人体を明瞭に表現する新しい神経暗黙表現法を提案する。
我々は、ニューラルネットワークの占有度を学習するために、部分認識エンコーダデコーダアーキテクチャを採用する。
提案手法は, 効率と精度の両面において, 既存の解よりも優れていた。
論文 参考訳(メタデータ) (2022-04-13T06:02:20Z) - LatentHuman: Shape-and-Pose Disentangled Latent Representation for Human
Bodies [78.17425779503047]
本稿では,人体に対する新しい暗黙の表現法を提案する。
完全に微分可能で、非交叉形状で最適化可能であり、潜在空間を映し出す。
我々のモデルは、よく設計された損失を伴う、水密でない生データを直接訓練し、微調整することができる。
論文 参考訳(メタデータ) (2021-11-30T04:10:57Z) - 3D Neural Scene Representations for Visuomotor Control [78.79583457239836]
我々は2次元視覚観測から動的3次元シーンのモデルを純粋に学習する。
学習した表現空間上に構築された動的モデルにより,操作課題に対するビジュモータ制御が可能となる。
論文 参考訳(メタデータ) (2021-07-08T17:49:37Z) - LEAP: Learning Articulated Occupancy of People [56.35797895609303]
我々は、人体の新たな神経占有表現であるleap(learning articulated occupancy of people)を紹介する。
骨変換の集合と空間内の問合せ点が与えられると、leapはまずクエリポイントを学習線形ブレンドスキン(lbs)関数を介して正準空間にマッピングする。
LEAPは、正則空間における正確な同一性およびポーズ依存変形をモデル化する占有ネットワークを介して、占有値を効率的にクエリする。
論文 参考訳(メタデータ) (2021-04-14T13:41:56Z) - Learning Semantics-enriched Representation via Self-discovery,
Self-classification, and Self-restoration [12.609383051645887]
医用画像下の解剖学の自己発見、自己分類、自己復元により、セマンティックに富んだ視覚表現を学ぶために、深層モデルを訓練する。
セマンティック・ジェネシス(Semantic Genesis)は、6つの異なる目標タスクにおいて、自己監督または完全な監督によって、一般に利用可能なすべての事前訓練されたモデルで検証する。
実験の結果,セマンティック・ジェネシスは2次元画像ネットワークを用いたデファクト・トランスファー・ラーニングと同様に,その3次元の全てをはるかに上回っていることがわかった。
論文 参考訳(メタデータ) (2020-07-14T10:36:10Z) - Chained Representation Cycling: Learning to Estimate 3D Human Pose and
Shape by Cycling Between Representations [73.11883464562895]
本稿では,教師なし,あるいは教師なしの学習を容易にする新しいアーキテクチャを提案する。
本研究では,非ペア画像と無注釈画像から3次元人物のポーズと形状を学習することにより,その手法を実証する。
人間をモデル化するための結果を示す一方で、私たちの定式化は一般的であり、他の視覚問題にも適用できる。
論文 参考訳(メタデータ) (2020-01-06T14:54:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。