論文の概要: ETCH-X: Robustify Expressive Body Fitting to Clothed Humans with Composable Datasets
- arxiv url: http://arxiv.org/abs/2604.08548v1
- Date: Thu, 09 Apr 2026 17:59:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:06.084916
- Title: ETCH-X: Robustify Expressive Body Fitting to Clothed Humans with Composable Datasets
- Title(参考訳): ETCH-X:構成可能なデータセットを持つ人間の衣服にフィットする表現体をロバスト化する
- Authors: Xiaoben Li, Jingyi Wu, Zeyu Cai, Yu Siyuan, Boqian Li, Yuliang Xiu,
- Abstract要約: コードモデルは8D2と0.8%のデータ、例えば35.8%(MPJPE-All)やVVVVAllでリリースされる。
BEDETCHは、さまざまな入力レベルにわたって堅牢なパフォーマンスとスケーラブルな改善を実現する。
コードモデルは8D2と0.8%のデータ、例えば35.8%(MPJPE-All)やVVVVAllでリリースされる。
- 参考スコア(独自算出の注目度): 7.74087799534966
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human body fitting, which aligns parametric body models such as SMPL to raw 3D point clouds of clothed humans, serves as a crucial first step for downstream tasks like animation and texturing. An effective fitting method should be both locally expressive-capturing fine details such as hands and facial features-and globally robust to handle real-world challenges, including clothing dynamics, pose variations, and noisy or partial inputs. Existing approaches typically excel in only one aspect, lacking an all-in-one solution.We upgrade ETCH to ETCH-X, which leverages a tightness-aware fitting paradigm to filter out clothing dynamics ("undress"), extends expressiveness with SMPL-X, and replaces explicit sparse markers (which are highly sensitive to partial data) with implicit dense correspondences ("dense fit") for more robust and fine-grained body fitting. Our disentangled "undress" and "dense fit" modular stages enable separate and scalable training on composable data sources, including diverse simulated garments (CLOTH3D), large-scale full-body motions (AMASS), and fine-grained hand gestures (InterHand2.6M), improving outfit generalization and pose robustness of both bodies and hands. Our approach achieves robust and expressive fitting across diverse clothing, poses, and levels of input completeness, delivering a substantial performance improvement over ETCH on both: 1) seen data, such as 4D-Dress (MPJPE-All, 33.0% ) and CAPE (V2V-Hands, 35.8% ), and 2) unseen data, such as BEDLAM2.0 (MPJPE-All, 80.8% ; V2V-All, 80.5% ). Code and models will be released at https://xiaobenli00.github.io/ETCH-X/.
- Abstract(参考訳): SMPLのようなパラメトリックなボディモデルと、人間の生の3Dポイントの雲を合わせる人体フィッティングは、アニメーションやテクスチャといった下流のタスクにとって、重要な第一歩となる。
効果的なフィッティング方法は、手や顔の特徴などの細部を局所的に表現的にキャプチャすると同時に、衣服のダイナミックス、ポーズのバリエーション、ノイズや部分的な入力など、現実世界の課題に対処するためにグローバルに堅牢であるべきである。
我々はETCHをETCH-Xにアップグレードし、衣服のダイナミックス("undress")をフィルターするタイトネス・アウェア・フィッティング・パラダイムを活用し、SMPL-Xで表現性を拡張し、より頑丈できめ細かなボディフィッティングのために暗黙の密文("dense fit")で明示的なスパースマーカー(部分データに非常に敏感な)を置き換える。
我々の「アンドレス」と「デンスフィット」のモジュラーステージは、多様なシミュレートされた衣服(CLOTH3D)、大規模なフルボディモーション(AMASS)、細粒度のハンドジェスチャー(InterHand2.6M)など、構成可能なデータソースの分離されたスケーラブルなトレーニングを可能にします。
提案手法は, 多様な衣服, ポーズ, 入力完全性のレベルに対して, 堅牢かつ表現力のある適合性を実現し, ETCHよりも大幅な性能向上を実現している。
1) 4D-Dress(MPJPE-All, 33.0%)やCAPE(V2V-Hands, 35.8%)などのデータ。
2) BEDLAM2.0 (MPJPE-All, 80.8%, V2V-All, 80.5%) のような目に見えないデータ。
コードとモデルはhttps://xiaobenli00.github.io/ETCH-X/でリリースされる。
関連論文リスト
- DPoser-X: Diffusion Model as Robust 3D Whole-body Human Pose Prior [82.9526308672547]
DPoser-Xは3次元人体写真の拡散に基づく先行モデルである。
提案手法は,様々なポーズ中心タスクを逆問題として統一し,変分拡散サンプリングにより解決する。
我々のモデルは、常に最先端の代替品よりも優れており、人体全体のポーズを事前モデリングするための新しいベンチマークを確立している。
論文 参考訳(メタデータ) (2025-08-01T12:56:39Z) - HGMamba: Enhancing 3D Human Pose Estimation with a HyperGCN-Mamba Network [0.0]
3D人間のポーズは、推定と地道な2D人間のポーズデータをトレーニングに活用する有望な研究分野である。
既存のアプローチは、推定された2Dポーズの性能を高めることを目的としているが、地上の2Dポーズデータに適用した場合に苦労する。
本稿では2つの並列ストリームを介して入力データを処理するHyper-GCNとShuffle Mambaブロックを提案する。
論文 参考訳(メタデータ) (2025-04-09T07:28:19Z) - ETCH: Generalizing Body Fitting to Clothed Humans via Equivariant Tightness [44.830753683359184]
Equivariant Tightness Fitting for Clothed Humans(ETCH)は、布の表面マッピングを推定する新しいパイプラインである。
CAPEと4D-Dressの実験では、ETCHは最先端の手法よりも大幅に優れていた。
論文 参考訳(メタデータ) (2025-03-13T17:59:14Z) - GEAL: Generalizable 3D Affordance Learning with Cross-Modal Consistency [50.11520458252128]
既存の3Dアベイランス学習手法は、注釈付きデータに制限があるため、一般化と堅牢性に苦慮している。
本稿では,大規模事前学習型2Dモデルを活用することで,3次元アベイランス学習の一般化と堅牢性を高めるための新しいフレームワークであるGEALを提案する。
GEALは、既存のメソッドと、新しいオブジェクトカテゴリ、および破損したデータにおいて、一貫して優れています。
論文 参考訳(メタデータ) (2024-12-12T17:59:03Z) - Double-chain Constraints for 3D Human Pose Estimation in Images and
Videos [21.42410292863492]
深度情報を欠く2次元のポーズから3Dのポーズを再構築することは、人間の動きの複雑さと多様性のために困難である。
ポーズを制約する新しいモデルであるDouble-chain Graph Convolutional Transformer (DC-GCT)を提案する。
本稿では,DC-GCTが2つの挑戦的データセットに対して最先端の性能を達成することを示す。
論文 参考訳(メタデータ) (2023-08-10T02:41:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。