Fugu-MT 論文翻訳(概要): ClothTransformer: Unified Latent-Space Transformers for Scalable Cloth Simulation

論文の概要: ClothTransformer: Unified Latent-Space Transformers for Scalable Cloth Simulation

arxiv url: http://arxiv.org/abs/2605.27852v2
Date: Thu, 04 Jun 2026 12:17:18 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-06 06:55:34.568905
Title: ClothTransformer: Unified Latent-Space Transformers for Scalable Cloth Simulation
Title（参考訳）: Cloth Transformer: スケーラブルなクロースシミュレーションのための統一ラテント空間変換器
Authors: Yu Zhang, Yidi Shao, Wenqi Ouyang, Yushi Lan, Zhexin Liang, Chengrui Wu, Xudong Xu, Xingang Pan,
Abstract要約: 自動回帰シーケンスモデリングとして布シミュレーションを再構成するフレームワークであるClosTransformerを提案する。既存のニューラルネットワークシミュレータは主に単一のシナリオに特化しており、本質的にメッシュの離散化に結びついている。このアプローチは3つのコントリビューションを通じてこれらの制限に対処します。
参考スコア（独自算出の注目度）: 28.646171436727233
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Unified and scalable Transformers have recently achieved remarkable success in modeling diverse phenomena traditionally associated with computer graphics, such as 3D visual effects, rendering processes, and motion in videos. In this work, we take a step further by investigating whether modern Transformer techniques can tackle the challenging task of cloth simulation. To this end, we present ClothTransformer, a framework that reformulates cloth simulation as autoregressive sequence modeling in a learned latent space. Existing neural cloth simulators are largely specialized to single scenarios, intrinsically coupled to the mesh discretization, and lack robust collision handling. Our approach addresses these limitations through three contributions: (1) a unified Transformer architecture that handles diverse scenarios -- body-driven garments, robotic manipulation, and free-fall collisions -- under a single model and achieves approximately $4$--$9{\times}$ lower error than prior state-of-the-art methods across all scenarios; (2) a scalable latent-space formulation that compresses arbitrary-resolution meshes into a fixed-size set of latent tokens, making temporal dynamics computation independent of mesh resolution; and (3) a diverse-scenario high-fidelity penetration-free dataset of ${\sim}$493.4k frames spanning all three settings, which enables a differentiable Continuous Collision Detection (CCD) module to suppress penetration artifacts. Project Page: https://yucrazing.github.io/clothtransformer/
Abstract（参考訳）: 統一されたスケーラブルなトランスフォーマーは、3Dビジュアルエフェクト、レンダリングプロセス、動画のモーションなど、伝統的にコンピュータグラフィックスに関連する様々な現象をモデル化することに成功した。本研究では,現代のトランスフォーマー技術が布地シミュレーションの課題に対処できるかどうかを考察する。この目的のために,学習された潜在空間における自己回帰シーケンスモデリングとして布シミュレーションを再構成するフレームワークであるClosTransformerを提案する。既存のニューラルネットワークシミュレータは、主に単一のシナリオに特化しており、本質的にメッシュの離散化と結びついており、堅牢な衝突処理が欠如している。このアプローチは,(1) 多様なシナリオを扱う統一トランスフォーマーアーキテクチャ -- ボディ駆動の衣服,ロボット操作,フリーフォールの衝突 -- を単一モデルで処理し,約4ドル～9ドル(約4,800円)の誤差を達成します。(2) 任意の解像度メッシュを固定サイズの遅延トークンのセットに圧縮するスケーラブルなラテントスペースの定式化,(3) メッシュ解決とは無関係な時間動的計算を実現する,(3) 多様なシナリオの高忠実なペネトレーションフリーデータセットである${\sim}$493.4k フレームの3つの設定にまたがって,異なる連続衝突検出(CCD)を可能にする。 Project Page: https://yucrazing.github.io/clothtransformer/

関連論文リスト

Part-Level 3D Gaussian Vehicle Generation with Joint and Hinge Axis Estimation [19.45064081855758]
シミュレーションは自動運転に不可欠であるが、現在のフレームワークは、しばしば車両を剛性資産としてモデル化し、部分レベルの調音を捉えるのに失敗する。本稿では,単一画像やスパース多視点入力からアニマタブルな3次元ガウス車両を合成する生成フレームワークを提案する。提案手法は2つの課題に対処する: (i) 大きな3Dアセットジェネレータは静的な品質に最適化されているが, 調音には最適化されていない; (ii) セグメンテーションだけでは運動に必要な運動パラメータは提供できない。
論文参考訳（メタデータ） (2026-04-06T18:16:12Z)
MotionAnymesh: Physics-Grounded Articulation for Simulation-Ready Digital Twins [25.25391483526521]
MotionAnymeshは、非構造化の静的メッシュをシミュレーション可能なデジタルツインにシームレスに変換するフレームワークである。提案手法は, VLM推論をSP4D物理先行値で根拠とした運動認識部分分割モジュールを特徴とする。
論文参考訳（メタデータ） (2026-03-13T12:30:42Z)
DiffusionHarmonizer: Bridging Neural Reconstruction and Photorealistic Simulation with Online Diffusion Enhancer [62.18680935878919]
レンダリングを時間的に一貫した出力に変換するオンライン生成拡張フレームワークであるDiffusionHarmonizerを紹介した。コアとなるのは、単一のGPU上でオンラインシミュレータで実行可能な、一段階の時間的条件付きエンハンサーである。
論文参考訳（メタデータ） (2026-02-27T15:35:30Z)
Transolver-3: Scaling Up Transformer Solvers to Industrial-Scale Geometries [51.028432812178266]
Transolver-3は、高忠実度物理シミュレーションのために設計されたTransolverファミリーの新しいメンバーである。 Transolver-3は1億6000万以上のセルでメッシュを処理でき、3つの挑戦的なシミュレーションベンチマークで優れたパフォーマンスを実現している。
論文参考訳（メタデータ） (2026-02-04T16:52:44Z)
AGILE: Hand-Object Interaction Reconstruction from Video via Agentic Generation [45.753757870577196]
本稿では,対話学習のためのエージェント生成にパラダイムを転換する,堅牢なフレームワークAGILEを紹介する。我々はAGILEがグローバルな幾何学的精度でベースラインを上回り、先行技術が頻繁に崩壊する挑戦的なシーケンスに対して、例外的な堅牢性を証明していることを示す。
論文参考訳（メタデータ） (2026-02-04T15:42:58Z)
StdGEN++: A Comprehensive System for Semantic-Decomposed 3D Character Generation [57.06461272772509]
StdGEN++は、多種多様な入力から高忠実で意味的に分解された3D文字を生成するための、新しく包括的なシステムである。最先端の性能を達成し、幾何学的精度と意味的絡み合いにおいて既存の手法を著しく上回っている。結果として、非破壊的な編集、物理学に準拠したアニメーション、視線追跡など、より進んだ下流の機能をアンロックする。
論文参考訳（メタデータ） (2026-01-12T15:41:27Z)
Surrogate compliance modeling enables reinforcement learned locomotion gaits for soft robots [5.193389420813379]
適応型形態形成ロボットは、変化するタスクや環境条件を満たすために形態と制御ポリシーに適応する。このようなシステムの多くは、形状変形を可能にするソフトコンポーネントを利用するが、シミュレーションや制御の課題も導入している。本稿では,ソフトボディ物理を明示的にモデル化する代わりに,剛体シミュレータ内でのソフトマテリアル変形を表す間接変数を導入する。
論文参考訳（メタデータ） (2025-12-08T02:52:42Z)
MoDA: Modeling Deformable 3D Objects from Casual Videos [84.29654142118018]
神経二元四元系ブレンドスキンニング(NeuDBS)を提案し,スキンを折り畳むことなく3次元点変形を実現する。異なるフレーム間で2Dピクセルを登録する試みにおいて、標準空間内の3D点を符号化する標準特徴埋め込みの対応性を確立する。本手法は,ヒトと動物の3Dモデルを,最先端の手法よりも質的,定量的な性能で再構築することができる。
論文参考訳（メタデータ） (2023-04-17T13:49:04Z)
gradSim: Differentiable simulation for system identification and visuomotor control [66.37288629125996]
本稿では,微分可能マルチフィジカルシミュレーションと微分可能レンダリングを活用し,3次元監督への依存を克服するフレームワークであるgradsimを提案する。当社の統合グラフは、状態ベースの(3D)監督に頼ることなく、挑戦的なバイスモメータ制御タスクで学習を可能にします。
論文参考訳（メタデータ） (2021-04-06T16:32:01Z)
Deep Deformation Detail Synthesis for Thin Shell Models [47.442883859643004]
物理ベースの布アニメーションでは、高価な計算リソースと巨大な労働調整のコストで豊富な折り畳みと詳細なしわが達成されます。我々は,低分解能メッシュから詳細なメッシュへのマッピングを学ぶために,時間的および空間的に整合可能な変形表現(ts-acap)と変形変換ネットワークを開発した。提案手法は, 物理シミュレーションより1035倍高速で, 既存の手法よりも高精度な合成能力を有する, 様々なフレームレートで, 信頼性の高いリアルなアニメーションを作成できる。
論文参考訳（メタデータ） (2021-02-23T08:09:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。