論文の概要: ParTY: Part-Guidance for Expressive Text-to-Motion Synthesis
- arxiv url: http://arxiv.org/abs/2603.09611v1
- Date: Tue, 10 Mar 2026 12:53:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-11 15:25:24.316676
- Title: ParTY: Part-Guidance for Expressive Text-to-Motion Synthesis
- Title(参考訳): ParTY: 表現型テキスト間合成のためのパートガイド
- Authors: KunHo Heo, SuYeon Kim, Yonghyun Gwon, Youngbin Kim, MyeongAh Cho,
- Abstract要約: 本稿では,コヒーレントな全身運動を発生させながら部分表現性を高める新しいフレームワークであるParTYを提案する。
ParTY は,(1) 部分動作を生成する部分ガイドネットワーク,(2) テキスト埋め込みを多様に変換し,各本体に適切にアライメントする部分認識テキストグラウンド,(3) 全体動作と部分動作を適応的に融合する全体的部分フュージョンからなる。
- 参考スコア(独自算出の注目度): 16.628208335930857
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Text-to-motion synthesis aims to generate natural and expressive human motions from textual descriptions. While existing approaches primarily focus on generating holistic motions from text descriptions, they struggle to accurately reflect actions involving specific body parts. Recent part-wise motion generation methods attempt to resolve this but face two critical limitations: (i) they lack explicit mechanisms for aligning textual semantics with individual body parts, and (ii) they often generate incoherent full-body motions due to integrating independently generated part motions. To overcome these issues and resolve the fundamental trade-off in existing methods, we propose ParTY, a novel framework that enhances part expressiveness while generating coherent full-body motions. ParTY comprises: (1) Part-Guided Network, which first generates part motions to obtain part guidance, then uses it to generate holistic motions; (2) Part-aware Text Grounding, which diversely transforms text embeddings and appropriately aligns them with each body part; and (3) Holistic-Part Fusion, which adaptively fuses holistic motions and part motions. Extensive experiments, including part-level and coherence-level evaluations, demonstrate that ParTY achieves substantial improvements over previous methods.
- Abstract(参考訳): テキスト・トゥ・モーション合成は、テキスト記述から自然で表現力のある人間の動作を生成することを目的としている。
既存のアプローチは、主にテキスト記述から全体像を生成することに重点を置いているが、それらは特定の身体部分に関わる動作を正確に反映するのに苦労している。
最近のパートワイズ・モーション・ジェネレーション手法は、この問題を解決しようとするが、2つの限界に直面している。
一 個々の身体部分とテキスト意味論を整合させる明確な機構が欠如していること。
(II)独立に生成された部分運動を統合することにより、不整合体運動を生じることが多い。
これらの問題を克服し、既存の手法の基本的なトレードオフを解決するために、コヒーレントな全体運動を生成しながら部分表現性を高める新しいフレームワークであるParTYを提案する。
ParTY は,(1) 部分動作を生成する部分ガイドネットワーク,(2) テキスト埋め込みを多様に変換し,各本体に適切にアライメントする部分認識テキストグラウンド,(3) 全体動作と部分動作を適応的に融合する全体的部分フュージョンからなる。
部分レベルとコヒーレンスレベルの評価を含む広範囲な実験は、ParTYが従来の方法よりも大幅に改善されていることを示す。
関連論文リスト
- Beyond Global Alignment: Fine-Grained Motion-Language Retrieval via Pyramidal Shapley-Taylor Learning [56.6025512458557]
動き言語検索は、自然言語と人間の動きの間の意味的ギャップを埋めることを目的としている。
既存のアプローチは主に、全動作シーケンスとグローバルテキスト表現の整合性に重点を置いている。
本研究では,微粒な動き言語検索のためのPST学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-29T16:00:12Z) - BiPO: Bidirectional Partial Occlusion Network for Text-to-Motion Synthesis [0.4893345190925178]
BiPOは、テキスト間合成を強化する新しいモデルである。
パートベースの生成と双方向の自己回帰アーキテクチャを統合する。
BiPOはHumanML3Dデータセット上で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-11-28T05:42:47Z) - ParCo: Part-Coordinating Text-to-Motion Synthesis [48.67225204910634]
我々はParCo(Part-Coordinating Text-to-Motion Synthesis)を提案する。
ParCoには、異なる部分モーションジェネレータ間の部分モーションと通信を理解する能力が強化されている。
提案手法は, 経済計算を用いた一般的なベンチマークにおいて, 優れた性能を示すものである。
論文 参考訳(メタデータ) (2024-03-27T12:41:30Z) - HumanTOMATO: Text-aligned Whole-body Motion Generation [30.729975715600627]
本研究は,新しいテキスト駆動型全身運動生成タスクを目標とする。
高品質で多様な、一貫性のある表情、手のジェスチャー、身体の動きを同時に生成することを目的としている。
論文 参考訳(メタデータ) (2023-10-19T17:59:46Z) - SINC: Spatial Composition of 3D Human Motions for Simultaneous Action Generation [58.25766404147109]
我々のゴールは、同時動作を記述するテキスト入力を与えられた3次元人間の動作を合成することである。
我々は「空間構成」というような同時的な動きを生み出すことを指す。
論文 参考訳(メタデータ) (2023-04-20T16:01:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。