論文の概要: HandX: Scaling Bimanual Motion and Interaction Generation
- arxiv url: http://arxiv.org/abs/2603.28766v1
- Date: Mon, 30 Mar 2026 17:59:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.562228
- Title: HandX: Scaling Bimanual Motion and Interaction Generation
- Title(参考訳): HandX: 双方向動作のスケーリングとインタラクション生成
- Authors: Zimu Zhang, Yucheng Zhang, Xiyan Xu, Ziyin Wang, Sirui Xu, Kai Zhou, Bing Zhou, Chuan Guo, Jian Wang, Yu-Xiong Wang, Liang-Yan Gui,
- Abstract要約: HandXはデータ、アノテーション、評価にまたがる統一された基盤である。
既存のデータセットを統合・フィルタリングし、新しいモーションキャプチャーデータセットを収集します。
新たに提案した手中心の指標によって支援された高品質なデキスタラスモーション生成実験を行った。
- 参考スコア(独自算出の注目度): 55.486397101415
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Synthesizing human motion has advanced rapidly, yet realistic hand motion and bimanual interaction remain underexplored. Whole-body models often miss the fine-grained cues that drive dexterous behavior, finger articulation, contact timing, and inter-hand coordination, and existing resources lack high-fidelity bimanual sequences that capture nuanced finger dynamics and collaboration. To fill this gap, we present HandX, a unified foundation spanning data, annotation, and evaluation. We consolidate and filter existing datasets for quality, and collect a new motion-capture dataset targeting underrepresented bimanual interactions with detailed finger dynamics. For scalable annotation, we introduce a decoupled strategy that extracts representative motion features, e.g., contact events and finger flexion, and then leverages reasoning from large language models to produce fine-grained, semantically rich descriptions aligned with these features. Building on the resulting data and annotations, we benchmark diffusion and autoregressive models with versatile conditioning modes. Experiments demonstrate high-quality dexterous motion generation, supported by our newly proposed hand-focused metrics. We further observe clear scaling trends: larger models trained on larger, higher-quality datasets produce more semantically coherent bimanual motion. Our dataset is released to support future research.
- Abstract(参考訳): 人間の動きの合成は急速に進んでいるが、現実的な手の動きと双方向の相互作用は未解明のままである。
全身モデルは、器用な振る舞い、指の関節、接触タイミング、手動調整を駆動するきめ細かなキューを見逃すことが多く、既存のリソースは、ニュアンスドフィンガーのダイナミックスとコラボレーションをキャプチャする高忠実なバイマンシーケンスを欠いている。
このギャップを埋めるために、データ、アノテーション、評価にまたがる統一基盤であるHandXを提案する。
我々は、既存のデータセットを質のために統合し、フィルタリングし、詳細な指のダイナミックスと過度に表現されたバイマニュアル相互作用をターゲットとした、新しいモーションキャプチャーデータセットを収集する。
拡張性のあるアノテーションには、例えば接触イベントや指の屈曲といった代表動作の特徴を抽出し、それから大きな言語モデルからの推論を活用して、これらの特徴に沿った細粒度で意味的にリッチな記述を生成する、分離された戦略を導入する。
得られたデータとアノテーションに基づいて,多目的条件付き拡散モデルと自己回帰モデルをベンチマークする。
新たに提案した手中心の指標によって支援された高品質なデキスタラスモーション生成実験を行った。
大規模で高品質なデータセットでトレーニングされたより大きなモデルは、よりセマンティックに一貫性のあるバイマンダルモーションを生成する。
私たちのデータセットは将来の研究をサポートするためにリリースされています。
関連論文リスト
- InterAct: Advancing Large-Scale Versatile 3D Human-Object Interaction Generation [54.09384502044162]
大規模な3D HOIベンチマークであるInterActを導入する。
まず、さまざまなソースから21.81時間のHOIデータを統合し、標準化し、詳細なテキストアノテーションで強化する。
第2に、アーティファクトの削減と手の動きの修正によりデータ品質を向上させる統一的な最適化フレームワークを提案する。
第3に,6つのベンチマークタスクを定義し,HOI生成モデリングの視点を統一し,最先端性能を実現する。
論文 参考訳(メタデータ) (2025-09-11T15:43:54Z) - BOTH2Hands: Inferring 3D Hands from Both Text Prompts and Body Dynamics [50.88842027976421]
両手動作生成のための新しいマルチモーダルデータセットBOTH57Mを提案する。
私たちのデータセットには、人体と手の動きの正確な追跡が含まれています。
また,新しいタスクのための強力なベースライン手法であるBOTH2Handsも提供する。
論文 参考訳(メタデータ) (2023-12-13T07:30:19Z) - HandDiffuse: Generative Controllers for Two-Hand Interactions via Diffusion Models [46.55793470308987]
既存の手データセットは概ね短距離であり、手の自己閉塞と自己相似性のために相互作用は弱い。
データの不足を解消するために,強い双方向相互作用を持つ時間列からなる新しいデータセットであるHandDiffuse12.5Mを提案する。
論文 参考訳(メタデータ) (2023-12-08T07:07:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。