論文の概要: CLAW: Composable Language-Annotated Whole-body Motion Generation
- arxiv url: http://arxiv.org/abs/2604.11251v2
- Date: Tue, 14 Apr 2026 04:29:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 14:01:13.437006
- Title: CLAW: Composable Language-Annotated Whole-body Motion Generation
- Title(参考訳): CLAW: 構成可能な言語アノテーション付き全身運動生成
- Authors: Jianuo Cao, Yuxin Chen, Masayoshi Tomizuka,
- Abstract要約: ヒューマノイドロボットのための言語条件付き全身制御装置の訓練には、動き軌跡と自然言語記述とをペアリングする大規模なデータセットが必要である。
我々は,Unitree G1ヒューマノイドロボットのための対話型WebベースパイプラインであるCLAWを提案する。
- 参考スコア(独自算出の注目度): 55.99805728566105
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Training language-conditioned whole-body controllers for humanoid robots requires large-scale datasets pairing motion trajectories with natural-language descriptions. Existing approaches based on motion capture are costly and limited in diversity, while text-to-motion generative models produce purely kinematic outputs that are not guaranteed to be physically feasible. Therefore, we present CLAW, an interactive web-based pipeline for scalable generation of language-annotated whole-body motion data for the Unitree G1 humanoid robot. CLAW treats the motion modes of a kinematic planner as composable building blocks, each parameterized by movement, heading, speed, pelvis height and duration, and provides two browser-based interfaces -- a real-time keyboard mode and a timeline-based sequence editor -- for exploratory and batch data collection. A low-level whole-body controller tracks the planner's kinematic references in MuJoCo simulation, producing physically grounded trajectories recorded at 50Hz. Simultaneously, a deterministic template-based annotation engine generates diverse natural-language descriptions at multiple stylistic registers for every segment and for the full trajectory. We release the system as open source to support scalable generation of language-motion paired data for humanoid robot learning.
- Abstract(参考訳): ヒューマノイドロボットのための言語条件付き全身制御装置の訓練には、動き軌跡と自然言語記述とをペアリングする大規模なデータセットが必要である。
既存のモーションキャプチャーに基づくアプローチは、コストがかかり多様性が制限される一方、テキスト・トゥ・モーション生成モデルは、物理的に実現可能であることが保証されていない純粋にキネマティックな出力を生成する。
そこで本研究では,Unitree G1ヒューマノイドロボットのための対話型WebベースパイプラインであるCLAWを提案する。
CLAWは、キネマティックプランナーの動作モードを構成可能なビルディングブロックとして扱い、それぞれが動き、方向、速度、骨盤の高さと持続時間によってパラメータ化され、2つのブラウザベースのインターフェース – リアルタイムキーボードモードとタイムラインベースのシーケンスエディタ – を探索データとバッチデータ収集用に提供する。
低レベルのボディコントローラは、MuJoCoシミュレーションでプランナーのキネマティック参照を追跡し、50Hzで記録された物理的に接地された軌道を生成する。
同時に、決定論的テンプレートベースのアノテーションエンジンは、各セグメントと全行に対して複数のスタイリスティックレジスタで様々な自然言語記述を生成する。
我々はこのシステムをオープンソースとしてリリースし、ヒューマノイドロボット学習のためのスケーラブルな言語運動ペアデータ生成をサポートする。
関連論文リスト
- QuadFM: Foundational Text-Driven Quadruped Motion Dataset for Generation and Control [18.78068897227934]
テキスト・トゥ・モーション・ジェネラル・モーション・ジェネラル・モーション・コントロールのための大規模な超高忠実度データセットQuadFMを紹介した。
QuadFMには、ロコモーション、インタラクティブ、感情表現行動にまたがる11,784のキュレートされたモーションクリップが含まれている。
汎用モーションコントローラとテキスト・ツー・モーション・ジェネレータを共同でトレーニングする統合フレームワークであるGen2Control RLを提案する。
論文 参考訳(メタデータ) (2026-03-25T07:30:25Z) - TextOp: Real-time Interactive Text-Driven Humanoid Robot Motion Generation and Control [62.93681680333618]
TextOpはリアルタイムテキスト駆動型ヒューマノイドモーション生成および制御フレームワークである。
ストリーミング言語コマンドと実行中のオンザフライ命令修正をサポートする。
対話型モーション生成を堅牢な全身制御でブリッジすることで、TextOpは自由形式のインテント表現をアンロックする。
論文 参考訳(メタデータ) (2026-02-07T08:42:11Z) - Multi-Resolution Generative Modeling of Human Motion from Limited Data [3.5229503563299915]
限られたトレーニングシーケンスから人間の動きを合成することを学ぶ生成モデルを提案する。
このモデルは、骨格の畳み込み層とマルチスケールアーキテクチャを統合することで、人間の動きパターンを順応的にキャプチャする。
論文 参考訳(メタデータ) (2024-11-25T15:36:29Z) - Motion-Agent: A Conversational Framework for Human Motion Generation with LLMs [67.59291068131438]
Motion-Agentは、一般的な人間の動きの生成、編集、理解のために設計された会話フレームワークである。
Motion-Agentはオープンソースの事前学習言語モデルを使用して、モーションとテキストのギャップを埋める生成エージェントであるMotionLLMを開発した。
論文 参考訳(メタデータ) (2024-05-27T09:57:51Z) - TLControl: Trajectory and Language Control for Human Motion Synthesis [68.09806223962323]
本稿では,人間のリアルな動き合成のための新しい手法であるTLControlを提案する。
低レベルのTrajectoryと高レベルのLanguage semanticsコントロールが組み込まれている。
インタラクティブで高品質なアニメーション生成には実用的である。
論文 参考訳(メタデータ) (2023-11-28T18:54:16Z) - InterControl: Zero-shot Human Interaction Generation by Controlling Every Joint [67.6297384588837]
関節間の所望距離を維持するために,新しい制御可能な運動生成手法であるInterControlを導入する。
そこで本研究では,既成の大規模言語モデルを用いて,ヒューマンインタラクションのための結合ペア間の距離を生成できることを実証した。
論文 参考訳(メタデータ) (2023-11-27T14:32:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。