論文の概要: Any2Any: Efficient Cross-Embodiment Transfer for Humanoid Whole-Body Tracking
- arxiv url: http://arxiv.org/abs/2605.23733v1
- Date: Fri, 22 May 2026 15:10:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 17:29:20.406364
- Title: Any2Any: Efficient Cross-Embodiment Transfer for Humanoid Whole-Body Tracking
- Title(参考訳): Any2Any:Humanoid Whole-Body Trackingのための効率的なクロス・エボディメント・トランスファー
- Authors: Ming Yang, Tao Yu, Feng Li, Hua Chen,
- Abstract要約: 全身追跡(WBT)モデルはヒューマノイドロボットの重要な基盤となっている。
我々は既存のWBTスペシャリストを新しいヒューマノイドに効率的に移行するパラダイムであるAny2Anyを提案する。
実験によると、Any2Anyは、スクラッチからのトレーニングと比較して、コンバージェンスを大幅に加速し、トレーニングコストを削減している。
- 参考スコア(独自算出の注目度): 14.728045391865406
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Whole-body tracking (WBT) models have become a key foundation for humanoid robots, enabling them to imitate diverse motions with high fidelity. Training such models from scratch requires large-scale data and computation, making rapid deployment on new humanoid platforms costly. This raises a natural question: Can pretrained WBT models transfer across embodiments with minimal adaptation? To answer this question, we propose Any2Any, a paradigm that efficiently transfers an existing WBT specialist to a new humanoid embodiment with only a small amount of data and compute. Any2Any first performs kinematic alignment between source and target humanoids, aligning their input and output spaces so that the pretrained source policy can be meaningfully reused on the target embodiment.Any2Any then performs dynamics adaptation by applying lightweight parameter-efficient fine-tuning (PEFT) components to selected dynamics-sensitive modules, preserving useful behavioral priors while enabling targeted adaptation to the target robot. Extensive experiments on multiple humanoid platforms and pretrained backbones show that Any2Any substantially accelerates convergence and reduces training cost compared with training from scratch, while achieving competitive or superior tracking performance. Notably, using only 1% of the compute and data required for full training, Any2Any successfully transfers Sonic models pre-trained on Unitree G1 to LimX Oli and LimX Luna. These results suggest that pretrained WBT specialists can be efficiently reused across embodiments, providing a scalable path toward deploying humanoid whole-body control on new robots.
- Abstract(参考訳): 全身追跡(WBT)モデルはヒューマノイドロボットの重要な基盤となり、高い忠実度で多様な動きを模倣することができる。
このようなモデルをスクラッチからトレーニングするには大規模なデータと計算が必要であり、新しいヒューマノイドプラットフォームへの迅速なデプロイにコストがかかる。
事前訓練されたWBTモデルは、最小限の適応で実施可能なのか?
そこで本研究では,既存のWBT専門家を少ないデータと計算量しか持たない新しいヒューマノイドに効率的に移行するパラダイムであるAny2Anyを提案する。
Any2Anyはまず、まず、ソースとターゲットのヒューマノイド間のキネマティックアライメントを行い、その入力と出力空間をアライメントして、トレーニング済みのソースポリシーをターゲットのエボディメント上で有意義に再利用する。
複数のヒューマノイドプラットフォームと事前訓練されたバックボーンの広範囲な実験により、Any2Anyはコンバージェンスを大幅に加速し、スクラッチからのトレーニングよりもトレーニングコストを削減し、競争力や優れたトラッキング性能を実現している。
特に、フルトレーニングに必要な計算とデータの1%しか使用していないAny2Anyは、Unitree G1で事前トレーニングされたSonicモデルをLimX OliとLimX Lunaに転送することに成功している。
これらの結果は、事前訓練されたWBTスペシャリストをエボディメント全体にわたって効率的に再利用することができ、新しいロボットにヒューマノイド全体の制御を展開するためのスケーラブルな経路を提供することを示唆している。
関連論文リスト
- One-shot Humanoid Whole-body Motion Learning [18.375746497945023]
通常、動作カテゴリごとに複数のトレーニングサンプルを必要とする。
本研究では,1つの非歩行目標運動サンプルのみを用いて,効果的なヒューマノイド運動ポリシーを訓練する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2025-10-29T07:48:10Z) - TrajBooster: Boosting Humanoid Whole-Body Manipulation via Trajectory-Centric Learning [79.59753528758361]
両足のVLAを促進するために、豊富な車輪付きヒューマノイドデータを活用するクロス・エボディメント・フレームワークであるTrajBoosterを提案する。
私たちのキーとなる考え方は、形態素に依存しないインターフェースとして、エンドエフェクタ・トラジェクトリを使用することです。
以上の結果から,TrajBoosterは既存の車輪付きヒューマノイドデータにより,二足歩行ヒューマノイドVLAの性能を効率的に向上させることができることがわかった。
論文 参考訳(メタデータ) (2025-09-15T12:25:39Z) - Is Diversity All You Need for Scalable Robotic Manipulation? [50.747150672933316]
ロボット学習におけるデータ多様性の役割について,従来の「より多様な方がよい」という直観に固執する3つの重要な次元(タスク),実施形態(ロボットの使用方法),専門家(専門家)を用いて検討する。
タスクの多様性は、タスクごとのデモンストレーション量よりも重要であり、多様な事前学習タスクから新しい下流シナリオへの移行に有効であることを示す。
本稿では,速度のあいまいさを緩和する分散デバイアス法を提案する。GO-1-Proは,2.5倍の事前学習データを用いて,15%の性能向上を実現している。
論文 参考訳(メタデータ) (2025-07-08T17:52:44Z) - Action-Minimization Meets Generative Modeling: Efficient Transition Path Sampling with the Onsager-Machlup Functional [2.010573982216398]
現在の機械学習アプローチでは、高価でタスク固有の、データフリーなトレーニング手順を採用している。
多様な分子系へのアプローチを実証し、多様で物理的に現実的な遷移経路を得る。
提案手法は,新たな生成モデルに容易に組み込むことが可能である。
論文 参考訳(メタデータ) (2025-04-25T17:17:17Z) - ExPLoRA: Parameter-Efficient Extended Pre-Training to Adapt Vision Transformers under Domain Shifts [52.1635661239108]
本稿では,事前学習された視覚変換器(ViT)のドメインシフト下での伝達学習を改善するために,ExPLoRAを提案する。
我々の実験は、衛星画像の最先端の成果を実証し、完全な事前学習や微調整のViTよりも優れています。
論文 参考訳(メタデータ) (2024-06-16T15:14:56Z) - FTFT: Efficient and Robust Fine-Tuning by Transferring Training Dynamics [7.58472343957521]
トレーニングダイナミクスは,モデルサイズや事前学習手法間で非常に伝達可能であることを示す。
本稿では,TransFerring Training dynamics (FTFT)によるファインチューニング手法を提案する。
論文 参考訳(メタデータ) (2023-10-10T12:53:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。