論文の概要: OmniClone: Engineering a Robust, All-Rounder Whole-Body Humanoid Teleoperation System
- arxiv url: http://arxiv.org/abs/2603.14327v1
- Date: Sun, 15 Mar 2026 11:13:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-21 18:33:56.825056
- Title: OmniClone: Engineering a Robust, All-Rounder Whole-Body Humanoid Teleoperation System
- Title(参考訳): OmniClone:ロバストで全輪のヒューマノイド遠隔操作システム
- Authors: Yixuan Li, Le Ma, Yutang Lin, Yushi Du, Mengya Liu, Kaizhe Hu, Jieming Cui, Yixin Zhu, Wei Liang, Baoxiong Jia, Siyuan Huang,
- Abstract要約: 全身のヒューマノイド遠隔操作により、人間が遠隔操作でヒューマノイドロボットを操作でき、リアルタイムの操作ツールと、自律学習のためのデモを収集するためのスケーラブルなエンジンの両方を提供する。
ここでは,データ要求の少ない単一コンシューマに対して,高忠実でマルチスキルの制御を実現する,全身型ヒューマノイド遠隔操作システムであるOmniCloneを紹介する。
- 参考スコア(独自算出の注目度): 39.72804196709836
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Whole-body humanoid teleoperation enables humans to remotely control humanoid robots, serving as both a real-time operational tool and a scalable engine for collecting demonstrations for autonomous learning. Despite recent advances, existing systems are validated using aggregate metrics that conflate distinct motion regimes, masking critical failure modes. This lack of diagnostic granularity, compounded by tightly coupled and labor-intensive system configurations, hinders robust real-world deployment. A key open challenge is building a teleoperation system that is simultaneously robust, versatile, and affordable for practical use. Here we present OmniClone, a whole-body humanoid teleoperation system that achieves high-fidelity, multi-skill control on a single consumer GPU with modest data requirements. Central to our approach is OmniBench, a diagnostic benchmark that evaluates policies across stratified motion categories and difficulty levels on unseen motions, exposing the narrow specialization of prior systems. Guided by these diagnostics, we identify an optimized training data recipe and integrate system-level improvements: subject-agnostic retargeting and robust communication, that collectively reduce Mean Per-Joint Position Error (MPJPE) by over 66% while requiring orders-of-magnitude fewer computational resources than comparable methods. Crucially, OmniClone is control-source-agnostic: a single unified policy supports real-time teleoperation, generated motion playback, and Vision-Language-Action (VLA) models, while generalizing across operators of vastly different body proportions. By uniting diagnostic evaluation with practical engineering, OmniClone provides an accessible foundation for scalable humanoid teleoperation and autonomous learning.
- Abstract(参考訳): 全身のヒューマノイド遠隔操作により、人間が遠隔操作でヒューマノイドロボットを操作でき、リアルタイムの操作ツールと、自律学習のためのデモを収集するためのスケーラブルなエンジンの両方を提供する。
近年の進歩にもかかわらず、既存のシステムは、異なる動作レギュレーションを分割し、致命的な障害モードを隠蔽する集約メトリクスを使用して検証されている。
このような診断の粒度の欠如は、密結合された労働集約的なシステム構成によって複雑化され、堅牢な現実世界の展開を妨げる。
重要なオープンな課題は、同時に堅牢で、汎用的で、実用的な用途に安価な遠隔操作システムを構築することだ。
ここでは、控えめなデータ要求を伴う単一のコンシューマGPU上で、高忠実でマルチスキルな制御を実現する、全身のヒューマノイド遠隔操作システムであるOmniCloneを紹介する。
OmniBenchは、階層化された動作カテゴリのポリシーと見えない動作の難易度を評価し、先行システムの狭い特殊化を明らかにする診断ベンチマークである。
主観的再ターゲティングとロバストなコミュニケーションにより、平均接続位置誤差(MPJPE)が66%以上減少し、計算リソースのオーダーオブマグニチュードは同等の手法よりも少なくなる。
重要な点として、OmniCloneはコントロールソースに依存しない: リアルタイム遠隔操作、生成されたモーション再生、ビジョン・ランゲージ・アクション(VLA)モデルをサポートする単一の統一ポリシー。
OmniCloneは、診断評価を実用工学と組み合わせることで、スケーラブルなヒューマノイド遠隔操作と自律学習のためのアクセス可能な基盤を提供する。
関連論文リスト
- HumDex: Humanoid Dexterous Manipulation Made Easy [30.352529523812347]
HumDexは、ヒューマノイド全体のデキスタラス操作用に設計された携帯型遠隔操作システムである。
本システムは、IMUに基づくモーショントラッキングを利用して、ポータビリティと精度のトレードオフに対処する。
そこで本研究では,手動パラメータチューニングを伴わないスムーズで自然な手の動きを学習ベースで生成する手法を提案する。
論文 参考訳(メタデータ) (2026-03-12T17:59:39Z) - ULTRA: Unified Multimodal Control for Autonomous Humanoid Whole-Body Loco-Manipulation [55.467742403416175]
本稿では,大規模モーションキャプチャをヒューマノイドに変換する物理駆動型ニューラルネットワークを提案する。
我々は高密度参照とスパースタスク仕様の両方をサポートする統合マルチモーダルコントローラを学習する。
その結果,ULTRAは自我中心の知覚から,自律的,目標条件付き全体ロコ操作に一般化することが示された。
論文 参考訳(メタデータ) (2026-03-03T18:59:29Z) - End-to-End Dexterous Arm-Hand VLA Policies via Shared Autonomy: VR Teleoperation Augmented by Autonomous Hand VLA Policy for Efficient Data Collection [10.217810309422232]
マクロモーションとマイクロモーションの制御を分割するフレームワークを提案する。
人間のオペレーターが直感的なVR遠隔操作を通してロボットの腕のポーズをガイドします。
自律的なDexGrasp-VLAポリシは、リアルタイム触覚と視覚フィードバックを使用して、きめ細かい手制御を処理する。
論文 参考訳(メタデータ) (2025-10-31T16:12:02Z) - FrankenBot: Brain-Morphic Modular Orchestration for Robotic Manipulation with Vision-Language Models [35.83717913117858]
VLM(Vision-Language Models)は豊かな世界知識を獲得し、例外的なシーン理解とマルチモーダル推論能力を示している。
本稿では,VLM駆動型脳型ロボット操作フレームワークであるFrankenBotを提案する。
論文 参考訳(メタデータ) (2025-06-24T14:11:22Z) - Casper: Inferring Diverse Intents for Assistive Teleoperation with Vision Language Models [50.19518681574399]
現実の遠隔操作における中心的な課題は、ロボットがユーザー制御入力から幅広い人間の意図を推測することである。
我々は、事前学習された視覚言語モデルに埋め込まれたコモンセンス知識を活用する、支援型遠隔操作システムであるCasperを紹介する。
我々は,Casperがタスク性能を改善し,人間の認知負荷を低減し,直接遠隔操作や補助遠隔操作のベースラインよりもユーザ満足度が高いことを示す。
論文 参考訳(メタデータ) (2025-06-17T17:06:43Z) - Scalable Vehicle Re-Identification via Self-Supervision [66.2562538902156]
自動車再同定は、都市規模の車両分析システムにおいて重要な要素の1つである。
車両再設計のための最先端のソリューションの多くは、既存のre-idベンチマークの精度向上に重点を置いており、計算の複雑さを無視することが多い。
推論時間に1つのネットワークのみを使用する自己教師型学習によって、シンプルで効果的なハイブリッドソリューションを提案する。
論文 参考訳(メタデータ) (2022-05-16T12:14:42Z) - Learning Multi-Arm Manipulation Through Collaborative Teleoperation [63.35924708783826]
模倣学習(il)はロボットに操作タスクを実行するための強力なパラダイムである。
多くの現実世界のタスクは、重い物体を持ち上げる、デスクを組み立てるなど、複数のアームを必要とする。
複数のリモートユーザが同時にロボットアームを遠隔操作できるマルチユーザデータ収集プラットフォームであるMulti-Arm RoboTurk(MART)を紹介した。
論文 参考訳(メタデータ) (2020-12-12T05:43:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。