論文の概要: EmbodiSteer: Steering Embodiment-Agnostic Visuomotor Policies with Joint-Space Guidance for Zero-Shot Cross-Embodiment Deployment
- arxiv url: http://arxiv.org/abs/2606.12965v1
- Date: Thu, 11 Jun 2026 06:49:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.621193
- Title: EmbodiSteer: Steering Embodiment-Agnostic Visuomotor Policies with Joint-Space Guidance for Zero-Shot Cross-Embodiment Deployment
- Title(参考訳): EmbodiSteer: ゼロショットクロスエボディメント展開のための共同空間誘導型ステアリング・エボディメント非依存型バイスモータ政策
- Authors: Shihefeng Wang, Kangchen Lv, Mingrui Yu, Xiang Li,
- Abstract要約: EmbodiSteerは、ゼロショットでエボディメント対応のデプロイメントに対して、エボディメントに依存しないビズモータポリシを操縦する、トレーニング不要のフレームワークである。
衝突速度を46.1%削減し、9つの模擬ロボットでタスク成功率を28.5%向上させる。
- 参考スコア(独自算出の注目度): 7.14164117393883
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Scalable robot imitation learning relies on large-scale heterogeneous data from diverse robots or body-free data, making Cartesian end-effector actions a key interface for embodiment-agnostic policy learning. However, end-effector-only abstraction leaves Cartesian policies unaware of the deployed robot body, making them brittle under robot-specific constraints such as whole-body collision avoidance. To overcome this limitation, we present EmbodiSteer, a training-free framework that steers embodiment-agnostic visuomotor policies toward zero-shot, embodiment-aware deployment. EmbodiSteer keeps policy learning in Cartesian space while efficiently lifting inference-time diffusion sampling into the target robot's joint space via forward kinematics and Jacobian-based updates. With whole-body collision-aware guidance over joint trajectories after each denoising step, the arm can be steered away from collisions while preserving learned end-effector behavior. Compared with Cartesian-only execution, EmbodiSteer reduces collision rate by 46.1% and improves task success rate by 28.5% across 9 simulated robots, and further achieves 90.0% collision rate reduction and 36.7% success rate increase on two physical robots in highly constrained scenarios. Our project page is at https://frankwang67.github.io/EmbodiSteer-Page.
- Abstract(参考訳): スケーラブルなロボット模倣学習は、多様なロボットや無体データからの大規模な異種データに依存しており、Cartesianのエンドエフェクターアクションは、具現化に依存しないポリシー学習のための重要なインターフェースとなっている。
しかし、エンドエフェクターのみの抽象化は、展開されたロボット本体に気付かず、全身衝突回避のようなロボット固有の制約の下で脆くする。
この制限を克服するため,エボディステア(EmbodiSteer)は,ゼロショット・エボディメント・アウェア展開に向けて,エボディメントに依存しないビズモータポリシを操る,トレーニングフリーのフレームワークである。
EmbodiSteerは、フォワードキネマティクスとヤコビアンベースの更新を通じて、ターゲットロボットの関節空間への推論時間拡散サンプリングを効率的に持ち上げながら、カルテ空間におけるポリシー学習を継続する。
各認知ステップ後の関節軌道に対する全身衝突認識誘導により、学習したエンドエフェクタ動作を維持しながら、腕を衝突から遠ざけることができる。
カルテシアンのみの実行と比較して、EmbodiSteerは衝突率を46.1%削減し、9つのシミュレートされたロボットでタスク成功率を28.5%改善し、さらに高い制約のあるシナリオで2つの物理ロボットで90.0%の衝突率と36.7%の成功率向上を達成した。
私たちのプロジェクトページはhttps://frankwang67.github.io/EmbodiSteer-Page.comです。
関連論文リスト
- cuRoboV2: Dynamics-Aware Motion Generation with Depth-Fused Distance Fields for High-DoF Robots [12.825461775215366]
cuRoboV2は、シングルアームマニピュレータからフルヒューマノイドにスケールするモーション生成スタックである。
1)スムーズさとトルク制限を強制するB-スプライン軌道最適化,(2)フルワークスペースをカバーする高密度符号付き距離場を生成するGPUネイティブTS/ESDF認識パイプライン,(3)高DoFヒューマノイドにも拡張しながら最大61倍の速度で到達する逆ダイナミクスマップ-リデュース自己ネイティブ。
論文 参考訳(メタデータ) (2026-03-05T18:58:04Z) - Distributed Virtual Model Control for Scalable Human-Robot Collaboration in Shared Workspace [7.44764987825646]
仮想モデル制御(VMC)に基づく人ロボット協調のための分散型エージェント非依存・安全対応制御フレームワークを提案する。
最大2つのロボットと2つの人間との安全なコラボレーションを実証し、シミュレーションでは最大4つのロボットをシミュレーションし、エージェント間の分離を約20cmに維持する。
その結果, ロボットの動作を直感的に制御パラメータを調整し, 全てのテストシナリオにおいて, チームサイズ全体にわたるデッドロックフリー動作を実現することができた。
論文 参考訳(メタデータ) (2026-02-19T14:45:10Z) - OmniRetarget: Interaction-Preserving Data Generation for Humanoid Whole-Body Loco-Manipulation and Scene Interaction [76.44108003274955]
ヒューマノイドロボットの複雑なスキルを教えるための主要なパラダイムは、強化学習ポリシーの運動学的参照として人間の動きを再ターゲットすることである。
インタラクションメッシュに基づくインタラクション保存データ生成エンジンであるOmniRetargetを紹介する。
人間のメッシュとロボットメッシュの間のラプラシアの変形を最小限にすることで、OmniRetargetは運動学的に実現可能な軌道を生成する。
論文 参考訳(メタデータ) (2025-09-30T17:59:02Z) - FAST: Efficient Action Tokenization for Vision-Language-Action Models [98.15494168962563]
離散コサイン変換に基づくロボット動作のための圧縮に基づく新しいトークン化手法を提案する。
FASTをベースとしたFAST+は,100万個のリアルロボットアクショントラジェクトリに基づいて訓練されたユニバーサルロボットアクショントークンである。
論文 参考訳(メタデータ) (2025-01-16T18:57:04Z) - The One RING: a Robotic Indoor Navigation Generalist [58.30694487843546]
RING (Robotic Indoor Navigation Generalist) は、あらゆる移動ロボットを効果的な屋内セマンティックナビゲータに変えるための具体的方針である。
完全にシミュレーションで訓練されたRingは、ロボットによる大規模なランダム化を利用して、多くの現実世界のプラットフォームに堅牢な一般化を可能にする。
論文 参考訳(メタデータ) (2024-12-18T23:15:41Z) - Scalable Multi-Robot Informative Path Planning for Target Mapping via Deep Reinforcement Learning [11.134855513221359]
マルチロボットインフォーマティブパス計画問題に対する深層強化学習手法を提案する。
ここでは、各ロボットが発見した目標を最大化し、未知の静的障害物を回避し、ロボット同士の衝突を防ぐ。
提案手法は、発見対象数において、最先端のアプローチを少なくとも26.2%上回っている。
論文 参考訳(メタデータ) (2024-09-25T14:27:37Z) - Towards Disturbance-Free Visual Mobile Manipulation [11.738161077441104]
本研究では,新しい外乱回避手法を開発し,その中心に外乱予測の補助的課題について述べる。
Manipulathor を用いた実験の結果,新規な物体を用いた実験では,61.7% から85.6% に改善した。
論文 参考訳(メタデータ) (2021-12-17T22:33:23Z) - Online Body Schema Adaptation through Cost-Sensitive Active Learning [63.84207660737483]
この作業は、icubロボットシミュレータの7dofアームを使用して、シミュレーション環境で実行された。
コストに敏感な能動学習手法は最適な関節構成を選択するために用いられる。
その結果,コスト依存型能動学習は標準的な能動学習手法と同等の精度を示し,実行運動の約半分を減らした。
論文 参考訳(メタデータ) (2021-01-26T16:01:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。