論文の概要: KITE: Decoupling Kinematics and Interaction for Zero-Shot Cross-Embodiment Manipulation
- arxiv url: http://arxiv.org/abs/2606.22113v1
- Date: Sat, 20 Jun 2026 15:51:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 22:46:40.470134
- Title: KITE: Decoupling Kinematics and Interaction for Zero-Shot Cross-Embodiment Manipulation
- Title(参考訳): KITE:ゼロショット・クロス・エボディメント・マニピュレーションのためのキネマティクスとインタラクションの分離
- Authors: Qianxu Wang, Kuan Fang,
- Abstract要約: ロボットの運動制御に係わるタスク推論を,ロボットの運動制御と連動させることにより,ロボットの動作制御を一般化することは依然として困難である。
本研究は,体操を具体化非依存的タスク推論と体外化特異的運動制御に分解する,体外的相互作用伝達(KITE)について紹介する。
KITEは、構造的に異なる目的のエボディメントへのゼロショット転送を一貫して達成し、転送成功とタスク・エボディメントのスコープにおける最先端のベースラインよりも優れています。
- 参考スコア(独自算出の注目度): 2.532260218883922
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generalizing manipulation policies across robot embodiments remains difficult because standard policies entangle task reasoning with embodiment-specific motor control. We study zero-shot cross-embodiment manipulation, where a policy trained on source embodiments must be deployed on a structurally different target embodiment without additional task demonstrations. We introduce Kinematic Interaction Transfer across Embodiments (KITE), which decouples manipulation into embodiment-agnostic task reasoning and embodiment-specific motor control, connected through a learned latent representation of interaction intent based on contact patterns. Task reasoning is performed by a shared policy that predicts latent intents from source demonstrations, while motor control is performed by an intent-conditioned action decoder learned from each embodiment's kinematic model. With KITE, adaptation to a new embodiment requires only training a new action decoder using its kinematic model, without recollecting demonstration data. We evaluate KITE on three manipulation tasks spanning transfer between parallel grippers, dexterous hands, and composite embodiments. KITE consistently achieves zero-shot transfer to structurally different target embodiments, outperforming state-of-the-art baselines in transfer success and task-embodiment scope.
- Abstract(参考訳): ロボットの運動制御に係わるタスク推論を,ロボットの運動制御と連動させることにより,ロボットの動作制御を一般化することは依然として困難である。
我々はゼロショット・クロス・エボディメントの操作について検討し、そこでは、ソース・エボディメントで訓練されたポリシーを、追加のタスク・デモなしで、構造的に異なるターゲット・エボディメントに展開しなければならない。
本研究では, 身体的相互作用伝達 (KITE) を導入し, 接触パターンに基づく相互作用意図の潜在的表現を通して, 操作を身体非依存のタスク推論と身体特異的運動制御に分解する。
タスク推論は、ソースデモから潜伏意図を予測する共有ポリシによって行われ、モータ制御は各実施形態の運動モデルから学習されたインテント条件のアクションデコーダによって実行される。
KITEでは、新しいエボディメントへの適応は、デモデータを再コンパイルすることなく、キネマティックモデルを使用して新しいアクションデコーダをトレーニングすることのみを必要とする。
そこで, KITEは, パラレルグリップパ, 器用手, 複合具間の移動にまたがる3つの操作課題について, KITEの評価を行った。
KITEは、構造的に異なる目的のエボディメントへのゼロショット転送を一貫して達成し、転送成功とタスク・エボディメントのスコープにおける最先端のベースラインよりも優れています。
関連論文リスト
- iMaC: Translating Actions into Motion and Contact Images for Embodied World Models [77.395425755122]
身体的世界モデルは、視覚ロボットによる意思決定と対話型環境シミュレーションのための重要なパラダイムとして登場した。
本稿では,実画像を実世界モデルのためのネイティブアクション表現として扱う,新しい統一制御パラダイムである「イメージ・アズ・アクション・コントロール」を提案する。
論文 参考訳(メタデータ) (2026-06-08T17:55:41Z) - SCAR: Self-Supervised Continuous Action Representation Learning [36.917304453471864]
視覚的遷移から具現化された動作表現を学習するための共同逆フォワード動的フレームワークであるSCARを提案する。
事前訓練された生成バックボーン上に構築されたSCARは、逆ダイナミクスモデル(IDM)を使用して、潜時観測ペアから潜時動作を推論し、フォワードダイナミクスモデル(FDM)を用いて、それらに条件付けられた将来のダイナミクスを予測する。
Procgen と Robotwin のデータセットの実験により、学習された統合潜在行動表現は、具体化固有の生の行動よりも、世界モデリングのためのより強い条件付けインターフェースとして機能することが示された。
論文 参考訳(メタデータ) (2026-05-13T16:23:11Z) - OmniHumanoid: Streaming Cross-Embodiment Video Generation with Paired-Free Adaptation [63.65885191759872]
クロス・エボディメント・ビデオ・ジェネレーションは、異なるヒューマノイド・エンボディメント間での動きを転送することを目的としている。
OmniHumanoidは、移動可能な運動学習とエンボディメント固有の適応を分解するフレームワークである。
論文 参考訳(メタデータ) (2026-05-12T12:21:11Z) - AdaTracker: Learning Adaptive In-Context Policy for Cross-Embodiment Active Visual Tracking [42.310377711916104]
既存のアプローチは通常、各実施形態の別々のモデルを訓練し、スケーラビリティの低下と限定的な一般化をもたらす。
AdaTrackerは、多様なロボット形態に基づいて、ターゲットをしっかりと追跡する適応型インコンテキストポリシー学習フレームワークである。
シミュレーションと実世界の双方の実験により、AdaTrackerはクロスボデーメントの一般化、サンプル効率、ゼロショット適応において最先端の手法を大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2026-04-22T08:06:32Z) - Embedding Morphology into Transformers for Cross-Robot Policy Learning [24.85486808758998]
ロボット間政策学習は、ロボット学習において依然として中心的な課題である。
形態素を3つのメカニズムで注入するエンボディメント対応トランスフォーマーポリシーを提案する。
様々な実施形態において、この構造化された統合はバニラ pi0.5 VLA ベースラインの性能を一貫して改善する。
論文 参考訳(メタデータ) (2026-02-26T21:42:34Z) - MOTIF: Learning Action Motifs for Few-shot Cross-Embodiment Transfer [55.982504915794514]
クロス・エボディメント・ポリシーは一般的に共有プライベート・アーキテクチャに依存している。
本報告では,MOTIFを効率よく数発のクロスボディーメントトランスファーに適用する。
我々はMOTIFが数発の転送シナリオにおいて強いベースラインを著しく上回ることを示す。
論文 参考訳(メタデータ) (2026-02-14T13:21:40Z) - UniMotion: A Unified Motion Framework for Simulation, Prediction and Planning [60.55873455475112]
動作タスク間の共有構造をキャプチャする統合モーションフレームワークUniMotionを提案する。
UniMotionは、これらの動作タスクを同時にサポートするために、専用のインタラクションモードと調整されたトレーニング戦略を採用している。
さらなる微調整により、UniMotionはさまざまな動作タスクにおける最先端のパフォーマンスを達成し、自動運転のための汎用的でスケーラブルなソリューションとして確立する。
論文 参考訳(メタデータ) (2026-01-31T07:12:26Z) - Meta-Controller: Few-Shot Imitation of Unseen Embodiments and Tasks in Continuous Control [19.259973997622346]
ロボットの具体化やタスクの一般化は、適応型ロボットシステムにとって不可欠である。
我々は、見えない実施物やタスクを同時に一般化する、数発の行動クローニングフレームワークを導入する。
マッチングベースのポリシネットワークは、いくつかのデモからアクションを予測し、過度に適合する堅牢なアダプティブポリシを生成する。
論文 参考訳(メタデータ) (2024-12-10T19:10:17Z) - Composite Motion Learning with Task Control [0.6882042556551609]
物理シミュレーション文字に対する合成およびタスク駆動動作制御のための深層学習法を提案する。
我々は,複数の識別器をGANライクな設定で使用することにより,複数の参照動作から,特定の身体部分に対する分離された動作を同時に,直接的に学習する。
本稿では,複合動作模倣と多目的制御の両方を含む多目的課題に対するアプローチの適用性を示す。
論文 参考訳(メタデータ) (2023-05-05T05:02:41Z) - Consolidating Kinematic Models to Promote Coordinated Mobile
Manipulations [96.03270112422514]
我々は,移動体ベース,アーム,移動体操作で操作する物体の運動学を統合する仮想キネマティックチェイン(VKC)を構築した。
移動操作タスクは、構築されたVKCの状態を変更して表現され、移動計画問題に変換することができる。
論文 参考訳(メタデータ) (2021-08-03T02:59:41Z) - Goal-Conditioned End-to-End Visuomotor Control for Versatile Skill
Primitives [89.34229413345541]
本稿では,制御器とその条件をエンドツーエンドに学習することで,落とし穴を回避する条件付け手法を提案する。
本モデルでは,ロボットの動きのダイナミックな画像表現に基づいて,複雑な動作シーケンスを予測する。
代表的MPCおよびILベースラインに対するタスク成功の大幅な改善を報告した。
論文 参考訳(メタデータ) (2020-03-19T15:04:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。