論文の概要: TAM: Torque Adaptation Module for Robust Motion Transfer in Manipulation
- arxiv url: http://arxiv.org/abs/2606.06218v1
- Date: Thu, 04 Jun 2026 14:31:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 22:39:44.854399
- Title: TAM: Torque Adaptation Module for Robust Motion Transfer in Manipulation
- Title(参考訳): TAM:操作時のロバスト運動伝達のためのトルク適応モジュール
- Authors: Dongwon Son, Florian Shkurti, Jason Lee, Naman Shah, Beomjoon Kim, Dieter Fox,
- Abstract要約: 接触に富んだダイナミックな操作では、小さな動きのずれでさえ参照動作の追跡に失敗することがある。
本稿では,学習モジュールであるTorque Adaptation Module (TAM)を紹介した。
- 参考スコア(独自算出の注目度): 32.68351241308298
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A policy tuned for one robot often behaves differently on another, whether due to the sim-to-real gap, unknown payloads, or the differing dynamics of two instances of the same robot. In contact-rich, dynamic manipulation, even small motion discrepancies can result in failure to track reference motion, since they disrupt the timing and modes of contact. Common remedies, such as domain randomization or system identification, either produce overly conservative task policies or require data that must be recollected for each robot or payload. We introduce the Torque Adaptation Module (TAM), a learned module that adapts the torque commands sent to the robot to match the behavior of an ideal robot. TAM operates between the low-level controller that tracks the policy's actions and the robot's torque interface. It includes a history encoder that embeds proprioceptive history into a latent state and a torque adaptor that computes residual torque corrections. Because TAM depends only on proprioceptive history and not on policy observations, or the action space, the same TAM weights can be reused to adapt policies with different action spaces (joint targets, end-effector targets, or direct torques). The policies themselves do not need to be trained with domain randomization of robot parameters. Instead, we offload the need for domain randomization to TAM by training it entirely in randomized simulation, using multi-robot pretraining followed by a robot-specific fine-tuning step that still requires no real-robot data. We evaluate TAM zero-shot on a real Franka Panda robot across dynamic manipulation tasks that include a vision-based box pushing policy (from RL), a flip policy (from BC), and an MPC ball-on-plate balancing. Our experiments show that TAM improves zero-shot real-robot execution compared to online system identification and RMA baselines and enables robust dynamic manipulation performance.
- Abstract(参考訳): あるロボットに対して調整されたポリシーは、シミュレーションから実際のギャップ、未知のペイロード、あるいは同じロボットの2つのインスタンスの異なるダイナミクスなど、他のロボットに対して異なる振る舞いをすることが多い。
接触に富んだダイナミックな操作では、小さな動きのずれでさえ、接触のタイミングとモードを乱すため、参照運動を追跡することができない。
ドメインのランダム化やシステム識別のような一般的な治療法は、過度に保守的なタスクポリシーを生成するか、ロボットやペイロードごとに再コンパイルされる必要があるデータを必要とする。
本稿では,学習モジュールであるTorque Adaptation Module (TAM)を紹介した。
TAMはポリシーの動作を追跡する低レベルコントローラとロボットのトルクインターフェースの間で動作する。
これには、受容履歴を潜伏状態に埋め込むヒストリエンコーダと、残留トルク補正を計算するトルクアダプタが含まれる。
TAMは、政策観測や行動空間に依存せず、受容史にのみ依存するため、異なるアクション空間(結合ターゲット、エンドエフェクターターゲット、直接トルク)でポリシーを適用するために、同じTAM重みを再利用することができる。
ポリシー自体は、ロボットパラメータのドメインランダム化を訓練する必要はない。
その代わりに、マルチロボットプレトレーニングに続いて、実際のロボットデータを必要としないロボット固有の微調整ステップを使用して、完全にランダム化シミュレーションでトレーニングすることで、ドメインのランダム化の必要性をTAMにオフロードします。
実際のフランカ・パンダロボット上でのTAMゼロショットを、視覚ベースのボックスプッシュポリシー(RL)、フリップポリシー(BC)、MPCボールオンプレートバランスを含む動的操作タスクで評価する。
実験の結果,TAMはオンラインシステム識別やRMAベースラインと比較してゼロショットのリアルタイム実行を改善し,ロバストな動的操作性能を実現することがわかった。
関連論文リスト
- FAST: Efficient Action Tokenization for Vision-Language-Action Models [98.15494168962563]
離散コサイン変換に基づくロボット動作のための圧縮に基づく新しいトークン化手法を提案する。
FASTをベースとしたFAST+は,100万個のリアルロボットアクショントラジェクトリに基づいて訓練されたユニバーサルロボットアクショントークンである。
論文 参考訳(メタデータ) (2025-01-16T18:57:04Z) - Cross-Embodiment Robot Manipulation Skill Transfer using Latent Space Alignment [24.93621734941354]
本稿では,形態の異なるロボットマニピュレータ間の制御ポリシの伝達に着目した。
主要な洞察は、ソースとターゲットロボットの状態と行動空間を共通の潜在空間表現に投影することである。
我々は、異なる状態、行動、実施形態のソースとターゲットロボットによるシム・トゥ・シム・トゥ・シム・トゥ・シム・トゥ・リアルな操作ポリシーの伝達を実証する。
論文 参考訳(メタデータ) (2024-06-04T05:00:24Z) - Nonprehensile Planar Manipulation through Reinforcement Learning with
Multimodal Categorical Exploration [8.343657309038285]
強化学習はそのようなロボットコントローラを開発するための強力なフレームワークである。
分類分布を用いたマルチモーダル探索手法を提案する。
学習したポリシは外部の障害や観測ノイズに対して堅牢であり、複数のプッシュ器でタスクにスケールできることが示される。
論文 参考訳(メタデータ) (2023-08-04T16:55:00Z) - Robust Visual Sim-to-Real Transfer for Robotic Manipulation [79.66851068682779]
シミュレーションにおけるビジュモータポリシーの学習は、現実世界よりも安全で安価である。
しかし、シミュレーションデータと実データとの相違により、シミュレータ訓練されたポリシーは実際のロボットに転送されると失敗することが多い。
視覚的なsim-to-real領域ギャップを埋める一般的なアプローチは、ドメインランダム化(DR)である。
論文 参考訳(メタデータ) (2023-07-28T05:47:24Z) - Polybot: Training One Policy Across Robots While Embracing Variability [70.74462430582163]
複数のロボットプラットフォームにデプロイするための単一のポリシーをトレーニングするための重要な設計決定セットを提案する。
われわれのフレームワークは、まず、手首カメラを利用して、我々のポリシーの観察空間と行動空間を具体化して調整する。
6つのタスクと3つのロボットにまたがる60時間以上のデータセットを用いて,関節の形状や大きさの異なるデータセットの評価を行った。
論文 参考訳(メタデータ) (2023-07-07T17:21:16Z) - Learning Bipedal Walking for Humanoids with Current Feedback [5.429166905724048]
アクチュエータレベルでの不正確なトルクトラッキングから生じるヒューマノイドロボットのシム2リアルギャップ問題を克服するためのアプローチを提案する。
提案手法は、実際のHRP-5Pヒューマノイドロボットに展開して二足歩行を実現するシミュレーションにおいて、一貫したエンドツーエンドのポリシーをトレーニングする。
論文 参考訳(メタデータ) (2023-03-07T08:16:46Z) - REvolveR: Continuous Evolutionary Models for Robot-to-robot Policy
Transfer [57.045140028275036]
本研究では,運動学や形態学など,異なるパラメータを持つ2つの異なるロボット間でポリシーを伝達する問題を考察する。
模倣学習手法を含む動作や状態遷移の分布を一致させることで、新しいポリシーを訓練する既存のアプローチは、最適な動作や/または状態分布が異なるロボットでミスマッチしているために失敗する。
本稿では,物理シミュレータに実装されたロボット政策伝達に連続的進化モデルを用いることで,$RevolveR$という新しい手法を提案する。
論文 参考訳(メタデータ) (2022-02-10T18:50:25Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z) - OSCAR: Data-Driven Operational Space Control for Adaptive and Robust
Robot Manipulation [50.59541802645156]
オペレーショナル・スペース・コントロール(OSC)は、操作のための効果的なタスクスペース・コントローラとして使われてきた。
本稿では,データ駆動型OSCのモデル誤差を補償するOSC for Adaptation and Robustness (OSCAR)を提案する。
本手法は,様々なシミュレーション操作問題に対して評価し,制御器のベースラインの配列よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2021-10-02T01:21:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。