Fugu-MT 論文翻訳(概要): Tendon Force Modeling for Sim2Real Transfer of Reinforcement Learning Policies for Tendon-Driven Robots

論文の概要: Tendon Force Modeling for Sim2Real Transfer of Reinforcement Learning Policies for Tendon-Driven Robots

arxiv url: http://arxiv.org/abs/2603.04351v1
Date: Wed, 04 Mar 2026 18:16:58 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-23 08:17:41.90329
Title: Tendon Force Modeling for Sim2Real Transfer of Reinforcement Learning Policies for Tendon-Driven Robots
Title（参考訳）: 腱駆動ロボットのための強化学習法のシム2リアルトランスファーのための腱力モデリング
Authors: Valentin Yuryev, Josie Hughes,
Abstract要約: 本稿では,典型的なサーボモータの腱力をモデル化する手法を提案する。次に,GPUによる力駆動型剛体シミュレーションにおいて,我々の力推定モデルを用いてRL制御系を訓練する。我々のモデルは最大運動力の3%以内の腱力を予測でき、ロボットに依存しない。
参考スコア（独自算出の注目度）: 4.374417345150659
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Robots which make use of soft or compliant inter- actions often leverage tendon-driven actuation which enables actuators to be placed more flexibly, and compliance to be maintained. However, controlling complex tendon systems is challenging. Simulation paired with reinforcement learning (RL) could be enable more complex behaviors to be generated. Such methods rely on torque and force-based simulation roll- outs which are limited by the sim-to-real gap, stemming from the actuator and system dynamics, resulting in poor transfer of RL policies onto real robots. To address this, we propose a method to model the tendon forces produced by typical servo motors, focusing specifically on the transfer of RL policies for a tendon driven finger. Our approach extends existing data- driven techniques by leveraging contextual history and a novel data collection test-bench. This test-bench allows us to capture tendon forces undergo contact-rich interactions typical of real- world manipulation. We then utilize our force estimation model in a GPU-accelerated tendon force-driven rigid body simulation to train RL-based controllers. Our transformer-based model is capable of predicting tendon forces within 3% of the maximum motor force and is robot-agnostic. By integrating our learned model into simulation, we reduce the sim-to-real gap for test trajectories by 41%. RL-based controller trained with our model achieves a 50% improvement in fingertip pose tracking tasks on real tendon-driven robotic fingers. This approach is generalizable to different actuators and robot systems, and can enable RL policies to be used widely across tendon systems, advancing capabilities of dexterous manipulators and soft robots.
Abstract（参考訳）: ソフトまたはコンプライアンス・インターアクションを利用するロボットは、しばしば腱駆動のアクチュエータを利用し、アクチュエータをより柔軟に配置し、コンプライアンスを維持できる。しかし、複雑な腱系の制御は困難である。強化学習(RL)と組み合わせたシミュレーションにより、より複雑な振る舞いが生成される。このような手法はトルクと力に基づくロールアウトに依存しており、アクチュエータとシステムダイナミクスから生じるシム・トゥ・リアルギャップによって制限されるため、実際のロボットへのRLポリシーの伝達は不十分である。そこで本研究では,典型的なサーボモータが生み出す腱力をモデル化する手法を提案する。我々のアプローチは、コンテキスト履歴と新しいデータ収集テストベンチを活用することによって、既存のデータ駆動技術を拡張します。このテストベンチにより、現実世界の操作に典型的な接触に富んだ相互作用を行う腱の力を捉えることができる。次に,GPUによる力駆動型剛体シミュレーションにおいて,我々の力推定モデルを用いてRL制御系を訓練する。我々のトランスモデルでは、最大運動力の3%以内の腱力を予測でき、ロボットに依存しない。学習したモデルをシミュレーションに統合することにより、テスト軌道のsim-to-realギャップを41%削減する。我々のモデルで訓練されたRLベースのコントローラーは、実際の腱駆動型ロボット指における指先ポーズトラッキングタスクを50%改善する。このアプローチは、さまざまなアクチュエータやロボットシステムに一般化可能であり、腱システムにまたがってRLポリシーを広く使用することが可能であり、デキスタスマニピュレータやソフトロボットの能力が向上する。

関連論文リスト

Closing the Reality Gap: Zero-Shot Sim-to-Real Deployment for Dexterous Force-Based Grasping and Manipulation [12.509181374985936]
複数の指を持つ人間のような器用な手は、人間レベルの操作機能を提供する。しかし、実際のハードウェアに直接デプロイ可能なトレーニングコントロールポリシは、コンタクトリッチな物理のため、依然として難しいままです。本稿では,高密度触覚フィードバックと関節トルクセンシングを併用して身体的相互作用を調節する実践的枠組みを提案する。
論文参考訳（メタデータ） (2026-01-06T07:26:39Z)
Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文参考訳（メタデータ） (2024-01-30T10:48:43Z)
Towards Transferring Tactile-based Continuous Force Control Policies from Simulation to Robot [19.789369416528604]
グリップフォースコントロールは、物体に作用する力の量を制限することによって、物体を安全に操作することを目的としている。以前の作品では、手動制御器、モデルベースのアプローチ、あるいはsim-to-realトランスファーを示さなかった。シミュレーションで訓練されたモデルなしの深層強化学習手法を提案し,さらに微調整を行わずにロボットに移行した。
論文参考訳（メタデータ） (2023-11-13T11:29:06Z)
Waymax: An Accelerated, Data-Driven Simulator for Large-Scale Autonomous Driving Research [76.93956925360638]
Waymaxは、マルチエージェントシーンにおける自動運転のための新しいデータ駆動シミュレータである。 TPU/GPUなどのハードウェアアクセラレータで完全に動作し、トレーニング用のグラフ内シミュレーションをサポートする。我々は、一般的な模倣と強化学習アルゴリズムのスイートをベンチマークし、異なる設計決定に関するアブレーション研究を行った。
論文参考訳（メタデータ） (2023-10-12T20:49:15Z)
Learning Bipedal Walking for Humanoids with Current Feedback [5.429166905724048]
アクチュエータレベルでの不正確なトルクトラッキングから生じるヒューマノイドロボットのシム2リアルギャップ問題を克服するためのアプローチを提案する。提案手法は、実際のHRP-5Pヒューマノイドロボットに展開して二足歩行を実現するシミュレーションにおいて、一貫したエンドツーエンドのポリシーをトレーニングする。
論文参考訳（メタデータ） (2023-03-07T08:16:46Z)
DeXtreme: Transfer of Agile In-hand Manipulation from Simulation to Reality [64.51295032956118]
我々は人型ロボットの手で頑健な操作を行える政策を訓練する。本研究は,各種ハードウェアおよびシミュレータのデクスタラス操作におけるsim-to-real転送の可能性を再確認する。
論文参考訳（メタデータ） (2022-10-25T01:51:36Z)
Zero-Shot Uncertainty-Aware Deployment of Simulation Trained Policies on Real-World Robots [17.710172337571617]
深層強化学習(RL)エージェントは、トレーニング環境と実行環境のミスマッチにより、現実世界にデプロイされた時にエラーを起こす傾向がある。本稿では,RLポリシーと従来型の手作りコントローラの強みを組み合わせた,新しい不確実性対応デプロイメント戦略を提案する。実世界の2つの連続制御タスクにおいて、BCFはスタンドアロンのポリシーとコントローラの両方に優れる有望な結果を示す。
論文参考訳（メタデータ） (2021-12-10T02:13:01Z)
Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文参考訳（メタデータ） (2021-11-15T18:50:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。