論文の概要: Rapidly Learning Soft Robot Control via Implicit Time-Stepping
- arxiv url: http://arxiv.org/abs/2511.06667v1
- Date: Mon, 10 Nov 2025 03:24:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 21:18:45.056136
- Title: Rapidly Learning Soft Robot Control via Implicit Time-Stepping
- Title(参考訳): 入出力タイムスタンピングによるソフトロボット制御の迅速学習
- Authors: Andrew Choi, Dezhong Tong,
- Abstract要約: DisMechは、ソフトダイナミクスと摩擦接触の両方を扱うことができる完全に暗黙のソフトボディシミュレータである。
剛性マニピュレータにおけるデルタ結合位置制御に類似したデルタ自然曲率制御を導入する。
暗黙のタイムステッピングにより、500環境の並列ステップは、非接触ケースでは最大6倍、コンタクトリッチシナリオでは最大40倍の速度を達成する。
- 参考スコア(独自算出の注目度): 2.3490649790592935
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the explosive growth of rigid-body simulators, policy learning in simulation has become the de facto standard for most rigid morphologies. In contrast, soft robotic simulation frameworks remain scarce and are seldom adopted by the soft robotics community. This gap stems partly from the lack of easy-to-use, general-purpose frameworks and partly from the high computational cost of accurately simulating continuum mechanics, which often renders policy learning infeasible. In this work, we demonstrate that rapid soft robot policy learning is indeed achievable via implicit time-stepping. Our simulator of choice, DisMech, is a general-purpose, fully implicit soft-body simulator capable of handling both soft dynamics and frictional contact. We further introduce delta natural curvature control, a method analogous to delta joint position control in rigid manipulators, providing an intuitive and effective means of enacting control for soft robot learning. To highlight the benefits of implicit time-stepping and delta curvature control, we conduct extensive comparisons across four diverse soft manipulator tasks against one of the most widely used soft-body frameworks, Elastica. With implicit time-stepping, parallel stepping of 500 environments achieves up to 6x faster speeds for non-contact cases and up to 40x faster for contact-rich scenarios. Finally, a comprehensive sim-to-sim gap evaluation--training policies in one simulator and evaluating them in another--demonstrates that implicit time-stepping provides a rare free lunch: dramatic speedups achieved without sacrificing accuracy.
- Abstract(参考訳): 剛体シミュレータの爆発的成長により、シミュレーションにおけるポリシー学習は、ほとんどの剛体形態のデファクトスタンダードとなっている。
対照的に、ソフトロボットシミュレーションフレームワークは依然としてほとんど存在せず、ソフトロボティクスコミュニティで採用されることはめったにない。
このギャップは、使い易く汎用的なフレームワークが欠如していることや、連続体力学を正確にシミュレートする高い計算コストに起因している。
本研究では,迅速なソフトロボットポリシー学習が暗黙のタイムステッピングによって実現可能であることを実証する。
我々の選択シミュレータであるDisMechは、ソフトダイナミクスと摩擦接触の両方を扱える汎用的で完全に暗黙的なソフトボディシミュレータである。
さらに,剛性マニピュレータにおけるデルタ関節位置制御に類似したデルタ自然曲率制御を導入し,ソフトロボット学習の制御を直感的で効果的に行う方法を提案する。
暗黙的なタイムステッピングとデルタ曲率制御の利点を強調するため、最も広く使われているソフトボディフレームワークであるElasticaと4つの多様なソフトマニピュレータタスクの広範な比較を行った。
暗黙のタイムステッピングにより、500環境の並列ステップは、非接触ケースでは最大6倍、コンタクトリッチシナリオでは最大40倍の速度を達成する。
最後に、あるシミュレータにおける総合的なsim-to-simギャップ評価(sim-to-sim gap evaluation--training policy)を行い、それを別のシミュレータで評価する。
関連論文リスト
- Real-to-Sim Robot Policy Evaluation with Gaussian Splatting Simulation of Soft-Body Interactions [27.247431258140463]
本稿では,現実の映像からソフトボディのディジタルツインを構築するための,リアル・トゥ・シミュレート・ポリシー評価フレームワークを提案する。
我々は,ぬいぐるみのパッキング,ロープルーティング,Tブロックプッシュなど,代表的な変形可能な操作タスクに対するアプローチを検証する。
論文 参考訳(メタデータ) (2025-11-06T18:52:08Z) - SoftMimic: Learning Compliant Whole-body Control from Examples [10.040505865690498]
我々は,人型ロボットの動作を例から学習するフレームワークであるSoftMimicを紹介した。
シミュレーションと実世界の実験により,環境との安全かつ効果的な相互作用を実証し,本手法の有効性を検証した。
論文 参考訳(メタデータ) (2025-10-20T17:49:27Z) - Hybrid Neural-MPM for Interactive Fluid Simulations in Real-Time [57.30651532625017]
本稿では,数値シミュレーション,神経物理,生成制御を統合した新しいハイブリッド手法を提案する。
本システムでは, 多様な2D/3Dシナリオ, 材料タイプ, 障害物相互作用における堅牢な性能を示す。
受け入れ次第、モデルとデータの両方をリリースすることを約束します。
論文 参考訳(メタデータ) (2025-05-25T01:27:18Z) - Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [57.278726604424556]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。
提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。
ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文 参考訳(メタデータ) (2024-09-12T11:50:06Z) - Residual Physics Learning and System Identification for Sim-to-real
Transfer of Policies on Buoyancy Assisted Legged Robots [14.760426243769308]
本研究では,BALLUロボットのシステム識別による制御ポリシのロバストなシミュレートを実演する。
標準的な教師あり学習の定式化に頼るのではなく、深層強化学習を利用して外部力政策を訓練する。
シミュレーショントラジェクトリと実世界のトラジェクトリを比較することで,改良されたシミュレーション忠実度を解析する。
論文 参考訳(メタデータ) (2023-03-16T18:49:05Z) - Safe Imitation Learning of Nonlinear Model Predictive Control for Flexible Robots [6.501150406218775]
模擬学習と予測安全フィルタを用いたモデル予測制御(NMPC)の安全な近似のためのフレームワークを提案する。
NMPCと比較して、シミュレーションにおいて3次元フレキシブルロボットアームを制御する場合、計算時間は8倍以上改善されている。
高速で安全な近似NMPCの開発は、産業における柔軟なロボットの採用を加速する可能性を秘めている。
論文 参考訳(メタデータ) (2022-12-06T12:54:08Z) - DeXtreme: Transfer of Agile In-hand Manipulation from Simulation to
Reality [64.51295032956118]
我々は人型ロボットの手で頑健な操作を行える政策を訓練する。
本研究は,各種ハードウェアおよびシミュレータのデクスタラス操作におけるsim-to-real転送の可能性を再確認する。
論文 参考訳(メタデータ) (2022-10-25T01:51:36Z) - DiSECt: A Differentiable Simulator for Parameter Inference and Control
in Robotic Cutting [71.50844437057555]
軟質材料を切断するための最初の微分可能シミュレータであるDiSECtについて述べる。
シミュレータは、符号付き距離場に基づく連続接触モデルにより有限要素法を増強する。
このシミュレータは, 最先端の商用解法を用いて, 結果の力やフィールドに適合するようにキャリブレーションできることを示す。
論文 参考訳(メタデータ) (2022-03-19T07:27:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。