論文の概要: Closed-Loop Sim-to-Real Reinforcement Learning for Deformable Microfiber Shape Control
- arxiv url: http://arxiv.org/abs/2605.21688v1
- Date: Wed, 20 May 2026 19:45:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:41.977646
- Title: Closed-Loop Sim-to-Real Reinforcement Learning for Deformable Microfiber Shape Control
- Title(参考訳): 変形可能なマイクロファイバー形状制御のための閉ループ型Sim-to-Real強化学習
- Authors: Alessandro Amici, Houari Bettahar, Veeti Jaakkola, Quan Zhou,
- Abstract要約: 表面のマイクロファイバー形状制御のためのクローズドループ・シム・トゥ・リアル強化学習手法を提案する。
簡単なシミュレータで学習したポリシーは,表面接触下での繰り返し可能なマイクロファイバー形状制御を実現することができることを示す。
- 参考スコア(独自算出の注目度): 41.91836259982757
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous contact-based micromanipulation is challenging because surface and interfacial interactions at the microscale are difficult to model accurately, limiting the use of conventional model-based control and sim-to-real learning. We present a closed-loop sim-to-real reinforcement learning (RL) approach for microfiber shape control on a surface. The central idea is to train geometric shape regulation in a simplified frictionless simulator and rely on real-time visual feedback during deployment to iteratively correct the observed effects of unmodeled surface interactions. An RL policy trained entirely in simulation is transferred directly to a physical dual-gripper micromanipulation system operating at 40 Hz, without retraining or domain adaptation. Using silk microfibers as a testbed, the policy achieves a mean point-wise shape error of 270 $\pm$ 80 $μ$m across twenty-four diverse initial configurations. Across nine specimens covering all combinations of three fiber diameters (50, 80, and 120 $μ$m) and three manipulated lengths (10 mm, 15mm, and 20 mm), the same policy achieves sub-millimeter final shape error without any retraining or retuning. These results show that a policy learned in a simplified simulator can achieve repeatable real-world microfiber shape regulation under surface contact, provided that the task-relevant effects of the sim-to-real mismatch remain observable and correctable within the closed feedback loop.
- Abstract(参考訳): マイクロスケールの表面と界面の相互作用を正確にモデル化することは困難であり、従来のモデルベース制御とsim-to-real学習の使用を制限するため、自律的なコンタクトベースのマイクロマニピュレーションは困難である。
表面のマイクロファイバー形状制御のための閉ループ・シム・トゥ・リアル強化学習(RL)手法を提案する。
中心となる考え方は、単純化された摩擦のないシミュレーターで幾何学的な形状制御を訓練し、展開中にリアルタイムな視覚フィードバックを頼りにして、非モデル化表面相互作用の観察された影響を反復的に補正することである。
完全にシミュレーションで訓練されたRLポリシーは、再トレーニングやドメイン適応なしに40Hzで動作する物理二重グリップマイクロマニピュレーションシステムに直接転送される。
絹のマイクロファイバーをテストベッドとして使用することにより、24種類の異なる初期構成に対して平均270$\pm$80$μ$mのポイントワイド形状誤差を達成できる。
3つの繊維径 (50, 80, 120$μ$m) と3つの操作された長さ (10 mm, 15 mm, 20 mm) の組合せを網羅する9つの標本は、同じ方針で、調整や調整をすることなく、サブミリ以下の最終的な形状誤差を達成している。
これらの結果から, 簡単なシミュレータで学習したポリシは, 表面接触下での繰り返し可能なマイクロファイバー形状制御を実現することが可能であり, sim-to-realミスマッチのタスク関連効果は, クローズドフィードバックループ内で観測可能であり, 修正可能であることが示唆された。
関連論文リスト
- SIM1: Physics-Aligned Simulator as Zero-Shot Data Scaler in Deformable Worlds [36.87909899472009]
本稿では,物理世界におけるシミュレーションを基盤とした物理対応の実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-
このシステムは、シーンをメートル法に一貫性のある双子にデジタル化し、弾性モデリングによって変形可能なダイナミクスをキャラブレートし、拡散に基づく軌道生成によって振る舞いを拡大する。
実験により、純粋に合成データに基づいてトレーニングされたポリシーは、実データベースラインと1:15の等価比で同等であり、実世界の展開において90%のゼロショット成功と50%の一般化をもたらすことが示された。
論文 参考訳(メタデータ) (2026-04-09T17:59:52Z) - SOFTMAP: Sim2Real Soft Robot Forward Modeling via Topological Mesh Alignment and Physics Prior [21.30232105970865]
SOFTMAPは、腱作動型ソフトフィンガーマニピュレータのリアルタイム3次元フォワードモデリングのためのsim-real learning frameworkである。
我々は、シミュレーションにおいて、シミュレーションと物理ハードウェアの両方でSOFTMAPを評価し、チャンファー距離0.389mmの形状予測精度を達成した。
この結果から,SOFTMAPはソフトマニピュレータの3次元フォワードモデリングと制御にデータ効率のよいアプローチを提供することがわかった。
論文 参考訳(メタデータ) (2026-03-19T18:21:44Z) - CLASH: Collision Learning via Augmented Sim-to-real Hybridization to Bridge the Reality Gap [9.148510140521706]
本稿では,パラメータ条件付インパルス衝突サロゲートモデルを学習するデータ効率フレームワークであるAugmented Sim-to-real Hybridization (CLASH)による衝突学習を紹介する。
我々は,ハイブリッドシミュレータを用いて得られたポリシーが実世界へより堅牢に伝達できることを実証した。
論文 参考訳(メタデータ) (2026-02-21T03:39:33Z) - Simulating Environments with Reasoning Models for Agent Training [55.98861707136674]
トレーニング用の起動環境の構築は重く、脆く、進捗を制限します。
我々はSimia-SFTとSimia-RLの2つのフレームワークを提案する。
Simia-SFTとSimia-RLは、環境工学を使わずにスケーラブルなエージェントトレーニングを可能にする。
論文 参考訳(メタデータ) (2025-11-03T18:29:57Z) - World Model-Based Learning for Long-Term Age of Information Minimization in Vehicular Networks [53.98633183204453]
本稿では,車載ネットワークにおけるパケット完全性認識情報(CAoI)の年齢を最小化するために,新しい世界モデルに基づく学習フレームワークを提案する。
mmWave V2X環境の動的モデルを共同で学習し、リンクスケジューリングの方法を学ぶための軌跡を想像するために使用する世界モデルフレームワークを提案する。
特に、長期的な政策は環境相互作用の代わりに、異なる想像軌道で学習される。
論文 参考訳(メタデータ) (2025-05-03T06:23:18Z) - PolyFit: A Peg-in-hole Assembly Framework for Unseen Polygon Shapes via
Sim-to-real Adaptation [4.875369637162596]
PolyFitは5-DoFペグインホールアセンブリ用に設計された教師あり学習フレームワークである。
F/Tデータを正確な外因性ポーズ推定に利用し、ペグのポーズを調整して不一致を是正する。
穴内成功率は97.3%と96.3%で、シミュレーションでは目に見えない形状である。
論文 参考訳(メタデータ) (2023-12-05T06:28:33Z) - Learning Variable Impedance Control for Aerial Sliding on Uneven
Heterogeneous Surfaces by Proprioceptive and Tactile Sensing [42.27572349747162]
本研究では,空中すべり作業に対する学習に基づく適応制御手法を提案する。
提案するコントローラ構造は,データ駆動制御とモデルベース制御を組み合わせたものである。
美術品間相互作用制御手法の微調整状態と比較して,追従誤差の低減と外乱拒否の改善を実現した。
論文 参考訳(メタデータ) (2022-06-28T16:28:59Z) - Reinforcement Learning for Adaptive Mesh Refinement [63.7867809197671]
マルコフ決定過程としてのAMRの新規な定式化を提案し,シミュレーションから直接改良政策を訓練するために深部強化学習を適用した。
これらのポリシーアーキテクチャのモデルサイズはメッシュサイズに依存しないため、任意に大きく複雑なシミュレーションにスケールします。
論文 参考訳(メタデータ) (2021-03-01T22:55:48Z) - Learning from Simulation, Racing in Reality [126.56346065780895]
ミニチュアレースカープラットフォーム上で自律的なレースを行うための強化学習ベースのソリューションを提案する。
シミュレーションで純粋に訓練されたポリシーは、実際のロボットのセットアップにうまく移行できることを示す。
論文 参考訳(メタデータ) (2020-11-26T14:58:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。