論文の概要: Zero-Shot Sim-to-Real Robot Learning: A Dexterous Manipulation Study on Reactive Catching
- arxiv url: http://arxiv.org/abs/2605.09789v1
- Date: Sun, 10 May 2026 22:20:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.419835
- Title: Zero-Shot Sim-to-Real Robot Learning: A Dexterous Manipulation Study on Reactive Catching
- Title(参考訳): Zero-Shot Sim-to-Real Robot Learning:リアクティブキャッチの詳細な操作に関する研究
- Authors: Kejia Ren, Gaotian Wang, Andrew S. Morgan, Kaiyu Hang,
- Abstract要約: ドメインランダム化インスタンスセット(Domain-Randomized Instance Set, DRIS)は、ランダム化されたインスタンスのセットを同時に表現し、伝播する。
DRISによりより堅牢なポリシーが得られ、現実世界の微調整の必要性が軽減されることを示す。
私たちはこれを、困難なリアクティブなキャッチタスクで実証しています。
- 参考スコア(独自算出の注目度): 5.503129542452224
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dexterous manipulation is physics-intensive and highly sensitive to modeling errors and perception noise, making sim-to-real transfer prohibitively challenging. Domain randomization (DR) is commonly used to improve the robustness of learned policies for such tasks, but conventional DR randomizes one instance per episode, offering very limited exposure to the variability of real-world dynamics. To this end, we propose Domain-Randomized Instance Set (DRIS), which represents and propagates a set of randomized instances simultaneously, providing richer approximation of uncertain dynamics and enabling policies to learn actions that account for multiple possible outcomes. Supported by theoretical analysis, we show that DRIS yields more robust policies and alleviates the need for real-world fine-tuning, even with a modest number of instances (e.g., 10). We demonstrate this on a challenging reactive catching task. Unlike traditional catching setups that use end-effectors designed to mechanically stabilize the object (e.g., curved or enclosing surfaces), our system uses a flat plate that offers no passive stabilization, making the task highly sensitive to noise and requiring rapid reactive motions. The learned policies exhibit strong robustness to uncertainties and achieve reliable zero-shot sim-to-real transfer.
- Abstract(参考訳): 有害な操作は物理集約的で、モデリングエラーや知覚ノイズに非常に敏感であり、sim-to-real転送を違法に困難にしている。
ドメインランダム化(DR)は、そのようなタスクに対する学習されたポリシーの堅牢性を改善するために一般的に使用されるが、従来のDRはエピソード毎に1つのインスタンスをランダム化し、現実世界のダイナミクスの多様性に非常に限定的な露出を提供する。
この目的のために、ドメインランダム化インスタンスセット(DRIS)を提案する。これは、ランダム化されたインスタンスの集合を同時に表現し、伝播し、不確実なダイナミクスのよりリッチな近似を提供し、複数の可能な結果を説明するアクションを学習するポリシーを可能にする。
理論解析により、DRISはより堅牢なポリシーを導き、より穏やかなインスタンス数(例:10)であっても、現実世界の微調整の必要性を緩和することを示した。
私たちはこれを、困難なリアクティブなキャッチタスクで実証しています。
物体を機械的に安定させるために設計されたエンドエフェクター(例えば、曲面や囲む表面)を使用する従来の捕獲装置とは異なり、我々のシステムは受動的安定化のない平板を用いて、ノイズに非常に敏感で、反応の速い動きを必要とする。
学習されたポリシーは不確実性に対して強い堅牢性を示し、信頼性の高いゼロショット・シム・トゥ・リアル・トランスファーを実現する。
関連論文リスト
- Provably Safe Trajectory Generation for Manipulators Under Motion and Environmental Uncertainties [26.41382315967256]
本稿では,安全な最適動作計画の必要性に対処する,リスクバウンドな新しい動き計画フレームワークを提案する。
動作不確実性下でのロボットの状態分布を予測するために,剛性マニピュレータ深部クープマン演算子 (RM-DeKO) モデルを統合する。
次に,並列物理シミュレーションとSOS(Sum-of-squares)プログラミングを併用して,衝突リスクのきめ細かい形式的証明を行う,効率的な階層的検証手法を提案する。
論文 参考訳(メタデータ) (2026-03-10T01:48:48Z) - Drift No More? Context Equilibria in Multi-Turn LLM Interactions [58.69551510148673]
コンテキストドリフト(Contexts drift)とは、ターン間のゴール一貫性のある振る舞いからモデルが出力する出力の段階的なばらつきである。
シングルターンエラーとは異なり、ドリフトは時間的に展開し、静的な評価指標では捉えにくい。
マルチターンドリフトは、避けられない崩壊というよりも、制御可能な平衡現象として理解できることを示す。
論文 参考訳(メタデータ) (2025-10-09T04:48:49Z) - Failure Forecasting Boosts Robustness of Sim2Real Rhythmic Insertion Policies [32.99644520625179]
本稿では,ロボットが繰り返し高精度挿入を行うRIT(Rhythmic Insertion Tasks)の課題に対処する。
本稿では,強化学習に基づく挿入ポリシーと障害予測モジュールを統合したフレームワークを提案する。
提案手法は1回の成功率が高く, 長時間繰り返しタスクの性能を安定的に維持する。
論文 参考訳(メタデータ) (2025-07-09T03:38:44Z) - Dynamic Manipulation of Deformable Objects in 3D: Simulation, Benchmark and Learning Strategy [88.8665000676562]
従来の手法は、しばしば問題を低速または2D設定に単純化し、現実の3Dタスクに適用性を制限する。
データ不足を軽減するため、新しいシミュレーションフレームワークと、低次ダイナミクスに基づくベンチマークを導入する。
本研究では,シミュレーション前トレーニングと物理インフォームドテスト時間適応を統合するフレームワークであるDynamics Informed Diffusion Policy (DIDP)を提案する。
論文 参考訳(メタデータ) (2025-05-23T03:28:25Z) - Neural Fidelity Calibration for Informative Sim-to-Real Adaptation [10.117298045153564]
深い強化学習は、アジャイルの移動とナビゲーションのスキルをシミュレータから現実世界にシームレスに移行することができる。
しかし、ドメインのランダム化や敵対的手法とシム・トゥ・リアルのギャップを埋めることは、しばしば政策の堅牢性を保証するために専門家の物理学知識を必要とする。
本研究では, 条件付きスコアベース拡散モデルを用いて, ロボットの動作中における物理係数と残留忠実度領域のキャリブレーションを行う新しいフレームワークであるNeural Fidelity(NFC)を提案する。
論文 参考訳(メタデータ) (2025-04-11T15:12:12Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Domain Randomization via Entropy Maximization [32.76511125425768]
そこで本研究では,実世界のデータを必要としないシミュレーションにおいて,シミュレーション中の動的分布を自動的に生成する,sim-to-realトランスファーに対処する新しい手法を提案する。
トレーニング分布のエントロピーを直接最大化する制約付き最適化問題であるEntropy Maximization (DORAEMON) によるDOmain RAndomizationを導入する。
我々は、高度に適応的で一般化可能な政策を得る上で、DORAEMONの一貫性のある利点を実証的に検証する。
論文 参考訳(メタデータ) (2023-11-03T12:54:05Z) - Robust Visual Sim-to-Real Transfer for Robotic Manipulation [79.66851068682779]
シミュレーションにおけるビジュモータポリシーの学習は、現実世界よりも安全で安価である。
しかし、シミュレーションデータと実データとの相違により、シミュレータ訓練されたポリシーは実際のロボットに転送されると失敗することが多い。
視覚的なsim-to-real領域ギャップを埋める一般的なアプローチは、ドメインランダム化(DR)である。
論文 参考訳(メタデータ) (2023-07-28T05:47:24Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。