論文の概要: How Should a Simulation-to-Reality Transfer Budget Be Spent?
- arxiv url: http://arxiv.org/abs/2606.22062v1
- Date: Sat, 20 Jun 2026 14:23:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 23:01:28.590767
- Title: How Should a Simulation-to-Reality Transfer Budget Be Spent?
- Title(参考訳): シュミレーション・トゥ・レアル・トランスファーの予算はどのように抑えられるべきか?
- Authors: Syed Hamzah Rizvi, Yash Vardhan Tomar,
- Abstract要約: 本稿では,システム識別と領域ランダム化の間の実ロボット計測時間を割当てることに焦点をあてる。
私たちがテストした現実のギャップとノイズレベル全体にわたって、測定予算は作業の大部分を完了しました。
全体として,sim-to-realパイプラインは,まずパラメータを計測し,残されている不確実性に対してランダム化を予備的に行うべきである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Simulation-to-reality transfer, often called sim-to-real transfer, is a central challenge in robot learning. Yet, the tradeoff between measuring a system more accurately and training over a broader range of simulated dynamics is still poorly understood. In this work, we focused on the allocation of real-robot measurement time between system identification and domain randomization. We studied this tradeoff in a controlled sim-to-sim pendulum setting, where a hidden-parameter model stands in for the physical robot, and the experiment sweeps identification rollouts against the width of the randomization distribution. Across the reality gaps and noise levels we tested, the measurement budget did most of the work. A small number of identification rollouts closed most of the transfer gap, and once any real data was available, policies performed best when trained at the estimated parameters rather than over a widened randomization band. Broad randomization that contained the true system still did not substitute for measurement. These results hold in a benign regime where the dynamics are identifiable and only two parameters are unknown, so structural model mismatch remains the setting where randomization breadth may become more valuable. Overall, our results suggest that sim-to-real pipelines should first measure the parameters they can and reserve randomization for the uncertainty that remains.
- Abstract(参考訳): シミュレーションから現実への移動(sim-to-real transfer)は、ロボット学習における中心的な課題である。
しかし、システムをより正確に測定し、より広い範囲のシミュレーション力学をトレーニングすることのトレードオフは、いまだに理解されていない。
本研究では,システム同定と領域ランダム化の間の実ロボット計測時間を割当てることに焦点をあてた。
このトレードオフを,物理ロボットに隠れパラメータモデルが組み込まれている制御型sim-to-sim振り子設定で検討し,ランダム化分布の幅に対する識別ロールアウトを網羅する実験を行った。
私たちがテストした現実のギャップとノイズレベル全体にわたって、測定予算は作業の大部分を完了しました。
少数の識別ロールアウトが転送ギャップの大部分を閉鎖し、実際のデータが利用可能になると、ポリシーは広帯域のランダム化バンドよりも、推定パラメータでトレーニングされた時に最もうまく実行された。
真のシステムを含む広帯域ランダム化は依然として測定に代わらなかった。
これらの結果は、力学が識別可能であり、パラメータが2つしか不明な良質な状態にあるため、構造的モデルのミスマッチは、乱数化の幅がより重要になるような設定のままである。
全体として,sim-to-realパイプラインは,まずパラメータを計測し,残されている不確実性に対してランダム化を予備的に行うべきである。
関連論文リスト
- Learning Shortest Paths When Data is Scarce [3.3012620893449465]
本研究では,プランナーが豊富な合成サンプルにアクセス可能な最短経路問題,限られた実世界の観測,およびリンク間の振る舞いの類似性を推定するエッジ類似性について検討する。
シミュレーションと現実の相違を、類似性グラフ上で滑らかに変化するエッジ固有のバイアスとしてモデル化し、ラプラシアン正規化最小二乗を用いて推定する。
初期実データを持たないコールドスタート設定のために、所定の精度が満たされるまでエッジを適応的に選択するバイアス対応能動学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2026-01-07T06:19:04Z) - G-Sim: Generative Simulations with Large Language Models and Gradient-Free Calibration [48.948187359727996]
G-Simは、厳密な経験的校正によるシミュレータ構築を自動化するハイブリッドフレームワークである。
信頼性のある因果的インフォームドシミュレータを生成し、データ効率を軽減し、堅牢なシステムレベルの介入を可能にする。
論文 参考訳(メタデータ) (2025-06-10T22:14:34Z) - Accelerated zero-order SGD under high-order smoothness and overparameterized regime [79.85163929026146]
凸最適化問題を解くための新しい勾配のないアルゴリズムを提案する。
このような問題は医学、物理学、機械学習で発生する。
両種類の雑音下で提案アルゴリズムの収束保証を行う。
論文 参考訳(メタデータ) (2024-11-21T10:26:17Z) - Robust Visual Sim-to-Real Transfer for Robotic Manipulation [79.66851068682779]
シミュレーションにおけるビジュモータポリシーの学習は、現実世界よりも安全で安価である。
しかし、シミュレーションデータと実データとの相違により、シミュレータ訓練されたポリシーは実際のロボットに転送されると失敗することが多い。
視覚的なsim-to-real領域ギャップを埋める一般的なアプローチは、ドメインランダム化(DR)である。
論文 参考訳(メタデータ) (2023-07-28T05:47:24Z) - Analysis of Randomization Effects on Sim2Real Transfer in Reinforcement
Learning for Robotic Manipulation Tasks [2.018504891256636]
4つのランダム化戦略と3つのランダム化パラメータをシミュレーションと実ロボットで比較する。
以上の結果から,Sim2Real転送においてよりランダム化が有効であることが示唆された。
論文 参考訳(メタデータ) (2022-06-13T16:12:56Z) - Robot Learning from Randomized Simulations: A Review [59.992761565399185]
ディープラーニングがロボティクス研究のパラダイムシフトを引き起こし、大量のデータを必要とする方法が好まれている。
最先端のアプローチは、データ生成が高速かつ安価であるシミュレーションで学ぶ。
本稿では,ランダム化シミュレーションから学習する手法である「領域ランダム化」に焦点をあてる。
論文 参考訳(メタデータ) (2021-11-01T13:55:41Z) - Understanding Domain Randomization for Sim-to-real Transfer [41.33483293243257]
本稿では,シミュレータを調整可能なパラメータを持つMDPの集合としてモデル化する,sim-to-realトランスファーの理論的枠組みを提案する。
実世界のトレーニングサンプルを使わずに, 穏やかな条件下で, sim-to-realトランスファーが成功できることを実証する。
論文 参考訳(メタデータ) (2021-10-07T07:45:59Z) - Simulation-based Bayesian inference for multi-fingered robotic grasping [6.677646909984405]
マルチフィンガーロボットグリーピングは、普遍的なピックと巧妙な操作のための、決定不可能なステップストーンである。
しかし、マルチフィンガーグリップは、リッチな非滑らかな接触ダイナミクスやノイズのために制御が難しいままである。
本稿では,確率-証拠比の深部ニューラルネットワークに基づくベイズ推論のための新しいシミュレーションに基づく手法を提案する。
論文 参考訳(メタデータ) (2021-09-29T08:44:36Z) - Auto-Tuned Sim-to-Real Transfer [143.44593793640814]
シミュレーションで訓練されたポリシーは、しばしば現実世界に移されるときに失敗する。
ドメインのランダム化のようなこの問題に取り組む現在のアプローチには、事前の知識とエンジニアリングが必要である。
実世界に合わせてシミュレータシステムパラメータを自動的にチューニングする手法を提案する。
論文 参考訳(メタデータ) (2021-04-15T17:59:55Z) - Point Cloud Based Reinforcement Learning for Sim-to-Real and Partial
Observability in Visual Navigation [62.22058066456076]
強化学習(Reinforcement Learning, RL)は、複雑なロボットタスクを解決する強力なツールである。
RL は sim-to-real transfer problem として知られる現実世界では直接作用しない。
本稿では,点雲と環境ランダム化によって構築された観測空間を学習する手法を提案する。
論文 参考訳(メタデータ) (2020-07-27T17:46:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。