論文の概要: Failure Forecasting Boosts Robustness of Sim2Real Rhythmic Insertion Policies
- arxiv url: http://arxiv.org/abs/2507.06519v1
- Date: Wed, 09 Jul 2025 03:38:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-10 17:37:43.456384
- Title: Failure Forecasting Boosts Robustness of Sim2Real Rhythmic Insertion Policies
- Title(参考訳): フェール予測はSim2Realのリズム挿入ポリシーのロバスト性を高める
- Authors: Yuhan Liu, Xinyu Zhang, Haonan Chang, Abdeslam Boularias,
- Abstract要約: 本稿では,ロボットが繰り返し高精度挿入を行うRIT(Rhythmic Insertion Tasks)の課題に対処する。
本稿では,強化学習に基づく挿入ポリシーと障害予測モジュールを統合したフレームワークを提案する。
提案手法は1回の成功率が高く, 長時間繰り返しタスクの性能を安定的に維持する。
- 参考スコア(独自算出の注目度): 32.99644520625179
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper addresses the challenges of Rhythmic Insertion Tasks (RIT), where a robot must repeatedly perform high-precision insertions, such as screwing a nut into a bolt with a wrench. The inherent difficulty of RIT lies in achieving millimeter-level accuracy and maintaining consistent performance over multiple repetitions, particularly when factors like nut rotation and friction introduce additional complexity. We propose a sim-to-real framework that integrates a reinforcement learning-based insertion policy with a failure forecasting module. By representing the wrench's pose in the nut's coordinate frame rather than the robot's frame, our approach significantly enhances sim-to-real transferability. The insertion policy, trained in simulation, leverages real-time 6D pose tracking to execute precise alignment, insertion, and rotation maneuvers. Simultaneously, a neural network predicts potential execution failures, triggering a simple recovery mechanism that lifts the wrench and retries the insertion. Extensive experiments in both simulated and real-world environments demonstrate that our method not only achieves a high one-time success rate but also robustly maintains performance over long-horizon repetitive tasks.
- Abstract(参考訳): 本稿では,ロボットがナットをレンチでボルトにねじるなど,高精度な挿入を繰り返し行うという,リズム挿入タスク(RIT)の課題に対処する。
RITの本質的な困難は、特にナット回転や摩擦のような要因が追加の複雑さをもたらす場合、ミリレベルの精度を達成することと、複数の繰り返しに対して一貫した性能を維持することである。
本稿では,強化学習に基づく挿入ポリシーと障害予測モジュールを統合したsim-to-realフレームワークを提案する。
ロボットのフレームではなく、ナットの座標フレームでレンチのポーズを表現することにより、本手法はシミュレート・トゥ・リアルの転送性を大幅に向上させる。
挿入ポリシーはシミュレーションで訓練され、リアルタイムの6Dポーズトラッキングを利用して正確なアライメント、挿入、回転操作を実行する。
同時に、ニューラルネットワークは潜在的な実行障害を予測し、レンチを持ち上げて挿入を再試行する単純なリカバリメカニズムを起動する。
シミュレーションと実世界の両環境における大規模な実験により,本手法は高い1回の成功率を達成するだけでなく,長期的反復作業における性能を安定的に維持することを示した。
関連論文リスト
- FreqPolicy: Frequency Autoregressive Visuomotor Policy with Continuous Tokens [20.715024408481973]
本稿では,階層的な周波数成分を段階的にモデル化するビジュモータポリシー学習のための新しいパラダイムを提案する。
さらに精度を高めるために,動作空間の滑らかさと連続性を維持する連続潜在表現を導入する。
我々の手法は、精度と効率の両方で既存の手法より優れている。
論文 参考訳(メタデータ) (2025-06-02T12:13:51Z) - RmGPT: A Foundation Model with Generative Pre-trained Transformer for Fault Diagnosis and Prognosis in Rotating Machinery [20.52039868199533]
現在のPHM(Prognostics and Health Management)の手法は、しばしばタスク固有のモデルに依存している。
生成前訓練モデルの進歩に触発されて,診断・予後タスクの統一モデルであるRmGPTを提案する。
RmGPTは最先端のアルゴリズムを著しく上回り、診断タスクではほぼ完璧な精度、予後タスクでは例外的に低い誤差を達成している。
論文 参考訳(メタデータ) (2024-09-26T07:40:47Z) - BiKC: Keypose-Conditioned Consistency Policy for Bimanual Robotic Manipulation [48.08416841005715]
両面操作に適したキーポーズ条件の整合性ポリシーを導入する。
階層的な模倣学習フレームワークであり、ハイレベルなキープレース予測器と低レベルな軌道生成器から構成される。
シミュレーションおよび実世界の実験結果から,提案手法は成功率と運用効率の点で基準法を超越していることが示された。
論文 参考訳(メタデータ) (2024-06-14T14:49:12Z) - RILe: Reinforced Imitation Learning [60.63173816209543]
RILe(Reinforced Learning)は、模倣学習と逆強化学習の強みを組み合わせて、高密度報酬関数を効率的に学習するフレームワークである。
本フレームワークは, 直接模倣が複雑な動作を再現できないような高次元タスクにおいて, 高い性能のポリシーを生成する。
論文 参考訳(メタデータ) (2024-06-12T17:56:31Z) - Integrating DeepRL with Robust Low-Level Control in Robotic Manipulators for Non-Repetitive Reaching Tasks [0.24578723416255746]
ロボット工学では、現代の戦略は学習に基づくもので、複雑なブラックボックスの性質と解釈可能性の欠如が特徴である。
本稿では, 深部強化学習(DRL)に基づく衝突のない軌道プランナと, 自動調整型低レベル制御戦略を統合することを提案する。
論文 参考訳(メタデータ) (2024-02-04T15:54:03Z) - Adversarial Imitation Learning with Trajectorial Augmentation and
Correction [61.924411952657756]
本稿では,拡張軌道の成功を保った新しい拡張手法を提案する。
我々は, 合成専門家を用いた模倣エージェントの訓練を行うために, 逆データ拡張模倣アーキテクチャを開発した。
実験により,我々のデータ拡張戦略は,敵対的模倣の精度と収束時間を向上できることが示された。
論文 参考訳(メタデータ) (2021-03-25T14:49:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。