論文の概要: ActivePusher: Active Learning and Planning with Residual Physics for Nonprehensile Manipulation
- arxiv url: http://arxiv.org/abs/2506.04646v1
- Date: Thu, 05 Jun 2025 05:28:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-08 18:02:04.994169
- Title: ActivePusher: Active Learning and Planning with Residual Physics for Nonprehensile Manipulation
- Title(参考訳): ActivePusher:非包括的操作のための残留物理を用いたアクティブラーニングとプランニング
- Authors: Zhuoyun Zhong, Seyedali Golestaneh, Constantinos Chamzas,
- Abstract要約: 学習力学モデルによるプランニングは、現実世界の長期的操作に対して有望なアプローチを提供する。
ActivePusherは、残差物理モデリングとカーネルベースの不確実性駆動型アクティブラーニングを組み合わせたフレームワークである。
シミュレーションと実世界の両環境でのアプローチを評価し,ベースライン手法と比較してデータ効率と計画成功率を改善することを示す。
- 参考スコア(独自算出の注目度): 2.7405276609125164
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Planning with learned dynamics models offers a promising approach toward real-world, long-horizon manipulation, particularly in nonprehensile settings such as pushing or rolling, where accurate analytical models are difficult to obtain. Although learning-based methods hold promise, collecting training data can be costly and inefficient, as it often relies on randomly sampled interactions that are not necessarily the most informative. To address this challenge, we propose ActivePusher, a novel framework that combines residual-physics modeling with kernel-based uncertainty-driven active learning to focus data acquisition on the most informative skill parameters. Additionally, ActivePusher seamlessly integrates with model-based kinodynamic planners, leveraging uncertainty estimates to bias control sampling toward more reliable actions. We evaluate our approach in both simulation and real-world environments and demonstrate that it improves data efficiency and planning success rates compared to baseline methods.
- Abstract(参考訳): 学習力学モデルによるプランニングは、特に、正確な解析モデルを得るのが困難であるプッシュやローリングのような非包括的設定において、現実世界の長い水平操作に対して有望なアプローチを提供する。
学習ベースの手法は有望であるが、トレーニングデータの収集にはコストがかかり非効率である。
この課題に対処するため、我々は、残差物理モデリングとカーネルベースの不確実性駆動型アクティブラーニングを組み合わせた新しいフレームワークであるActivePusherを提案し、最も有意義なスキルパラメータにデータ取得を集中させる。
さらに、ActivePusherはモデルベースのキノダイナミックプランナとシームレスに統合し、不確実性推定を活用してより信頼性の高いアクションに向けてバイアス制御サンプリングを行う。
シミュレーションと実世界の両環境でのアプローチを評価し,ベースライン手法と比較してデータ効率と計画成功率を改善することを示す。
関連論文リスト
- Look Before Leap: Look-Ahead Planning with Uncertainty in Reinforcement Learning [4.902161835372679]
モデルに基づく探索計画を用いた不確実性を考慮したポリシー最適化のための新しいフレームワークを提案する。
政策最適化フェーズでは、不確実性駆動型探索政策を活用し、多様なトレーニングサンプルを積極的に収集する。
我々のアプローチは、様々な状態/行動空間と報酬構造を持つタスクに柔軟性と適用性を提供します。
論文 参考訳(メタデータ) (2025-03-26T01:07:35Z) - STAR: Constraint LoRA with Dynamic Active Learning for Data-Efficient Fine-Tuning of Large Language Models [21.929902181609936]
我々は不確実性に基づくアクティブラーニングとLoRAを統合する新しい手法を提案する。
不確実性ギャップについて、ベースモデルの不確実性とフルモデルの不確実性を組み合わせた動的不確実性測定を導入する。
モデルのキャリブレーションが不十分な場合、LoRAトレーニング中に正規化手法を導入し、モデルが過度に信頼されないようにする。
論文 参考訳(メタデータ) (2024-03-02T10:38:10Z) - Learning Objective-Specific Active Learning Strategies with Attentive
Neural Processes [72.75421975804132]
学び アクティブラーニング(LAL)は、アクティブラーニング戦略自体を学ぶことを提案し、与えられた設定に適応できるようにする。
能動学習問題の対称性と独立性を利用した新しい分類法を提案する。
私たちのアプローチは、筋電図から学ぶことに基づいており、モデルに標準ではない目的に適応する能力を与えます。
論文 参考訳(メタデータ) (2023-09-11T14:16:37Z) - Predictive Experience Replay for Continual Visual Control and
Forecasting [62.06183102362871]
視覚力学モデリングのための新しい連続学習手法を提案し,その視覚制御と予測における有効性について検討する。
まず,タスク固有のダイナミクスをガウスの混合で学習する混合世界モデルを提案し,その上で,破滅的な忘れを克服するための新たなトレーニング戦略を提案する。
我々のモデルは,DeepMind Control と Meta-World のベンチマークにおいて,既存の連続的学習アルゴリズムと視覚的RLアルゴリズムの単純な組み合わせよりも優れている。
論文 参考訳(メタデータ) (2023-03-12T05:08:03Z) - Active Learning of Discrete-Time Dynamics for Uncertainty-Aware Model Predictive Control [46.81433026280051]
本稿では,非線形ロボットシステムの力学を積極的にモデル化する自己教師型学習手法を提案する。
我々のアプローチは、目に見えない飛行条件に一貫して適応することで、高いレジリエンスと一般化能力を示す。
論文 参考訳(メタデータ) (2022-10-23T00:45:05Z) - Deep Active Learning with Noise Stability [24.54974925491753]
ラベルのないデータの不確実性推定は、アクティブな学習に不可欠である。
本稿では,雑音の安定性を利用して不確実性を推定する新しいアルゴリズムを提案する。
本手法はコンピュータビジョン,自然言語処理,構造データ解析など,様々なタスクに適用可能である。
論文 参考訳(メタデータ) (2022-05-26T13:21:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。