Fugu-MT 論文翻訳(概要): Continuously Improving Mobile Manipulation with Autonomous Real-World RL

論文の概要: Continuously Improving Mobile Manipulation with Autonomous Real-World RL

arxiv url: http://arxiv.org/abs/2409.20568v1
Date: Mon, 30 Sep 2024 17:59:50 GMT
ステータス: 翻訳完了
システム内更新日: 2024-10-02 01:35:17.296757
Title: Continuously Improving Mobile Manipulation with Autonomous Real-World RL
Title（参考訳）: 自律的実世界RLによるモバイル操作の継続的改善
Authors: Russell Mendonca, Emmanuel Panov, Bernadette Bucher, Jiuguang Wang, Deepak Pathak,
Abstract要約: モバイル操作のための完全に自律的な実世界のRLフレームワークを提案する。これはタスク関連自律性によって実現され、これはオブジェクトのインタラクションへの探索をガイドし、目標状態付近の停滞を防ぐ。我々は,Spotロボットがモバイル操作タスクの4つの課題に対して,継続的なパフォーマンス向上を可能にすることを実証した。
参考スコア（独自算出の注目度）: 33.085671103158866
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We present a fully autonomous real-world RL framework for mobile manipulation that can learn policies without extensive instrumentation or human supervision. This is enabled by 1) task-relevant autonomy, which guides exploration towards object interactions and prevents stagnation near goal states, 2) efficient policy learning by leveraging basic task knowledge in behavior priors, and 3) formulating generic rewards that combine human-interpretable semantic information with low-level, fine-grained observations. We demonstrate that our approach allows Spot robots to continually improve their performance on a set of four challenging mobile manipulation tasks, obtaining an average success rate of 80% across tasks, a 3-4 improvement over existing approaches. Videos can be found at https://continual-mobile-manip.github.io/
Abstract（参考訳）: モバイル操作のための完全に自律的な実世界のRLフレームワークを提案する。これは有効です 1) 課題関連自律性(タスク関連自律性)は、対象の相互作用を探索し、目標状態付近の停滞を防ぐ。 2【行動事前の基本的課題知識を活用した効果的な政策学習】 3)人間の解釈可能な意味情報と低レベルの微粒な観察を組み合わせた一般的な報酬の定式化。提案手法により,モバイル操作タスクの4つの課題に対して,Spotロボットが継続的なパフォーマンス向上を実現し,タスク間の平均成功率を80%,既存のアプローチよりも3～4倍向上できることを示す。ビデオはhttps://continual-mobile-manip.github.io/で見ることができる。

関連論文リスト

Mobile-R1: Towards Interactive Reinforcement Learning for VLM-Based Mobile Agent via Task-Level Rewards [29.467847768352282]
対話型マルチターン強化学習とタスクレベルの報酬をモバイルエージェントに提供するMobile-R1を紹介する。トレーニングフレームワークは,初期形式微調整,アクションレベル報酬によるワンステップオンライントレーニング,マルチターン軌道に基づくタスクレベル報酬によるオンライントレーニングの3段階で構成されている。この戦略はMobile-R1の探索と誤り訂正機能を強化するために設計されており、大幅な性能向上につながっている。
論文参考訳（メタデータ） (2025-06-25T11:34:43Z)
Data-Efficient Learning from Human Interventions for Mobile Robots [46.65860995185883]
モバイルロボットは、自律デリバリやホスピタリティサービスといったアプリケーションに不可欠である。モバイルロボットタスクに学習ベースの手法を適用することは、その堅牢性と一般化性から人気を集めている。 Imitation Learning (IL) や Reinforcement Learning (RL) といった従来の手法は、適応性を提供するが、大きなデータセット、慎重に構築された報酬関数、そして実際のギャップに直面する。本稿では,ILとRLを組み合わせたオンライン・ヒューマン・イン・ザ・ループ学習手法PVP4Realを提案する。
論文参考訳（メタデータ） (2025-03-06T21:02:02Z)
Self-Supervised Learning of Grasping Arbitrary Objects On-the-Move [8.445514342786579]
本研究では3つの完全畳み込みニューラルネットワーク(FCN)モデルを導入し,視覚入力から静的グリッププリミティブ,動的グリッププリミティブ,残留移動速度誤差を予測する。提案手法は高い把握精度とピック・アンド・プレイス効率を実現した。
論文参考訳（メタデータ） (2024-11-15T02:59:16Z)
Learning the Generalizable Manipulation Skills on Soft-body Tasks via Guided Self-attention Behavior Cloning Policy [9.345203561496552]
GP2E行動クローニングポリシーは、ソフトボディタスクから汎用的な操作スキルを学ぶためのエージェントを誘導することができる。本研究は,Embodied AIモデルの一般化能力を向上する手法の可能性を明らかにするものである。
論文参考訳（メタデータ） (2024-10-08T07:31:10Z)
Hand-Object Interaction Pretraining from Videos [77.92637809322231]
我々は,3次元ハンドオブジェクトインタラクショントラジェクトリから,一般的なロボット操作を学習する。人間の手と操作された物体を3D空間で共有し、人間の動きをロボットの動きと共有する。我々は、このポリシーを、強化学習(RL)と行動クローニング(BC)の両方で微調整することで、下流タスクへのサンプル効率の適応を可能にし、従来のアプローチと比較して堅牢性と一般化性を同時に改善できることを実証的に実証した。
論文参考訳（メタデータ） (2024-09-12T17:59:07Z)
EquiBot: SIM(3)-Equivariant Diffusion Policy for Generalizable and Data Efficient Learning [36.0274770291531]
本研究では,ロボット操作タスク学習のための頑健で,データ効率が高く,汎用的なアプローチであるEquibotを提案する。提案手法は,SIM(3)等価なニューラルネットワークアーキテクチャと拡散モデルを組み合わせたものである。本手法は,5分間の人間による実演から学ぶことで,新しい物体やシーンに容易に一般化できることが示唆された。
論文参考訳（メタデータ） (2024-07-01T17:09:43Z)
Robot Fine-Tuning Made Easy: Pre-Training Rewards and Policies for Autonomous Real-World Reinforcement Learning [58.3994826169858]
ロボット強化学習のためのリセット不要な微調整システムであるRoboFuMEを紹介する。我々の洞察は、オフラインの強化学習技術を利用して、事前訓練されたポリシーの効率的なオンライン微調整を確保することである。提案手法では,既存のロボットデータセットからのデータを組み込んで,目標タスクを3時間以内の自律現実体験で改善することができる。
論文参考訳（メタデータ） (2023-10-23T17:50:08Z)
Self-Improving Robots: End-to-End Autonomous Visuomotor Reinforcement Learning [54.636562516974884]
模倣と強化学習において、人間の監督コストは、ロボットが訓練できるデータの量を制限する。本研究では,自己改善型ロボットシステムのための新しい設計手法であるMEDAL++を提案する。ロボットは、タスクの実施と解除の両方を学ぶことで、自律的にタスクを練習し、同時にデモンストレーションから報酬関数を推論する。
論文参考訳（メタデータ） (2023-03-02T18:51:38Z)
Multi-skill Mobile Manipulation for Object Rearrangement [75.62774690484022]
本研究では,オブジェクト再構成のための長距離移動操作タスクへのモジュラーアプローチについて検討する。従来の作業チェーンでは、サブタスクで個別に学習するポイントゴールナビゲーションスキルを備えた複数の静止操作スキルがチェーンされている。静的な操作ではなく,モバイル操作のスキルを実装し,ポイントゴールではなく,地域目標で訓練されたナビゲーションスキルを訓練することで,これらのアイデアを運用する。
論文参考訳（メタデータ） (2022-09-06T19:02:08Z)
Robot Learning of Mobile Manipulation with Reachability Behavior Priors [38.49783454634775]
モバイルマニピュレーション(MM)システムは、非構造化現実環境におけるパーソナルアシスタントの役割を引き継ぐ上で理想的な候補である。その他の課題として、MMは移動性と操作性の両方を必要とするタスクを実行するために、ロボットの実施形態を効果的に調整する必要がある。本研究では,アクタ批判的RL手法におけるロボットの到達可能性の先行性の統合について検討した。
論文参考訳（メタデータ） (2022-03-08T12:44:42Z)
ReLMM: Practical RL for Learning Mobile Manipulation Skills Using Only Onboard Sensors [64.2809875343854]
ロボットは、ナビゲーションと把握の組み合わせを必要とするスキルを自律的に学習する方法について研究する。我々のシステムであるReLMMは、環境機器を使わずに、現実世界のプラットフォームで継続的に学習することができる。グラウンドカリキュラムトレーニングフェーズの後、ReLMMは、現実世界のトレーニングの約40時間で、ナビゲーションと完全に自動的なグリップを学習できる。
論文参考訳（メタデータ） (2021-07-28T17:59:41Z)
A Framework for Efficient Robotic Manipulation [79.10407063260473]
単一のロボットアームがピクセルからスパースリワード操作ポリシーを学習できることを示します。デモは10回しかなく、単一のロボットアームがピクセルからスパースリワード操作のポリシーを学習できることを示しています。
論文参考訳（メタデータ） (2020-12-14T22:18:39Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。