論文の概要: Stronger Generalization Guarantees for Robot Learning by Combining
Generative Models and Real-World Data
- arxiv url: http://arxiv.org/abs/2111.08761v1
- Date: Tue, 16 Nov 2021 20:13:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-18 16:04:00.192006
- Title: Stronger Generalization Guarantees for Robot Learning by Combining
Generative Models and Real-World Data
- Title(参考訳): 生成モデルと実世界データを組み合わせたロボット学習のためのより強力な一般化保証
- Authors: Abhinav Agarwal, Sushant Veer, Allen Z. Ren, Anirudha Majumdar
- Abstract要約: 実世界の環境の有限データセットを活用することで、一般化保証を提供するためのフレームワークを提供する。
非線形・ハイブリッド力学とリッチ・センシング・モダリティを持つ2つのシミュレーションシステムに対するアプローチを実証する。
- 参考スコア(独自算出の注目度): 5.935761705025763
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We are motivated by the problem of learning policies for robotic systems with
rich sensory inputs (e.g., vision) in a manner that allows us to guarantee
generalization to environments unseen during training. We provide a framework
for providing such generalization guarantees by leveraging a finite dataset of
real-world environments in combination with a (potentially inaccurate)
generative model of environments. The key idea behind our approach is to
utilize the generative model in order to implicitly specify a prior over
policies. This prior is updated using the real-world dataset of environments by
minimizing an upper bound on the expected cost across novel environments
derived via Probably Approximately Correct (PAC)-Bayes generalization theory.
We demonstrate our approach on two simulated systems with nonlinear/hybrid
dynamics and rich sensing modalities: (i) quadrotor navigation with an onboard
vision sensor, and (ii) grasping objects using a depth sensor. Comparisons with
prior work demonstrate the ability of our approach to obtain stronger
generalization guarantees by utilizing generative models. We also present
hardware experiments for validating our bounds for the grasping task.
- Abstract(参考訳): 我々は、トレーニング中に見えない環境への一般化を保証する方法で、豊かな感覚入力(例えば視覚)を持つロボットシステムの学習ポリシーの問題に動機付けられている。
現実環境の有限データセットと(潜在的に不正確な)環境生成モデルを組み合わせることで、そのような一般化保証を提供するためのフレームワークを提供する。
このアプローチの背後にある重要なアイデアは、事前のポリシーを暗黙的に指定するために生成モデルを活用することです。
この前者は、確率的近似(PAC)-ベイズ一般化理論によって導かれる新しい環境における期待されるコストの上限を最小化し、実際の環境データセットを用いて更新される。
非線形/ハイブリッドダイナミクスとリッチセンシングモダリティを有する2つのシミュレーションシステムに対するアプローチを実証する。
(i)オンボードビジョンセンサ付き四角形ナビゲーション、
(ii)深度センサによる物体の把握
先行研究との比較により, 生成モデルを用いてより強力な一般化保証が得られることを示す。
また,把握作業の限界を検証するためのハードウェア実験も提案する。
関連論文リスト
- WHALE: Towards Generalizable and Scalable World Models for Embodied Decision-making [40.53824201182517]
本稿では、一般化可能な世界モデルを学ぶためのフレームワークであるWHALEを紹介する。
Whale-STは、拡張一般化性を備えた時空間変圧器を用いたスケーラブルな世界モデルである。
また、Open X-Embodimentデータセットから970K軌道上でトレーニングされた414MパラメータワールドモデルであるWhale-Xを提案する。
論文 参考訳(メタデータ) (2024-11-08T15:01:27Z) - Flex: End-to-End Text-Instructed Visual Navigation with Foundation Models [59.892436892964376]
本稿では,視覚に基づく制御ポリシを用いて,ロバストな閉ループ性能を実現するために必要な最小限のデータ要件とアーキテクチャ適応について検討する。
この知見はFlex (Fly-lexically) で合成され,VLM(Vision Language Models) をフリーズしたパッチワイド特徴抽出器として利用するフレームワークである。
本研究では,本手法が4段階のフライ・トゥ・ターゲットタスクにおいて有効であることを示す。
論文 参考訳(メタデータ) (2024-10-16T19:59:31Z) - Robot Skill Generalization via Keypoint Integrated Soft Actor-Critic
Gaussian Mixture Models [21.13906762261418]
ロボット操作システムの長年の課題は、取得したモータースキルを、目に見えない環境に適応させ、一般化することだ。
我々は、模倣と強化のパラダイムを統合するハイブリッドスキルモデルを用いて、この課題に取り組む。
提案手法は,ロボットが新規環境への大幅なゼロショット一般化を実現し,目標環境におけるスキルをスクラッチから学習するよりも早く洗練することができることを示す。
論文 参考訳(メタデータ) (2023-10-23T16:03:23Z) - Transferring Foundation Models for Generalizable Robotic Manipulation [82.12754319808197]
インターネット規模の基盤モデルによって生成された言語推論セグメンテーションマスクを効果的に活用する新しいパラダイムを提案する。
提案手法は,オブジェクトのポーズを効果的かつ堅牢に知覚し,サンプル効率のよい一般化学習を可能にする。
デモは提出されたビデオで見ることができ、より包括的なデモはlink1またはlink2で見ることができます。
論文 参考訳(メタデータ) (2023-06-09T07:22:12Z) - Predictive Experience Replay for Continual Visual Control and
Forecasting [62.06183102362871]
視覚力学モデリングのための新しい連続学習手法を提案し,その視覚制御と予測における有効性について検討する。
まず,タスク固有のダイナミクスをガウスの混合で学習する混合世界モデルを提案し,その上で,破滅的な忘れを克服するための新たなトレーニング戦略を提案する。
我々のモデルは,DeepMind Control と Meta-World のベンチマークにおいて,既存の連続的学習アルゴリズムと視覚的RLアルゴリズムの単純な組み合わせよりも優れている。
論文 参考訳(メタデータ) (2023-03-12T05:08:03Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - Dream to Explore: Adaptive Simulations for Autonomous Systems [3.0664963196464448]
ベイズ的非パラメトリック法を適用し,力学系制御の学習に挑戦する。
ガウス過程を用いて潜在世界力学を探索することにより、強化学習で観測される一般的なデータ効率の問題を緩和する。
本アルゴリズムは,ログの変動的下界を最適化することにより,世界モデルと政策を共同で学習する。
論文 参考訳(メタデータ) (2021-10-27T04:27:28Z) - Learning to Continuously Optimize Wireless Resource in a Dynamic
Environment: A Bilevel Optimization Perspective [52.497514255040514]
この研究は、データ駆動メソッドが動的環境でリソース割り当て戦略を継続的に学び、最適化することを可能にする新しいアプローチを開発しています。
学習モデルが新たなエピソードに段階的に適応できるように、連続学習の概念を無線システム設計に組み込むことを提案する。
我々の設計は、異なるデータサンプルにまたがる公平性を保証する、新しい二段階最適化定式化に基づいている。
論文 参考訳(メタデータ) (2021-05-03T07:23:39Z) - Guided Uncertainty-Aware Policy Optimization: Combining Learning and
Model-Based Strategies for Sample-Efficient Policy Learning [75.56839075060819]
従来のロボットのアプローチは、環境の正確なモデル、タスクの実行方法の詳細な説明、現在の状態を追跡するための堅牢な認識システムに依存している。
強化学習アプローチは、タスクを記述するための報酬信号だけで、生の感覚入力から直接操作することができるが、非常にサンプル非効率で脆弱である。
本研究では,ロボットの知覚・運動パイプラインにおける不正確さを克服できる一般的な手法を得るために,モデルに基づく手法の強みと学習に基づく手法の柔軟性を組み合わせる。
論文 参考訳(メタデータ) (2020-05-21T19:47:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。