Fugu-MT 論文翻訳(概要): Experience Selection Using Dynamics Similarity for Efficient Multi-Source Transfer Learning Between Robots

論文の概要: Experience Selection Using Dynamics Similarity for Efficient Multi-Source Transfer Learning Between Robots

arxiv url: http://arxiv.org/abs/2003.13150v1
Date: Sun, 29 Mar 2020 22:22:34 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-18 14:04:00.795423
Title: Experience Selection Using Dynamics Similarity for Efficient Multi-Source Transfer Learning Between Robots
Title（参考訳）: ロボット間の効率的なマルチソーストランスファー学習のためのダイナミクス類似性を用いた経験選択
Authors: Michael J. Sorocky, Siqi Zhou, and Angela P. Schoellig
Abstract要約: 不適切な知識伝達は、負の伝達や安全でない振る舞いをもたらすことがある。本稿では,2組のロボットシステム間の類似性を推定するデータ効率アルゴリズムを提案する。提案した類似度尺度に基づく選択経験が,対象の4乗算の学習を効果的に促進することを示す。
参考スコア（独自算出の注目度）: 12.119358871165439
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In the robotics literature, different knowledge transfer approaches have been proposed to leverage the experience from a source task or robot -- real or virtual -- to accelerate the learning process on a new task or robot. A commonly made but infrequently examined assumption is that incorporating experience from a source task or robot will be beneficial. In practice, inappropriate knowledge transfer can result in negative transfer or unsafe behaviour. In this work, inspired by a system gap metric from robust control theory, the $\nu$-gap, we present a data-efficient algorithm for estimating the similarity between pairs of robot systems. In a multi-source inter-robot transfer learning setup, we show that this similarity metric allows us to predict relative transfer performance and thus informatively select experiences from a source robot before knowledge transfer. We demonstrate our approach with quadrotor experiments, where we transfer an inverse dynamics model from a real or virtual source quadrotor to enhance the tracking performance of a target quadrotor on arbitrary hand-drawn trajectories. We show that selecting experiences based on the proposed similarity metric effectively facilitates the learning of the target quadrotor, improving performance by 62% compared to a poorly selected experience.
Abstract（参考訳）: ロボット工学の文献では、新しいタスクやロボットの学習プロセスを加速するために、ソースタスクまたはロボット(実または仮想)の経験を活用するために異なる知識伝達アプローチが提案されている。一般的に作られたが、頻繁に検討される前提は、ソースタスクやロボットの経験を取り入れることが有益なことである。実際には、不適切な知識伝達は負の伝達や安全でない振る舞いをもたらすことがある。本研究では,ロバスト制御理論からのシステムギャップメトリックである$\nu$-gapに着想を得て,ロボットシステム間の類似性を推定するデータ効率の高いアルゴリズムを提案する。多元ロボット間転送学習のセットアップでは、この類似度メトリクスにより、相対転送性能を予測でき、知識伝達の前にソースロボットから経験を情報的に選択できることを示す。提案手法は,実または仮想の4乗子から逆動力学モデルを転送し,任意の手書き軌道上での目標4乗子の追従性能を向上させる方法である。提案する類似度指標に基づく経験の選択は,目標4乗子の学習を効果的に促進し,選択の悪い経験と比較して62%向上することを示す。

関連論文リスト

Is Diversity All You Need for Scalable Robotic Manipulation? [50.747150672933316]
ロボット学習におけるデータ多様性の役割について,従来の「より多様な方がよい」という直観に固執する3つの重要な次元(タスク),実施形態(ロボットの使用方法),専門家(専門家)を用いて検討する。タスクの多様性は、タスクごとのデモンストレーション量よりも重要であり、多様な事前学習タスクから新しい下流シナリオへの移行に有効であることを示す。本稿では,速度のあいまいさを緩和する分散デバイアス法を提案する。GO-1-Proは,2.5倍の事前学習データを用いて,15%の性能向上を実現している。
論文参考訳（メタデータ） (2025-07-08T17:52:44Z)
Action Flow Matching for Continual Robot Learning [57.698553219660376]
ロボット工学における継続的な学習は、変化する環境やタスクに常に適応できるシステムを求める。本稿では,オンラインロボット力学モデルアライメントのためのフローマッチングを利用した生成フレームワークを提案する。ロボットは,不整合モデルで探索するのではなく,行動自体を変換することで,より効率的に情報収集を行う。
論文参考訳（メタデータ） (2025-04-25T16:26:15Z)
Sample Efficient Robot Learning in Supervised Effect Prediction Tasks [0.0]
本研究では,アクション・エフェクトの予測や,より一般的にはMUSELと呼ばれる世界モデル学習のためのロボットレグレッションタスクを目的とした新しいALフレームワークを開発する。 MUSELは、学習エンジンが与える総不確実性推定から、進捗と入力の多様性を利用してモデル不確かさを抽出し、それを用いて、最先端のアクション・エフェクト予測法を超えてサンプル効率を向上させることを目的としている。 MUSELの有効性は、ロボットのアクション・エフェクト・ラーニングで使用される標準的な方法と比較することによって実証される。
論文参考訳（メタデータ） (2024-12-03T09:48:28Z)
Simulation-Aided Policy Tuning for Black-Box Robot Learning [47.83474891747279]
本稿では,データ効率の向上に着目した新しいブラックボックスポリシー探索アルゴリズムを提案する。このアルゴリズムはロボット上で直接学習し、シミュレーションを追加の情報源として扱い、学習プロセスを高速化する。ロボットマニピュレータ上でのタスク学習の高速化と成功を,不完全なシミュレータの助けを借りて示す。
論文参考訳（メタデータ） (2024-11-21T15:52:23Z)
Active Exploration in Bayesian Model-based Reinforcement Learning for Robot Manipulation [8.940998315746684]
ロボットアームのエンドタスクに対するモデルベース強化学習(RL)アプローチを提案する。我々はベイズニューラルネットワークモデルを用いて、探索中に動的モデルに符号化された信念と情報の両方を確率論的に表現する。実験により,ベイズモデルに基づくRL手法の利点が示された。
論文参考訳（メタデータ） (2024-04-02T11:44:37Z)
Robot Fine-Tuning Made Easy: Pre-Training Rewards and Policies for Autonomous Real-World Reinforcement Learning [58.3994826169858]
ロボット強化学習のためのリセット不要な微調整システムであるRoboFuMEを紹介する。我々の洞察は、オフラインの強化学習技術を利用して、事前訓練されたポリシーの効率的なオンライン微調整を確保することである。提案手法では,既存のロボットデータセットからのデータを組み込んで,目標タスクを3時間以内の自律現実体験で改善することができる。
論文参考訳（メタデータ） (2023-10-23T17:50:08Z)
Self-Improving Robots: End-to-End Autonomous Visuomotor Reinforcement Learning [54.636562516974884]
模倣と強化学習において、人間の監督コストは、ロボットが訓練できるデータの量を制限する。本研究では,自己改善型ロボットシステムのための新しい設計手法であるMEDAL++を提案する。ロボットは、タスクの実施と解除の両方を学ぶことで、自律的にタスクを練習し、同時にデモンストレーションから報酬関数を推論する。
論文参考訳（メタデータ） (2023-03-02T18:51:38Z)
Domain Adaptive Robotic Gesture Recognition with Unsupervised Kinematic-Visual Data Alignment [60.31418655784291]
本稿では,マルチモダリティ知識,すなわちキネマティックデータとビジュアルデータを同時にシミュレータから実ロボットに伝達できる,教師なしドメイン適応フレームワークを提案する。ビデオの時間的手がかりと、ジェスチャー認識に対するマルチモーダル固有の相関を用いて、トランスファー可能な機能を強化したドメインギャップを修復する。その結果, 本手法は, ACCでは最大12.91%, F1scoreでは20.16%と, 実際のロボットではアノテーションを使わずに性能を回復する。
論文参考訳（メタデータ） (2021-03-06T09:10:03Z)
Point Cloud Based Reinforcement Learning for Sim-to-Real and Partial Observability in Visual Navigation [62.22058066456076]
強化学習(Reinforcement Learning, RL)は、複雑なロボットタスクを解決する強力なツールである。 RL は sim-to-real transfer problem として知られる現実世界では直接作用しない。本稿では,点雲と環境ランダム化によって構築された観測空間を学習する手法を提案する。
論文参考訳（メタデータ） (2020-07-27T17:46:59Z)
When Autonomous Systems Meet Accuracy and Transferability through AI: A Survey [17.416847623629362]
本稿では,自律システムにおける学習に基づくアプローチを,正確性と伝達可能性の観点から概観する。敵の学習の利点を示すため、正確性や伝達可能性の見直しに重点を置いている。本稿では,自律システムにおける対人学習,RL,メタラーニングの課題と今後の課題について論じる。
論文参考訳（メタデータ） (2020-03-29T04:50:22Z)
Scalable Multi-Task Imitation Learning with Autonomous Improvement [159.9406205002599]
我々は、自律的なデータ収集を通じて継続的に改善できる模倣学習システムを構築している。我々は、ロボット自身の試行を、実際に試みたタスク以外のタスクのデモとして活用する。従来の模倣学習のアプローチとは対照的に,本手法は,継続的改善のための疎い監視によるデータ収集を自律的に行うことができる。
論文参考訳（メタデータ） (2020-02-25T18:56:42Z)
Inter- and Intra-domain Knowledge Transfer for Related Tasks in Deep Character Recognition [2.320417845168326]
ImageNetデータセットでディープニューラルネットワークを事前トレーニングすることは、ディープラーニングモデルをトレーニングするための一般的なプラクティスである。 1つのタスクで事前トレーニングを行い、新しいタスクで再トレーニングするテクニックは、トランスファーラーニング(transfer learning)と呼ばれる。本稿では,文字認識タスクにおけるDeep Transfer Learningの有効性について分析する。
論文参考訳（メタデータ） (2020-01-02T14:18:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。