論文の概要: A Survey of Demonstration Learning
- arxiv url: http://arxiv.org/abs/2303.11191v1
- Date: Mon, 20 Mar 2023 15:22:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-21 15:01:10.128874
- Title: A Survey of Demonstration Learning
- Title(参考訳): 実証学習に関する調査
- Authors: Andr\'e Correia and Lu\'is A. Alexandre
- Abstract要約: 実証学習(Demonstration Learning)は、エージェントがデモンストレーションで示された専門家の行動を模倣してタスクを実行することを学習するパラダイムである。
デモから複雑な振る舞いを学ぶ大きな可能性を秘めているため、大きな注目を集めている。
環境と対話することなく学習することで、デモ学習はロボット工学や医療といった幅広い現実世界の応用を自動化できる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: With the fast improvement of machine learning, reinforcement learning (RL)
has been used to automate human tasks in different areas. However, training
such agents is difficult and restricted to expert users. Moreover, it is mostly
limited to simulation environments due to the high cost and safety concerns of
interactions in the real world. Demonstration Learning is a paradigm in which
an agent learns to perform a task by imitating the behavior of an expert shown
in demonstrations. It is a relatively recent area in machine learning, but it
is gaining significant traction due to having tremendous potential for learning
complex behaviors from demonstrations. Learning from demonstration accelerates
the learning process by improving sample efficiency, while also reducing the
effort of the programmer. Due to learning without interacting with the
environment, demonstration learning would allow the automation of a wide range
of real world applications such as robotics and healthcare. This paper provides
a survey of demonstration learning, where we formally introduce the
demonstration problem along with its main challenges and provide a
comprehensive overview of the process of learning from demonstrations from the
creation of the demonstration data set, to learning methods from
demonstrations, and optimization by combining demonstration learning with
different machine learning methods. We also review the existing benchmarks and
identify their strengths and limitations. Additionally, we discuss the
advantages and disadvantages of the paradigm as well as its main applications.
Lastly, we discuss our perspective on open problems and research directions for
this rapidly growing field.
- Abstract(参考訳): 機械学習の急速な改善により、強化学習(rl)はさまざまな領域におけるヒューマンタスクの自動化に使用されている。
しかし、そのようなエージェントの訓練は困難であり、専門家に限られている。
さらに、現実世界におけるインタラクションのコストと安全性の懸念から、シミュレーション環境に制限されることが多い。
実証学習(Demonstration Learning)は、エージェントがデモンストレーションで示された専門家の行動を模倣してタスクを実行することを学習するパラダイムである。
機械学習の比較的最近の分野だが、デモから複雑な振る舞いを学習する大きな可能性を秘めているため、大きな注目を集めている。
デモンストレーションから学ぶことは、サンプル効率を改善することで学習プロセスを加速し、プログラマの労力を削減します。
環境と対話することなく学習するため、デモ学習はロボット工学や医療といった現実世界の幅広いアプリケーションの自動化を可能にするだろう。
本稿では,実演学習に関する調査を行い,その主な課題とともに実演問題を正式に紹介するとともに,実演データセット作成から実演学習まで,実演学習から実演学習まで,さまざまな機械学習手法を組み合わせることで,実演学習の過程を網羅的に概観する。
また、既存のベンチマークをレビューし、その強みと限界を特定します。
さらに、本パラダイムの利点と欠点と、その主な応用について論じる。
最後に,この急速に拡大する分野におけるオープン問題と研究の方向性について考察する。
関連論文リスト
- AdaDemo: Data-Efficient Demonstration Expansion for Generalist Robotic Agent [75.91274222142079]
本研究では,汎用ロボットエージェントの学習を容易にするために,データ効率のよい方法で実演をスケールアップすることを目的とする。
AdaDemoは、デモデータセットを積極的に継続的に拡張することで、マルチタスクポリシー学習を改善するように設計されたフレームワークである。
論文 参考訳(メタデータ) (2024-04-11T01:59:29Z) - SWBT: Similarity Weighted Behavior Transformer with the Imperfect
Demonstration for Robotic Manipulation [32.78083518963342]
SWBT(Simisity Weighted Behavior Transformer)という新しいフレームワークを提案する。
SWBTは、環境との相互作用なしに、専門家と不完全なデモンストレーションの両方から効果的に学習する。
我々は、ロボット操作タスクのオフライン模倣学習環境に不完全なデモンストレーションを統合する試みを初めて行った。
論文 参考訳(メタデータ) (2024-01-17T04:15:56Z) - Skill Disentanglement for Imitation Learning from Suboptimal
Demonstrations [60.241144377865716]
我々は、小さなクリーンな実演セットと大きなノイズセットの両方で、準最適実演の模倣を考える。
本稿では,様々な品質のアクションプリミティブを異なるスキルに符号化し,サブデモレーションレベルの評価と模倣を行う手法を提案する。
論文 参考訳(メタデータ) (2023-06-13T17:24:37Z) - Boosting Reinforcement Learning and Planning with Demonstrations: A
Survey [25.847796336059343]
シーケンシャルな意思決定にデモを使うことの利点について論じる。
我々は,最近提案されたManiSkillロボット学習ベンチマークにおいて,デモの生成と活用のための実用的なパイプラインを実演する。
論文 参考訳(メタデータ) (2023-03-23T17:53:44Z) - Playful Interactions for Representation Learning [82.59215739257104]
本稿では,下流タスクの視覚的表現を学習するために,遊び心のあるインタラクションを自己指導的に利用することを提案する。
19の多様な環境で2時間の遊び心のあるデータを収集し、自己予測学習を用いて視覚的表現を抽出する。
我々の表現は、標準的な行動クローニングよりも一般化され、必要なデモの半数しか必要とせず、同様の性能を達成できる。
論文 参考訳(メタデータ) (2021-07-19T17:54:48Z) - Visual Adversarial Imitation Learning using Variational Models [60.69745540036375]
逆関数仕様は、深い強化学習を通しての学習行動にとって大きな障害であり続けている。
望ましい行動の視覚的なデモンストレーションは、エージェントを教えるためのより簡単で自然な方法を示すことが多い。
変動モデルに基づく対向的模倣学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-07-16T00:15:18Z) - Learning from Imperfect Demonstrations from Agents with Varying Dynamics [29.94164262533282]
我々は,実演が模倣学習にどの程度有用かを測定するために,実現可能性スコアと最適度スコアからなる指標を開発した。
シミュレーションと実ロボットによる4つの環境実験により,学習方針の改善が期待された。
論文 参考訳(メタデータ) (2021-03-10T07:39:38Z) - Visual Imitation Made Easy [102.36509665008732]
本稿では,ロボットへのデータ転送を容易にしながら,データ収集プロセスを単純化する,模倣のための代替インターフェースを提案する。
我々は、データ収集装置やロボットのエンドエフェクターとして、市販のリーチ・グラブラー補助具を使用する。
我々は,非包括的プッシュと包括的積み重ねという2つの課題について実験的に評価した。
論文 参考訳(メタデータ) (2020-08-11T17:58:50Z) - Reinforcement Learning with Supervision from Noisy Demonstrations [38.00968774243178]
本研究では,環境と協調して対話し,専門家による実演を生かして政策を適応的に学習する新しい枠組みを提案する。
複数の人気強化学習アルゴリズムを用いた各種環境における実験結果から,提案手法はノイズの多い実演で頑健に学習可能であることが示された。
論文 参考訳(メタデータ) (2020-06-14T06:03:06Z) - State-Only Imitation Learning for Dexterous Manipulation [63.03621861920732]
本稿では,国家のみの模倣学習について考察する。
我々は、逆ダイナミクスモデルをトレーニングし、状態のみのデモンストレーションのアクションを予測するためにそれを使用します。
我々の手法は状態-作用アプローチと同等に動作し、RL単独よりもかなり優れています。
論文 参考訳(メタデータ) (2020-04-07T17:57:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。