論文の概要: A Survey of Imitation Learning: Algorithms, Recent Developments, and
Challenges
- arxiv url: http://arxiv.org/abs/2309.02473v1
- Date: Tue, 5 Sep 2023 11:56:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-07 18:07:27.532740
- Title: A Survey of Imitation Learning: Algorithms, Recent Developments, and
Challenges
- Title(参考訳): 模倣学習に関する調査 : アルゴリズム,最近の展開,課題
- Authors: Maryam Zare, Parham M. Kebria, Abbas Khosravi, Saeid Nahavandi
- Abstract要約: 模倣学習(英: mimicion learning、IL)とは、専門家の行動を模倣することによって望ましい行動が学習される過程である。
本稿では、ILの概要と、その基礎となる前提とアプローチの概要について述べる。
また、この分野における最近の進歩と新たな研究分野についても詳述している。
- 参考スコア(独自算出の注目度): 9.288673880680033
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: In recent years, the development of robotics and artificial intelligence (AI)
systems has been nothing short of remarkable. As these systems continue to
evolve, they are being utilized in increasingly complex and unstructured
environments, such as autonomous driving, aerial robotics, and natural language
processing. As a consequence, programming their behaviors manually or defining
their behavior through reward functions (as done in reinforcement learning
(RL)) has become exceedingly difficult. This is because such environments
require a high degree of flexibility and adaptability, making it challenging to
specify an optimal set of rules or reward signals that can account for all
possible situations. In such environments, learning from an expert's behavior
through imitation is often more appealing. This is where imitation learning
(IL) comes into play - a process where desired behavior is learned by imitating
an expert's behavior, which is provided through demonstrations.
This paper aims to provide an introduction to IL and an overview of its
underlying assumptions and approaches. It also offers a detailed description of
recent advances and emerging areas of research in the field. Additionally, the
paper discusses how researchers have addressed common challenges associated
with IL and provides potential directions for future research. Overall, the
goal of the paper is to provide a comprehensive guide to the growing field of
IL in robotics and AI.
- Abstract(参考訳): 近年、ロボット工学と人工知能(AI)システムの開発は目覚ましいものではなかった。
これらのシステムは進化を続けるにつれて、自律運転、航空ロボティクス、自然言語処理など、ますます複雑で非構造的な環境で利用されていく。
その結果、手動でプログラミングしたり、(強化学習(RL)で行うように)報酬関数を通じて振舞いを定義することは極めて困難になっている。
これは、このような環境は高い柔軟性と適応性を必要とするため、あらゆる可能な状況に対処できる最適なルールや報奨信号のセットを特定することは困難である。
このような環境では、模倣を通じて専門家の行動から学ぶことがより魅力的であることが多い。
これは、模倣学習(IL)が活躍する場であり、専門家の振る舞いを模倣することによって望ましい振る舞いが学習されるプロセスである。
本稿では,ilの紹介と基礎となる前提とアプローチの概要について述べる。
また、この分野における最近の進歩と新たな研究分野についても詳述している。
さらに、ilに関連する共通の課題に研究者がどのように対処し、今後の研究の方向性を提供するのかについても論じた。
本論文の目的は、ロボット工学とAIにおけるILの成長分野への包括的ガイドを提供することである。
関連論文リスト
- Synthesizing Evolving Symbolic Representations for Autonomous Systems [2.4233709516962785]
本稿では,その経験をスクラッチからPDDL表現に合成し,時間とともに更新できるオープンエンド学習システムを提案する。
a)選択肢を発見する、(b)選択肢を使って環境を探索する、(c)収集した知識を抽象化する、(d)計画。
論文 参考訳(メタデータ) (2024-09-18T07:23:26Z) - Open-world Machine Learning: A Review and New Outlooks [83.6401132743407]
本稿では,新たなオープンワールド機械学習パラダイムを包括的に紹介することを目的としている。
研究者がそれぞれの分野でより強力なAIシステムを構築するのを支援し、人工知能の開発を促進することを目的としている。
論文 参考訳(メタデータ) (2024-03-04T06:25:26Z) - Enabling High-Level Machine Reasoning with Cognitive Neuro-Symbolic
Systems [67.01132165581667]
本稿では,認知アーキテクチャを外部のニューロシンボリックコンポーネントと統合することにより,AIシステムにおける高レベル推論を実現することを提案する。
本稿では,ACT-Rを中心としたハイブリッドフレームワークについて紹介し,最近の応用における生成モデルの役割について論じる。
論文 参考訳(メタデータ) (2023-11-13T21:20:17Z) - Incremental procedural and sensorimotor learning in cognitive humanoid
robots [52.77024349608834]
本研究は,手順を段階的に学習する認知エージェントを提案する。
各サブステージで必要とされる認知機能と, エージェントが未解決の課題に, 新たな機能の追加がどう対処するかを示す。
結果は、このアプローチが複雑なタスクを段階的に解くことができることを示している。
論文 参考訳(メタデータ) (2023-04-30T22:51:31Z) - Machine Psychology [54.287802134327485]
我々は、心理学にインスパイアされた行動実験において、研究のための実りある方向が、大きな言語モデルに係わっていると論じる。
本稿では,本手法が表に示す理論的視点,実験パラダイム,計算解析技術について述べる。
これは、パフォーマンスベンチマークを超えた、生成人工知能(AI)のための「機械心理学」の道を開くものだ。
論文 参考訳(メタデータ) (2023-03-24T13:24:41Z) - A Comprehensive Survey of Continual Learning: Theory, Method and
Application [64.23253420555989]
本稿では,基礎的設定,理論的基礎,代表的方法,実践的応用を橋渡しする継続的学習に関する包括的調査を行う。
連続学習の一般的な目的は、資源効率の文脈において、適切な安定性と塑性のトレードオフと適切なタスク内/タスク内一般化性を保証することであると要約する。
論文 参考訳(メタデータ) (2023-01-31T11:34:56Z) - From Machine Learning to Robotics: Challenges and Opportunities for
Embodied Intelligence [113.06484656032978]
記事は、インテリジェンスが機械学習技術の進歩の鍵を握っていると主張している。
私たちは、インテリジェンスを具体化するための課題と機会を強調します。
本稿では,ロボット学習の最先端性を著しく向上させる研究の方向性を提案する。
論文 参考訳(メタデータ) (2021-10-28T16:04:01Z) - Imitation Learning: Progress, Taxonomies and Opportunities [8.362917578701563]
模倣学習は、人間の行動の再現のために、人間の専門家のデモンストレーションや人工的に作られたエージェントから知識を抽出することを目的としている。
その成功は、ビデオゲーム、自律運転、ロボットシミュレーション、オブジェクト操作などの分野で実証されている。
ほとんどの訓練されたエージェントは、タスク固有の環境でうまく機能するように制限されている。
論文 参考訳(メタデータ) (2021-06-23T05:55:33Z) - DREAM Architecture: a Developmental Approach to Open-Ended Learning in
Robotics [44.62475518267084]
我々は、この再記述プロセス段階を段階的にブートストラップし、適切なモチベーションを持った新しい状態表現を構築し、獲得した知識をドメインやタスク、さらにはロボット間で伝達するための発達的認知アーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-05-13T09:29:40Z) - Human AI interaction loop training: New approach for interactive
reinforcement learning [0.0]
機械学習の様々な意思決定タスクにおける強化学習(RL)は、スタンドアロンの報酬関数から学習するエージェントによる効果的な結果を提供する。
RLは、多くの環境状態と行動空間、および報酬の決定に固有の課題を提示する。
イミテーションラーニング(IL)は、教師を使った課題に対して有望な解決策を提供する。
論文 参考訳(メタデータ) (2020-03-09T15:27:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。