論文の概要: Towards Teachable Autonomous Agents
- arxiv url: http://arxiv.org/abs/2105.11977v1
- Date: Tue, 25 May 2021 14:28:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-26 17:06:33.354485
- Title: Towards Teachable Autonomous Agents
- Title(参考訳): 教育可能な自律エージェントを目指して
- Authors: Olivier Sigaud and Hugo Caselles-Dupr\'e and C\'edric Colas and Ahmed
Akakzia and Pierre-Yves Oudeyer and Mohamed Chetouani
- Abstract要約: 我々は、自律的な能力が、教育可能で自律的なエージェントへの道を歩んでいると論じている。
我々は、自律的な能力が、教育可能で自律的なエージェントへの道を歩んでいると論じている。
- 参考スコア(独自算出の注目度): 18.724565431231568
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous discovery and direct instruction are two extreme sources of
learning in children, but educational sciences have shown that intermediate
approaches such as assisted discovery or guided play resulted in better
acquisition of skills. When turning to Artificial Intelligence, the above
dichotomy is translated into the distinction between autonomous agents which
learn in isolation and interactive learning agents which can be taught by
social partners but generally lack autonomy. In between should stand teachable
autonomous agents: agents learning from both internal and teaching signals to
benefit from the higher efficiency of assisted discovery. Such agents could
learn on their own in the real world, but non-expert users could drive their
learning behavior towards their expectations. More fundamentally, combining
both capabilities might also be a key step towards general intelligence. In
this paper we elucidate obstacles along this research line. First, we build on
a seminal work of Bruner to extract relevant features of the assisted discovery
processes. Second, we describe current research on autotelic agents, i.e.
agents equipped with forms of intrinsic motivations that enable them to
represent, self-generate and pursue their own goals. We argue that autotelic
capabilities are paving the way towards teachable and autonomous agents.
Finally, we adopt a social learning perspective on tutoring interactions and we
highlight some components that are currently missing to autotelic agents before
they can be taught by ordinary people using natural pedagogy, and we provide a
list of specific research questions that emerge from this perspective.
- Abstract(参考訳): 自律的発見と直接指導は、子供における極端な学習の源であるが、教育科学は、発見支援や指導遊びのような中間的なアプローチが、より優れたスキルの獲得に繋がることを示した。
人工知能に目を向けると、上記の二分法は、孤立して学習する自律エージェントと、社会的パートナーによって教えられるが一般的に自律性を持たない対話型学習エージェントの区別に変換される。
内部と内部の両方から学習するエージェントは、発見を補助する高い効率の恩恵を受ける。
このようなエージェントは現実世界で自分自身で学習できるが、専門家でないユーザは期待に応えて学習行動を推進できる。
より根本的には、両方の能力を組み合わせることは、汎用インテリジェンスにとって重要なステップである。
本稿では,この研究線に沿った障害を解明する。
まず、Brunerの専門的な研究に基づいて、支援された発見プロセスの特徴を抽出する。
第2に, オートテコール剤の最近の研究について述べる。
自らの目標を表現し、自己生成し、追求することを可能にする、本質的な動機づけの形式を備えたエージェント。
我々は、自律的な能力が、教育可能で自律的なエージェントへの道を歩んでいると論じている。
最後に,学習者同士のインタラクションを学習する上での社会的学習の視点を取り入れ,自然教育を用いて一般人が教える前に,現在オートテリックエージェントに欠落しているいくつかの要素を強調し,この視点から生み出す特定の研究課題のリストを提供する。
関連論文リスト
- SPIRE: Synergistic Planning, Imitation, and Reinforcement Learning for Long-Horizon Manipulation [58.14969377419633]
タスクをより小さな学習サブプロブレムに分解し、第2に模倣と強化学習を組み合わせてその強みを最大化するシステムであるspireを提案する。
我々は、模倣学習、強化学習、計画を統合する従来の手法よりも平均タスク性能が35%から50%向上していることを発見した。
論文 参考訳(メタデータ) (2024-10-23T17:42:07Z) - Generative AI in Education: A Study of Educators' Awareness, Sentiments, and Influencing Factors [2.217351976766501]
本研究は,AI言語モデルに対する教員の経験と態度について考察する。
学習スタイルと生成AIに対する態度の相関は見つからない。
CS教育者は、生成するAIツールの技術的理解にはるかに自信を持っているが、AI生成された仕事を検出する能力にこれ以上自信がない。
論文 参考訳(メタデータ) (2024-03-22T19:21:29Z) - Pangu-Agent: A Fine-Tunable Generalist Agent with Structured Reasoning [50.47568731994238]
人工知能(AI)エージェント作成の鍵となる方法は強化学習(RL)である
本稿では,構造化推論をAIエージェントのポリシーに統合し,学習するための一般的なフレームワークモデルを提案する。
論文 参考訳(メタデータ) (2023-12-22T17:57:57Z) - Artificial Intelligence-Enabled Intelligent Assistant for Personalized
and Adaptive Learning in Higher Education [0.2812395851874055]
本稿では,AIIA(Artificial Intelligence-Enabled Intelligent Assistant)という,高等教育におけるパーソナライズおよび適応学習のための新しいフレームワークを提案する。
AIIAシステムは、高度なAIと自然言語処理(NLP)技術を活用して、対話的で魅力的な学習プラットフォームを構築する。
論文 参考訳(メタデータ) (2023-09-19T19:31:15Z) - Incremental procedural and sensorimotor learning in cognitive humanoid
robots [52.77024349608834]
本研究は,手順を段階的に学習する認知エージェントを提案する。
各サブステージで必要とされる認知機能と, エージェントが未解決の課題に, 新たな機能の追加がどう対処するかを示す。
結果は、このアプローチが複雑なタスクを段階的に解くことができることを示している。
論文 参考訳(メタデータ) (2023-04-30T22:51:31Z) - Teachable Reinforcement Learning via Advice Distillation [161.43457947665073]
外部教師が提供した構造化アドバイスから学習する「教育可能な」意思決定システムに基づく対話型学習のための新しい指導パラダイムを提案する。
我々は、アドバイスから学ぶエージェントが、標準的な強化学習アルゴリズムよりも人的監督力の少ない新しいスキルを習得できることを示す。
論文 参考訳(メタデータ) (2022-03-19T03:22:57Z) - AI Autonomy : Self-Initiated Open-World Continual Learning and
Adaptation [16.96197233523911]
本稿では,自律的かつ連続的な学習が可能なAIエージェントを構築するためのフレームワークを提案する。
重要な課題は、エージェント自身のイニシアチブで継続的に実行されるように、プロセスを自動化する方法である。
論文 参考訳(メタデータ) (2022-03-17T00:07:02Z) - Toddler-Guidance Learning: Impacts of Critical Period on Multimodal AI
Agents [18.610737380842494]
我々は、AIエージェントの学習に臨界周期の概念を適用し、AIエージェントの仮想環境における臨界周期を調査する。
VECAツールキットを用いて幼児のような環境を構築し,幼児の学習特性を模倣する。
我々は、AIエージェントに対する臨界期間の影響を、ユニモーダル学習とマルチモーダル学習の両方において、どのように、いつ最も指導されるかという2つの視点から評価する。
論文 参考訳(メタデータ) (2022-01-12T10:57:40Z) - Self-Initiated Open World Learning for Autonomous AI Agents [16.41396764793912]
実際にAIエージェントが使われるようになるにつれて、エージェントを完全に自律的にする方法を考える時が来た。
本稿では,自己開始型オープンワールド学習エージェントの構築研究を促進するための,この学習パラダイムの理論的枠組みを提案する。
論文 参考訳(メタデータ) (2021-10-21T18:11:02Z) - PEBBLE: Feedback-Efficient Interactive Reinforcement Learning via
Relabeling Experience and Unsupervised Pre-training [94.87393610927812]
我々は、フィードバックと非政治学習の両方の長所を生かした、非政治的、インタラクティブな強化学習アルゴリズムを提案する。
提案手法は,従来ヒト・イン・ザ・ループ法で検討されていたよりも複雑度の高いタスクを学習可能であることを実証する。
論文 参考訳(メタデータ) (2021-06-09T14:10:50Z) - Explainable Active Learning (XAL): An Empirical Study of How Local
Explanations Impact Annotator Experience [76.9910678786031]
本稿では、最近急増している説明可能なAI(XAI)のテクニックをアクティブラーニング環境に導入することにより、説明可能なアクティブラーニング(XAL)の新たなパラダイムを提案する。
本研究は,機械教育のインタフェースとしてのAI説明の利点として,信頼度校正を支援し,リッチな形式の教示フィードバックを可能にすること,モデル判断と認知作業負荷による潜在的な欠点を克服する効果を示す。
論文 参考訳(メタデータ) (2020-01-24T22:52:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。