Fugu-MT 論文翻訳(概要): Autotelic Reinforcement Learning: Exploring Intrinsic Motivations for Skill Acquisition in Open-Ended Environments

論文の概要: Autotelic Reinforcement Learning: Exploring Intrinsic Motivations for Skill Acquisition in Open-Ended Environments

arxiv url: http://arxiv.org/abs/2502.04418v1
Date: Thu, 06 Feb 2025 14:37:46 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-10 18:29:32.883068
Title: Autotelic Reinforcement Learning: Exploring Intrinsic Motivations for Skill Acquisition in Open-Ended Environments
Title（参考訳）: 自己強化学習:オープンエンド環境におけるスキル獲得のための本質的な動機を探る
Authors: Prakhar Srivastava, Jasmeet Singh,
Abstract要約: 本稿では, 自己強化学習(RL)の概要を概観し, スキルレパートリーのオープンエンド形成における本質的モチベーションの役割を強調した。知識ベースと能力ベースの本質的なモチベーションの区別を明確にし、これらの概念が自己定義目標を生成・追求できる自律エージェントの開発にどのように役立つかを説明する。
参考スコア（独自算出の注目度）: 1.104960878651584
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: This paper presents a comprehensive overview of autotelic Reinforcement Learning (RL), emphasizing the role of intrinsic motivations in the open-ended formation of skill repertoires. We delineate the distinctions between knowledge-based and competence-based intrinsic motivations, illustrating how these concepts inform the development of autonomous agents capable of generating and pursuing self-defined goals. The typology of Intrinsically Motivated Goal Exploration Processes (IMGEPs) is explored, with a focus on the implications for multi-goal RL and developmental robotics. The autotelic learning problem is framed within a reward-free Markov Decision Process (MDP), WHERE agents must autonomously represent, generate, and master their own goals. We address the unique challenges in evaluating such agents, proposing various metrics for measuring exploration, generalization, and robustness in complex environments. This work aims to advance the understanding of autotelic RL agents and their potential for enhancing skill acquisition in a diverse and dynamic setting.
Abstract（参考訳）: 本稿では, 自己強化学習(RL)の概要を概観し, スキルレパートリーのオープンエンド形成における本質的モチベーションの役割を強調した。知識ベースと能力ベースの本質的なモチベーションの区別を明確にし、これらの概念が自己定義目標を生成・追求できる自律エージェントの開発にどのように役立つかを説明する。 Intivsically Motivated Goal Exploration Processes (IMGEPs) のタイポロジーについて検討し,マルチゴールRLと開発ロボティクスの意義に着目した。自己学習問題は報酬のないマルコフ決定プロセス(MDP)に枠付けられており、WHEREエージェントは自身の目標を自律的に表現し、生成し、マスターする必要がある。本研究では, 複雑な環境下での探索, 一般化, 堅牢性を計測するための様々な指標を提案し, このようなエージェントを評価する上で, ユニークな課題に対処する。本研究は, 自律的RLエージェントの理解を深め, 多様な動的環境において, スキル獲得の促進を図ることを目的としている。

関連論文リスト

LUCIFER: Language Understanding and Context-Infused Framework for Exploration and Behavior Refinement [5.522800137785975]
動的環境において、既存の環境知識の急速な陳腐化は、エージェントの内部モデルと運用コンテキストの間にギャップを生じさせる。本稿では、階層的な意思決定アーキテクチャと強化学習を統合したドメインに依存しないフレームワークLUCIFERを提案する。 LUCIFERは探索効率と意思決定品質を向上し、平坦で目標条件の政策よりも優れていることを示す。
論文参考訳（メタデータ） (2025-06-09T16:30:05Z)
Truly Self-Improving Agents Require Intrinsic Metacognitive Learning [59.60803539959191]
自己改善エージェントは、最小限の監督で継続的に新しい能力を取得することを目的としている。現在のアプローチは2つの重要な制限に直面している。自己改善プロセスは、しばしば厳格であり、タスクドメイン全体にわたって一般化できない。我々は、効果的な自己改善は、エージェントの本質的な能力として定義された固有のメタ認知学習を必要とし、自身の学習プロセスを積極的に評価し、反映し、適応させる。
論文参考訳（メタデータ） (2025-06-05T14:53:35Z)
A Survey of Frontiers in LLM Reasoning: Inference Scaling, Learning to Reason, and Agentic Systems [93.8285345915925]
推論(Reasoning)は、論理的推論、問題解決、意思決定を可能にする基本的な認知プロセスである。大規模言語モデル(LLM)の急速な進歩により、推論は高度なAIシステムを区別する重要な能力として浮上した。我々は,(1)推論が達成される段階を定義するレジーム,(2)推論プロセスに関与するコンポーネントを決定するアーキテクチャの2つの側面に沿って既存の手法を分類する。
論文参考訳（メタデータ） (2025-04-12T01:27:49Z)
Agentic Knowledgeable Self-awareness [79.25908923383776]
KnowSelfはデータ中心のアプローチで、人間のような知識のある自己認識を持つエージェントを応用する。我々の実験により、KnowSelfは、外部知識を最小限に使用して、様々なタスクやモデルにおいて、様々な強力なベースラインを達成できることが実証された。
論文参考訳（メタデータ） (2025-04-04T16:03:38Z)
Metacognition for Unknown Situations and Environments (MUSE) [3.2020845462590697]
未知の状況と環境(MUSE)フレームワークのメタ認知を提案する。 MUSEはメタ認知プロセス、特に自己認識と自己制御を自律エージェントに統合する。エージェントは自己認識と自己制御の大幅な改善を示す。
論文参考訳（メタデータ） (2024-11-20T18:41:03Z)
Innate-Values-driven Reinforcement Learning based Cognitive Modeling [1.8220718426493654]
本来の価値観はエージェントの本質的なモチベーションを表しており、エージェントの本来の関心や目標追求の好みを反映している。本稿では,本モデルと期待効用理論を組み合わせた固有値駆動型(IVRL)と呼ばれる新しいRLモデルを提案する。 VILベースのモデルは、エージェントが様々なニーズを合理的に整理し、より効果的なパフォーマンスを実現するのに役立つことを実証する。
論文参考訳（メタデータ） (2024-11-14T03:28:02Z)
Synthesizing Evolving Symbolic Representations for Autonomous Systems [2.4233709516962785]
本稿では,その経験をスクラッチからPDDL表現に合成し,時間とともに更新できるオープンエンド学習システムを提案する。 a)選択肢を発見する、(b)選択肢を使って環境を探索する、(c)収集した知識を抽象化する、(d)計画。
論文参考訳（メタデータ） (2024-09-18T07:23:26Z)
Position Paper: Agent AI Towards a Holistic Intelligence [53.35971598180146]
エージェントAI - 大きな基盤モデルをエージェントアクションに統合する具体的システム。本稿では,エージェント・ファウンデーション・モデル(エージェント・ファウンデーション・モデル)を提案する。
論文参考訳（メタデータ） (2024-02-28T16:09:56Z)
Intrinsic Motivation in Model-based Reinforcement Learning: A Brief Review [77.34726150561087]
本稿では,エージェントが獲得した世界モデルに基づいて,本質的な動機付けを決定するための既存の手法について考察する。提案した統合フレームワークは,学習を改善するために,世界モデルと本質的なモチベーションを用いてエージェントのアーキテクチャを記述する。
論文参考訳（メタデータ） (2023-01-24T15:13:02Z)
Discrete Factorial Representations as an Abstraction for Goal Conditioned Reinforcement Learning [99.38163119531745]
離散化ボトルネックを適用することにより,目標条件付きRLセットアップの性能が向上することを示す。分布外目標に対する期待した回帰を実験的に証明し、同時に表現的な構造で目標を指定できるようにします。
論文参考訳（メタデータ） (2022-11-01T03:31:43Z)
Deep Reinforcement Learning for Multi-Agent Interaction [14.532965827043254]
自律エージェント研究グループは、自律システム制御のための新しい機械学習アルゴリズムを開発した。本稿では,現在進行中の研究ポートフォリオの概要を概説するとともに,今後の課題について論じる。
論文参考訳（メタデータ） (2022-08-02T21:55:56Z)
Autonomous Open-Ended Learning of Tasks with Non-Stationary Interdependencies [64.0476282000118]
固有のモチベーションは、目標間のトレーニング時間を適切に割り当てるタスクに依存しないシグナルを生成することが証明されている。内在的に動機付けられたオープンエンドラーニングの分野におけるほとんどの研究は、目標が互いに独立しているシナリオに焦点を当てているが、相互依存タスクの自律的な獲得を研究するのはごくわずかである。特に,タスク間の関係に関する情報をアーキテクチャのより高レベルなレベルで組み込むことの重要性を示す。そして、自律的に取得したシーケンスを格納する新しい学習層を追加することで、前者を拡張する新しいシステムであるH-GRAILを紹介する。
論文参考訳（メタデータ） (2022-05-16T10:43:01Z)
Individual and Collective Autonomous Development [7.928003786376716]
我々は,先進的な知識をほとんどあるいは全く持たずに,進化する状況に対処し適応する方法を動的に学ぶ必要があると想定している。本稿では、ICTシステムにおける自律的開発というビジョンを紹介し、その鍵となる概念をフレーミングし、適切なアプリケーションドメインを図示する。
論文参考訳（メタデータ） (2021-09-23T09:11:24Z)
Understanding the origin of information-seeking exploration in probabilistic objectives for control [62.997667081978825]
探索と探索のトレードオフは適応行動の記述の中心である。このトレードオフを解決する1つのアプローチは、エージェントが固有の「探索駆動」を持っていることを装備または提案することであった。汎用的最大化と情報参照行動の組み合わせは, 目的の全く異なる分類の最小化から生じることを示す。
論文参考訳（メタデータ） (2021-03-11T18:42:39Z)
Intrinsically Motivated Goal-Conditioned Reinforcement Learning: a Short Survey [21.311739361361717]
開発アプローチは、学習エージェントは自身の問題を解決するために生成、選択、学習しなければならないと主張する。近年、発達的アプローチと深層強化学習(RL)手法の融合が見られ、発達的機械学習の新しい領域を形成している。本稿では,深層rlと発達的アプローチの交点におけるこれらの手法の類型論,最近のアプローチのサーベイ,今後の展望について述べる。
論文参考訳（メタデータ） (2020-12-17T18:51:40Z)
Learning with AMIGo: Adversarially Motivated Intrinsic Goals [63.680207855344875]
AMIGoは、Adversarially Motivated Intrinsic Goalsを提案するゴール生成教師である。提案手法は, 提案する目標の自然なカリキュラムを生成し, エージェントが究極的には, 手続き的に生成する課題を解くことができることを示す。
論文参考訳（メタデータ） (2020-06-22T10:22:08Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。