Fugu-MT 論文翻訳(概要): Creating Multi-Level Skill Hierarchies in Reinforcement Learning

論文の概要: Creating Multi-Level Skill Hierarchies in Reinforcement Learning

arxiv url: http://arxiv.org/abs/2306.09980v1
Date: Fri, 16 Jun 2023 17:23:49 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-19 12:40:47.097537
Title: Creating Multi-Level Skill Hierarchies in Reinforcement Learning
Title（参考訳）: 強化学習におけるマルチレベルスキル階層の構築
Authors: Joshua B. Evans and \"Ozg\"ur \c{S}im\c{s}ek
Abstract要約: 本稿では,エージェントの環境との相互作用のグラフィカルな構造に基づく回答を提案する。我々のアプローチは階層的なグラフ分割を使用して、グラフの構造を様々な時間スケールで公開する。本稿では、強化学習の文脈において、様々な分野において、提案するスキル階層の有用性について説明する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: What is a useful skill hierarchy for an autonomous agent? We propose an answer based on the graphical structure of an agent's interaction with its environment. Our approach uses hierarchical graph partitioning to expose the structure of the graph at varying timescales, producing a skill hierarchy with multiple levels of abstraction. At each level of the hierarchy, skills move the agent between regions of the state space that are well connected within themselves but weakly connected to each other. We illustrate the utility of the proposed skill hierarchy in a wide variety of domains in the context of reinforcement learning.
Abstract（参考訳）: 自律エージェントにとって有用なスキル階層とは何か? 本稿では,エージェントの環境との相互作用のグラフィカルな構造に基づく回答を提案する。このアプローチでは,階層的グラフ分割を使用して,さまざまな時間スケールでグラフの構造を公開し,複数の抽象化レベルを持つスキル階層を生成する。階層のそれぞれのレベルにおいて、スキルはエージェントを、内部で十分に結びついているが互いに弱い結びつきを持つ状態空間の領域間で移動させる。強化学習の文脈において,様々な領域において,提案するスキル階層の有用性について述べる。

関連論文リスト

Uni-Skill: Building Self-Evolving Skill Repository for Generalizable Robotic Manipulation [32.86306309089796]
Uni-Skillはスキル中心のフレームワークで、スキル対応のプランニングをサポートする。既存のスキルが不十分な場合、新しいスキル実装に対するUni-Skillリクエスト。 Skillは、大規模な非構造化ロボットビデオから派生したVerbNetにインスパイアされたリポジトリだ。
論文参考訳（メタデータ） (2026-03-03T05:49:37Z)
Unsupervised Hierarchical Skill Discovery [11.230382111014073]
強化学習における教師なしスキルセグメンテーションと階層構造発見の問題点を考察する。そこで本研究では,未学習の軌跡をスキルに分割し,文法に基づく手法を用いて階層構造を導き出す手法を提案する。我々は、CraftaxやMinecraftの完全な修正されていないバージョンを含む高次元のピクセルベースの環境において、我々のアプローチを評価する。
論文参考訳（メタデータ） (2026-01-30T16:41:13Z)
Continual Hyperbolic Learning of Instances and Classes [41.32412210317651]
インスタンスとクラスを連続的に学習するタスクを同時に導入する。このタスクは、時間とともに複数のレベルの粒度に適応するようにモデルに挑戦する。本稿では,クラスとインスタンスが自然に階層構造を形成することを確かめる。
論文参考訳（メタデータ） (2025-06-12T13:59:57Z)
Reinforcement Learning with Options and State Representation [105.82346211739433]
この論文は、強化学習分野を探求し、改良された手法を構築することを目的としている。階層的強化学習(Hierarchical Reinforcement Learning)として知られる階層的な方法で学習タスクを分解することで、そのような目標に対処する。
論文参考訳（メタデータ） (2024-03-16T08:30:55Z)
SkillDiffuser: Interpretable Hierarchical Planning via Skill Abstractions in Diffusion-Based Task Execution [75.2573501625811]
拡散モデルは、ロボット軌道計画の強力な可能性を示している。高レベルの命令からコヒーレントな軌道を生成することは依然として困難である。エンド・ツー・エンドの階層的計画フレームワークであるSkillDiffuserを提案する。
論文参考訳（メタデータ） (2023-12-18T18:16:52Z)
Progressively Efficient Learning [58.6490456517954]
我々はCEIL(Communication-Efficient Interactive Learning)という新しい学習フレームワークを開発した。 CEILは、学習者と教師がより抽象的な意図を交換することで効率的にコミュニケーションする人間のようなパターンの出現につながる。 CEILで訓練されたエージェントは、新しいタスクを素早く習得し、非階層的で階層的な模倣学習を、絶対的な成功率で最大50%、20%上回った。
論文参考訳（メタデータ） (2023-10-13T07:52:04Z)
Hierarchical Empowerment: Towards Tractable Empowerment-Based Skill Learning [65.41865750258775]
汎用エージェントは、大量のスキルのレパートリーを必要とする。我々は、コンピューティングのエンパワーメントをより魅力的にする新しいフレームワーク、階層エンパワーメントを導入します。一般的なアリナビゲーション領域では、我々の4つのレベルエージェントは、以前の作業よりも2桁大きい表面積をカバーするスキルを学ぶことができる。
論文参考訳（メタデータ） (2023-07-06T02:27:05Z)
Learning Temporally Extended Skills in Continuous Domains as Symbolic Actions for Planning [2.642698101441705]
長期計画と継続的な制御能力の両方を必要とする問題は、既存の強化学習エージェントに重大な課題をもたらす。本稿では,環境の計画状態の象徴的抽象化において,継続的制御のための時間的拡張スキルとフォワードモデルとをリンクする新しい階層型強化学習エージェントを提案する。
論文参考訳（メタデータ） (2022-07-11T17:13:10Z)
Skill Machines: Temporal Logic Skill Composition in Reinforcement Learning [13.049516752695613]
本稿では,エージェントがその環境におけるすべてのハイレベルな目標を達成するのに十分なスキルプリミティブのセットを学習するフレームワークを提案する。エージェントは論理的にも時間的にも柔軟に構成でき、任意の正規言語で時間論理の仕様を確実に達成することができる。これによりエージェントは、複雑な時間論理タスクの仕様から、ほぼ最適な振る舞いをゼロショットにマッピングできる。
論文参考訳（メタデータ） (2022-05-25T07:05:24Z)
Autonomous Open-Ended Learning of Tasks with Non-Stationary Interdependencies [64.0476282000118]
固有のモチベーションは、目標間のトレーニング時間を適切に割り当てるタスクに依存しないシグナルを生成することが証明されている。内在的に動機付けられたオープンエンドラーニングの分野におけるほとんどの研究は、目標が互いに独立しているシナリオに焦点を当てているが、相互依存タスクの自律的な獲得を研究するのはごくわずかである。特に,タスク間の関係に関する情報をアーキテクチャのより高レベルなレベルで組み込むことの重要性を示す。そして、自律的に取得したシーケンスを格納する新しい学習層を追加することで、前者を拡張する新しいシステムであるH-GRAILを紹介する。
論文参考訳（メタデータ） (2022-05-16T10:43:01Z)
Possibility Before Utility: Learning And Using Hierarchical Affordances [21.556661319375255]
強化学習アルゴリズムは複雑な階層的依存構造を持つタスクに苦労する。本稿では、より効果的な学習のために不可能なサブタスクを実践するために、階層的アフォーマンス学習(HAL)という階層的アフォーマンス学習(HAL)を提案する。
論文参考訳（メタデータ） (2022-03-23T19:17:22Z)
Hierarchical Skills for Efficient Exploration [70.62309286348057]
強化学習において、事前訓練された低レベルスキルは、探索を大幅に促進する可能性がある。下流タスクの以前の知識は、スキルデザインにおける一般性(きめ細かい制御)と特異性(より高速な学習)の適切なバランスをとるために必要である。教師なしの方法で様々な複雑さのスキルを習得する階層的スキル学習フレームワークを提案する。
論文参考訳（メタデータ） (2021-10-20T22:29:32Z)
Self-supervised Reinforcement Learning with Independently Controllable Subgoals [20.29444813790076]
自己監督エージェントは、環境の構造を活用することで、自身の目標を設定した。それらのいくつかは、合成多目的環境における基本的な操作スキルを学ぶために応用された。本稿では,環境コンポーネント間の関係を推定し,環境状態の異なる部分を独立に制御する,新たな自己管理エージェントを提案する。
論文参考訳（メタデータ） (2021-09-09T10:21:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。