論文の概要: Unsupervised Hierarchical Skill Discovery
- arxiv url: http://arxiv.org/abs/2601.23156v1
- Date: Fri, 30 Jan 2026 16:41:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-02 18:28:15.565723
- Title: Unsupervised Hierarchical Skill Discovery
- Title(参考訳): 教師なし階層的スキル発見
- Authors: Damion Harvey, Geraud Nangue Tasse, Branden Ingram, Benjamin Rosman, Steven James,
- Abstract要約: 強化学習における教師なしスキルセグメンテーションと階層構造発見の問題点を考察する。
そこで本研究では,未学習の軌跡をスキルに分割し,文法に基づく手法を用いて階層構造を導き出す手法を提案する。
我々は、CraftaxやMinecraftの完全な修正されていないバージョンを含む高次元のピクセルベースの環境において、我々のアプローチを評価する。
- 参考スコア(独自算出の注目度): 11.230382111014073
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider the problem of unsupervised skill segmentation and hierarchical structure discovery in reinforcement learning. While recent approaches have sought to segment trajectories into reusable skills or options, most rely on action labels, rewards, or handcrafted annotations, limiting their applicability. We propose a method that segments unlabelled trajectories into skills and induces a hierarchical structure over them using a grammar-based approach. The resulting hierarchy captures both low-level behaviours and their composition into higher-level skills. We evaluate our approach in high-dimensional, pixel-based environments, including Craftax and the full, unmodified version of Minecraft. Using metrics for skill segmentation, reuse, and hierarchy quality, we find that our method consistently produces more structured and semantically meaningful hierarchies than existing baselines. Furthermore, as a proof of concept for utility, we demonstrate that these discovered hierarchies accelerate and stabilise learning on downstream reinforcement learning tasks.
- Abstract(参考訳): 強化学習における教師なしスキルセグメンテーションと階層構造発見の問題点を考察する。
最近のアプローチでは、トラジェクトリを再利用可能なスキルやオプションに分割しようとするが、ほとんどの場合、アクションラベル、報酬、手作りアノテーションに依存し、適用性を制限する。
そこで本研究では,未学習の軌跡をスキルに分割し,文法に基づく手法を用いて階層構造を導き出す手法を提案する。
結果として生じる階層構造は、低レベルの振る舞いとそれらの構成の両方を高いレベルのスキルにキャプチャします。
CraftaxやMinecraftのフルバージョンを含む,高次元のピクセルベースの環境において,我々のアプローチを評価する。
スキルセグメンテーション、再利用、階層品質の指標を用いて、我々の手法は既存のベースラインよりも一貫して構造化され、意味的に意味のある階層を生成する。
さらに、実用性の概念実証として、下流の強化学習タスクにおいて、これらの発見された階層が学習を加速し、安定化することを実証する。
関連論文リスト
- Provable Learning of Random Hierarchy Models and Hierarchical Shallow-to-Deep Chaining [58.69016084278948]
我々は、arXiv:2307.02129によって導入された階層的な文脈自由文法を考察し、深層ネットワークと浅層ネットワークの分離を予想する。
弱い条件下では、深い畳み込みネットワークを効率的に訓練し、この関数クラスを学習できることを証明した。
論文 参考訳(メタデータ) (2026-01-27T16:19:54Z) - A Semantics-Aware Hierarchical Self-Supervised Approach to Classification of Remote Sensing Images [12.282079123411947]
本稿では,階層的特徴と関係を学習するためのセマンティックス・アウェア・ヒエラルキー・コンセンサス(SAHC)手法を提案する。
SAHC法は、階層的な複雑さの異なる3つのベンチマークデータセットで評価される。
実験により,ネットワーク学習の指導における提案手法の有効性と,リモートセンシング画像分類タスクにおける階層的コンセンサスの有効性が示された。
論文 参考訳(メタデータ) (2025-10-06T15:30:39Z) - Learning and Evaluating Hierarchical Feature Representations [3.770103075126785]
我々は、直交部分空間の階層的構成(Hier-COS)という新しい枠組みを提案する。
Hier-COSは、与えられた分類木の構造と整合した設計により、深い特徴埋め込みをベクトル空間にマッピングすることを学ぶ。
Hier-COSはすべてのデータセットにまたがって最先端の階層的パフォーマンスを実現し,同時に1つのケースを除いてトップ1の精度を上回ります。
論文 参考訳(メタデータ) (2025-03-10T20:59:41Z) - Hierarchical Action Recognition: A Contrastive Video-Language Approach with Hierarchical Interactions [19.741453194665276]
階層型音声認識の新しい課題を定式化し,階層型認識に適したビデオ言語学習フレームワークを提案する。
具体的には,階層的カテゴリ間の依存関係を符号化し,認識予測にトップダウン制約を適用した。
階層認識に対するアプローチの有効性を実証し,従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2024-05-28T01:17:22Z) - Reinforcement Learning with Options and State Representation [105.82346211739433]
この論文は、強化学習分野を探求し、改良された手法を構築することを目的としている。
階層的強化学習(Hierarchical Reinforcement Learning)として知られる階層的な方法で学習タスクを分解することで、そのような目標に対処する。
論文 参考訳(メタデータ) (2024-03-16T08:30:55Z) - Creating Multi-Level Skill Hierarchies in Reinforcement Learning [0.0]
エージェントと環境との相互作用がどのように展開されるかのグラフィカルな表現に基づく回答を提案する。
提案手法では,多段階の抽象化で相互作用グラフの構造を明らかにするための中心的な組織原理として,モジュラリティ最大化を用いる。
論文 参考訳(メタデータ) (2023-06-16T17:23:49Z) - Use All The Labels: A Hierarchical Multi-Label Contrastive Learning
Framework [75.79736930414715]
本稿では,すべての利用可能なラベルを活用でき,クラス間の階層的関係を維持できる階層型多言語表現学習フレームワークを提案する。
比較損失に階層的ペナルティを併用し,その階層的制約を強制する。
論文 参考訳(メタデータ) (2022-04-27T21:41:44Z) - Hierarchical Skills for Efficient Exploration [70.62309286348057]
強化学習において、事前訓練された低レベルスキルは、探索を大幅に促進する可能性がある。
下流タスクの以前の知識は、スキルデザインにおける一般性(きめ細かい制御)と特異性(より高速な学習)の適切なバランスをとるために必要である。
教師なしの方法で様々な複雑さのスキルを習得する階層的スキル学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-10-20T22:29:32Z) - Provable Hierarchy-Based Meta-Reinforcement Learning [50.17896588738377]
HRLをメタRL設定で解析し、下流タスクで使用するメタトレーニング中に学習者が潜在階層構造を学習する。
我々は、この自然階層の標本効率の回復を保証し、抽出可能な楽観主義に基づくアルゴリズムとともに「多様性条件」を提供する。
我々の境界は、時間的・状態的・行動的抽象化などのHRL文献に共通する概念を取り入れており、我々の設定と分析が実際にHRLの重要な特徴を捉えていることを示唆している。
論文 参考訳(メタデータ) (2021-10-18T17:56:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。