論文の概要: Language Guided Skill Discovery
- arxiv url: http://arxiv.org/abs/2406.06615v1
- Date: Fri, 7 Jun 2024 04:25:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-12 21:04:26.886953
- Title: Language Guided Skill Discovery
- Title(参考訳): 言語ガイドによるスキル発見
- Authors: Seungeun Rho, Laura Smith, Tianyu Li, Sergey Levine, Xue Bin Peng, Sehoon Ha,
- Abstract要約: 言語ガイドスキル発見(LGSD)を導入し,スキル間の意味的多様性を最大化する。
LGSDはユーザープロンプトを入力として取り、セマンティックなスキルのセットを出力する。
本研究は,LGSDにより,単にプロンプトを変更するだけで,手足のロボットが平面上の異なるユーザ意図のエリアを訪問できることを実証する。
- 参考スコア(独自算出の注目度): 56.84356022198222
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Skill discovery methods enable agents to learn diverse emergent behaviors without explicit rewards. To make learned skills useful for unknown downstream tasks, obtaining a semantically diverse repertoire of skills is essential. While some approaches introduce a discriminator to distinguish skills and others aim to increase state coverage, no existing work directly addresses the "semantic diversity" of skills. We hypothesize that leveraging the semantic knowledge of large language models (LLMs) can lead us to improve semantic diversity of resulting behaviors. In this sense, we introduce Language Guided Skill Discovery (LGSD), a skill discovery framework that aims to directly maximize the semantic diversity between skills. LGSD takes user prompts as input and outputs a set of semantically distinctive skills. The prompts serve as a means to constrain the search space into a semantically desired subspace, and the generated LLM outputs guide the agent to visit semantically diverse states within the subspace. We demonstrate that LGSD enables legged robots to visit different user-intended areas on a plane by simply changing the prompt. Furthermore, we show that language guidance aids in discovering more diverse skills compared to five existing skill discovery methods in robot-arm manipulation environments. Lastly, LGSD provides a simple way of utilizing learned skills via natural language.
- Abstract(参考訳): スキル発見手法により、エージェントは明確な報酬なしに多様な創発的行動を学ぶことができる。
未知の下流作業に役立てるためには、意味的に多様なスキルのレパートリーを得ることが不可欠である。
一部のアプローチでは、スキルを区別する差別装置を導入し、他のアプローチでは、国家のカバレッジを高めることを目的としているが、既存の作業では、スキルの「セマンティックな多様性」に直接対処していない。
大規模言語モデル(LLM)のセマンティックな知識を活用することで、結果の振る舞いのセマンティックな多様性を改善することができると仮定する。
この意味では、スキル間のセマンティックな多様性を直接最大化することを目的とした、スキル発見フレームワークであるLanguage Guided Skill Discovery (LGSD)を紹介する。
LGSDはユーザープロンプトを入力として取り、セマンティックなスキルのセットを出力する。
プロンプトは、サーチスペースを意味的に望ましいサブスペースに制約する手段として機能し、生成されたLCM出力は、サブスペース内の意味的に多様な状態にアクセスするようにエージェントを誘導する。
本研究は,LGSDにより,単にプロンプトを変更するだけで,手足のロボットが平面上の異なるユーザ意図のエリアを訪問できることを実証する。
さらに,ロボットアーム操作環境において,既存の5つのスキル発見手法と比較して,言語指導がより多様なスキルを発見するのに役立つことを示す。
最後に、LGSDは学習したスキルを自然言語で簡単に活用する方法を提供する。
関連論文リスト
- Exploration by Learning Diverse Skills through Successor State Measures [5.062282108230929]
状態空間を均一にカバーする多様なスキルのセットを構築することを目的としている。
我々は,各スキルに規定された政策によって到達した国家の分布を考察し,後継国家対策を活用する。
この新たな形式化により,より堅牢で効率的な探査が可能となった。
論文 参考訳(メタデータ) (2024-06-14T15:36:15Z) - Interpretable Robotic Manipulation from Language [11.207620790833271]
本稿では,操作タスクに特化して設計された,Ex-PERACTという説明可能な行動クローニングエージェントを紹介する。
トップレベルでは、モデルは個別のスキルコードを学ぶことを任務とし、下位レベルでは、ポリシーネットワークは問題をボクセル化されたグリッドに変換し、離散化されたアクションをボクセルグリッドにマップする。
提案手法は,RLBenchベンチマークを用いた8つの操作課題にまたがって評価し,Ex-PERACTが競合する政策性能を達成するだけでなく,複雑な環境下でのヒューマンインストラクションとマシン実行のギャップを効果的に橋渡しすることを示した。
論文 参考訳(メタデータ) (2024-05-27T11:02:21Z) - Agentic Skill Discovery [19.5703917813767]
言語条件付きロボット技術により、大規模言語モデルの高レベル推論を低レベルロボット制御に適用することが可能となる。
残る課題は、さまざまな基本的なスキルを取得することです。
既存のアプローチでは、複雑なタスクをトップダウン方式でアトミックなロボットアクションに手動で分解するか、ボトムアップ方式で可能な限り多くの組み合わせをブートストラップすることで、幅広いタスクの可能性をカバーする。
ゼロスキルから始めて、ASDスキルライブラリが出現し、より有意義で信頼性の高いスキルに拡張されることを示す。
論文 参考訳(メタデータ) (2024-05-23T19:44:03Z) - Rethinking Mutual Information for Language Conditioned Skill Discovery
on Imitation Learning [36.624923972563415]
我々はLanguage Conditioned Skill Discovery (LCSD)として知られるエンドツーエンドの模倣学習手法を提案する。
ベクトル量子化を利用して離散潜在スキルを学習し、軌跡のスキルシーケンスを活用して高レベルの意味的命令を再構築する。
提案手法は,未確認タスクに対する一般化能力の向上,スキル解釈性の向上,タスク完了の成功率の向上などを示す。
論文 参考訳(メタデータ) (2024-02-27T13:53:52Z) - Choreographer: Learning and Adapting Skills in Imagination [60.09911483010824]
我々は、その世界モデルを利用して想像力のスキルを学び、適応するモデルベースのエージェントであるChoreographerを紹介する。
提案手法は探索とスキル学習のプロセスを切り離し,モデルの潜在状態空間におけるスキルの発見を可能にする。
Choreographerはオフラインデータからスキルを学ぶことができ、探索ポリシーと同時にデータを集めることができる。
論文 参考訳(メタデータ) (2022-11-23T23:31:14Z) - Multilingual Word Sense Disambiguation with Unified Sense Representation [55.3061179361177]
本稿では,知識と教師付き多言語単語センス曖昧化(MWSD)システムを提案する。
我々は複数の言語に統一されたセンス表現を構築し、リッチソース言語から貧しい言語へアノテーションを転送することでMWSDのアノテーション不足問題に対処する。
SemEval-13およびSemEval-15データセットの評価により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2022-10-14T01:24:03Z) - LISA: Learning Interpretable Skill Abstractions from Language [85.20587800593293]
言語条件による実演から多種多様な解釈可能なスキルを学習できる階層型模倣学習フレームワークを提案する。
本手法は, 逐次的意思決定問題において, 言語に対するより自然な条件付け方法を示す。
論文 参考訳(メタデータ) (2022-02-28T19:43:24Z) - Lipschitz-constrained Unsupervised Skill Discovery [91.51219447057817]
LSD(Lipschitz-Constrained Skill Discovery)は、エージェントがより多様性があり、ダイナミックで、より遠縁なスキルを発見することを奨励する。
LSDは7つの下流タスクにおいて、スキルの多様性、状態空間のカバレッジ、パフォーマンスという点で、従来のアプローチよりも優れています。
論文 参考訳(メタデータ) (2022-02-02T08:29:04Z) - Discovering Generalizable Skills via Automated Generation of Diverse
Tasks [82.16392072211337]
本稿では,多種多様なタスクの自動生成による一般化可能なスキルの発見手法を提案する。
教師なしスキル発見の先行研究とは対照的に,本手法では各スキルをトレーニング可能なタスクジェネレータが生成するユニークなタスクとペアリングする。
生成したタスクにおけるロボットの動作に定義されたタスク判別器を共同で訓練し、多様性目標の低いエビデンスを推定する。
学習スキルは階層的な強化学習アルゴリズムで構成され、目に見えない目標タスクを解決する。
論文 参考訳(メタデータ) (2021-06-26T03:41:51Z) - Relative Variational Intrinsic Control [11.328970848714919]
Relative Variational Intrinsic Control(RVIC)は、エージェントが環境との関係をどのように変えるかで区別できる学習スキルを奨励します。
本稿では,階層的強化学習において,既存の手法によるスキルよりもRVICのスキルが有用であることを示す。
論文 参考訳(メタデータ) (2020-12-14T18:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。