論文の概要: Reference Grounded Skill Discovery
- arxiv url: http://arxiv.org/abs/2510.06203v1
- Date: Tue, 07 Oct 2025 17:55:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-08 17:57:08.40981
- Title: Reference Grounded Skill Discovery
- Title(参考訳): 基準接地スキル発見
- Authors: Seungeun Rho, Aaron Trinh, Danfei Xu, Sehoon Ha,
- Abstract要約: 本稿では,RGSD(Reference-Grounded Skill Discovery)を提案する。
RGSDは359-Dの観察と69-Dのアクションを備えたシミュレーションされたSMPLヒューマノイドで、歩行、ランニング、パンチング、サイドステップなどの構造化されたスキルを学習する。
この結果から,軽量な参照誘導接地は,高DoFシステムにおける意味豊かな構造的スキルの発見に有効な方法であることが示唆された。
- 参考スコア(独自算出の注目度): 13.23914921356941
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scaling unsupervised skill discovery algorithms to high-DoF agents remains challenging. As dimensionality increases, the exploration space grows exponentially, while the manifold of meaningful skills remains limited. Therefore, semantic meaningfulness becomes essential to effectively guide exploration in high-dimensional spaces. In this work, we present Reference-Grounded Skill Discovery (RGSD), a novel algorithm that grounds skill discovery in a semantically meaningful latent space using reference data. RGSD first performs contrastive pretraining to embed motions on a unit hypersphere, clustering each reference trajectory into a distinct direction. This grounding enables skill discovery to simultaneously involve both imitation of reference behaviors and the discovery of semantically related diverse behaviors. On a simulated SMPL humanoid with 359-D observations and 69-D actions, RGSD learns structured skills including walking, running, punching, and side stepping, and also discovers related novel behaviors. In downstream control tasks, RGSD outperforms imitation-based skill acquisition baselines. Our results suggest that lightweight reference-guided grounding offers a practical path to discovering semantically rich and structured skills in high-DoF systems.
- Abstract(参考訳): 教師なしのスキル発見アルゴリズムをハイDoFエージェントに拡張することは依然として難しい。
次元が増加するにつれて、探索空間は指数関数的に成長し、一方で意味のあるスキルの多様体は限定的である。
したがって、高次元空間における探索を効果的に導くために意味論的意義が不可欠となる。
本研究では,参照データを用いて,意味的に意味のある潜在空間におけるスキル発見を基礎とする新しいアルゴリズムであるReference-Grounded Skill Discovery (RGSD)を提案する。
RGSDはまず、単位超球面に運動を埋め込むための対照的な事前訓練を行い、それぞれの基準軌道を異なる方向にクラスタリングする。
この基礎づけにより、スキル発見は参照行動の模倣と意味的に関連する多様な行動の発見の両方を同時に行うことができる。
RGSDは359-Dの観察と69-Dのアクションを備えたシミュレーションされたSMPLヒューマノイド上で、歩行、ランニング、パンチング、サイドステップなどの構造化されたスキルを学び、関連する新しい行動を発見する。
下流制御タスクでは、RGSDは模倣ベースのスキル獲得ベースラインを上回っている。
この結果から,軽量な基準誘導接地は,高DoFシステムにおける意味豊かな構造的スキルの発見に有効な方法であることが示唆された。
関連論文リスト
- From reactive to cognitive: brain-inspired spatial intelligence for embodied agents [50.99942960312313]
Brain-inspired Space Cognition for Navigation (BSC-Nav) は、エンボディエージェントにおける構造化空間メモリの構築と活用のための統合されたフレームワークである。
BSC-Navは、エゴセントリックな軌跡と文脈的手がかりからアロセントリックな認知マップを構築し、意味的目標に沿った空間的知識を動的に回収する。
論文 参考訳(メタデータ) (2025-08-24T03:20:48Z) - Unsupervised Skill Discovery through Skill Regions Differentiation [6.088346462603191]
教師なし強化学習(英語: Unsupervised Reinforcement Learning, RL)は、下流タスクの学習を加速できる多様な行動を発見することを目的としている。
本稿では,他のスキルの探索領域からの1つのスキルの状態密度のずれを最大化する新しいスキル発見目標を提案する。
また、学習したオートエンコーダに基づいて、コンパクトな潜在空間におけるカウントベースの探索に類似した本質的な報酬を定式化する。
論文 参考訳(メタデータ) (2025-06-17T11:30:04Z) - Imagine, Verify, Execute: Memory-guided Agentic Exploration with Vision-Language Models [81.08295968057453]
本稿では,人間の好奇心に触発されたエージェント探索フレームワークIVEを紹介する。
シミュレーションおよび実世界のテーブルトップ環境におけるIVEの評価を行った。
論文 参考訳(メタデータ) (2025-05-12T17:59:11Z) - Embodied-RAG: General Non-parametric Embodied Memory for Retrieval and Generation [69.01029651113386]
Embodied-RAGは、非パラメトリックメモリシステムによるエンボディエージェントのモデルを強化するフレームワークである。
コアとなるEmbodied-RAGのメモリはセマンティックフォレストとして構成され、言語記述を様々なレベルで詳細に保存する。
Embodied-RAGがRAGをロボット領域に効果的にブリッジし、250以上の説明とナビゲーションクエリをうまく処理できることを実証する。
論文 参考訳(メタデータ) (2024-09-26T21:44:11Z) - CODEX: A Cluster-Based Method for Explainable Reinforcement Learning [0.0]
本稿では,状態-作用空間におけるRLエージェントの挙動を効果的に要約できる意味的クラスタリングを取り入れた手法を提案する。
MiniGridとStarCraft IIのゲーム環境での実験では、セマンティッククラスタは時間的およびエンティティ情報を保持する。
論文 参考訳(メタデータ) (2023-12-07T11:04:37Z) - Learning Representative Trajectories of Dynamical Systems via
Domain-Adaptive Imitation [0.0]
ドメイン適応軌道模倣のための深層強化学習エージェントDATIを提案する。
実験の結果,DATIは模擬学習と最適制御のベースライン手法よりも優れていることがわかった。
実世界のシナリオへの一般化は、海上交通における異常な動きパターンの発見を通じて示される。
論文 参考訳(メタデータ) (2023-04-19T15:53:48Z) - Learning Task Agnostic Skills with Data-driven Guidance [0.0]
本稿では,専門家が訪問する状態のサブセットに向けて,スキル発見を導くための枠組みを提案する。
本手法を各種強化学習タスクに適用し,このような予測がより有用な行動をもたらすことを示す。
論文 参考訳(メタデータ) (2021-08-04T06:53:10Z) - Teaching Agents how to Map: Spatial Reasoning for Multi-Object
Navigation [11.868792440783055]
与えられた位置におけるエージェントと到達目標の間の空間的関係を定量化する指標を推定する学習は、多目的ナビゲーション設定において高い正の影響を及ぼすことを示す。
提案された補助的損失で訓練された文献の学習ベースのエージェントは、マルチオブジェクトナビゲーションチャレンジへの勝利であった。
論文 参考訳(メタデータ) (2021-07-13T12:01:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。