論文の概要: GACL: Grounded Adaptive Curriculum Learning with Active Task and Performance Monitoring
- arxiv url: http://arxiv.org/abs/2508.02988v1
- Date: Tue, 05 Aug 2025 01:32:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-06 18:18:55.731098
- Title: GACL: Grounded Adaptive Curriculum Learning with Active Task and Performance Monitoring
- Title(参考訳): GACL: アクティブタスクとパフォーマンスモニタリングを備えた接地型適応カリキュラム学習
- Authors: Linji Wang, Zifan Xu, Peter Stone, Xuesu Xiao,
- Abstract要約: グラウンドド・アダプティブ・カリキュラム・ラーニング(英語: Grounded Adaptive Curriculum Learning)は、ロボティクスのカリキュラム学習用に設計されたフレームワークである。
複雑なロボットタスク設計を一貫して扱うタスク表現を提案する。
また,ロボットの現在の能力に適合した適応型カリキュラム生成を可能にする能動的性能追跡機構を提案する。
- 参考スコア(独自算出の注目度): 37.95557495560936
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Curriculum learning has emerged as a promising approach for training complex robotics tasks, yet current applications predominantly rely on manually designed curricula, which demand significant engineering effort and can suffer from subjective and suboptimal human design choices. While automated curriculum learning has shown success in simple domains like grid worlds and games where task distributions can be easily specified, robotics tasks present unique challenges: they require handling complex task spaces while maintaining relevance to target domain distributions that are only partially known through limited samples. To this end, we propose Grounded Adaptive Curriculum Learning, a framework specifically designed for robotics curriculum learning with three key innovations: (1) a task representation that consistently handles complex robot task design, (2) an active performance tracking mechanism that allows adaptive curriculum generation appropriate for the robot's current capabilities, and (3) a grounding approach that maintains target domain relevance through alternating sampling between reference and synthetic tasks. We validate GACL on wheeled navigation in constrained environments and quadruped locomotion in challenging 3D confined spaces, achieving 6.8% and 6.1% higher success rates, respectively, than state-of-the-art methods in each domain.
- Abstract(参考訳): カリキュラム学習は複雑なロボット工学のタスクを訓練するための有望なアプローチとして現れてきたが、現在のアプリケーションは手動で設計したカリキュラムに大きく依存している。
自動カリキュラム学習は、タスクの配布を容易に特定できるグリッドワールドやゲームのような単純なドメインで成功しているが、ロボティクスタスクにはユニークな課題がある。
そこで本研究では,(1)複雑なロボットタスク設計を一貫して扱うタスク表現,(2)ロボットの現在の能力に適合する適応型カリキュラム生成を可能にするアクティブなパフォーマンストラッキング機構,(3)参照タスクと合成タスク間のサンプリングを交互に行うことによって,対象領域の関連性を維持する基盤的アプローチ,という3つの重要な革新とともに,ロボットカリキュラムに特化して設計されたフレームワークであるグラウンドド・アダプティブ・カリキュラム・ラーニングを提案する。
拘束された環境下での車輪付きナビゲーションにおけるGACLと、挑戦的な3次元閉じ込められた空間における四足歩行の検証を行い、各領域における最先端手法よりも、それぞれ6.8%と6.1%高い成功率を達成した。
関連論文リスト
- Geometrically-Aware One-Shot Skill Transfer of Category-Level Objects [18.978751760636563]
本研究では,ロボットが複雑な物体操作のスキルと制約を1人の人間の実演から伝達することのできる,新しいスキル伝達フレームワークを提案する。
提案手法は,オブジェクト中心のインタラクションに着目したデモンストレーションから幾何学的表現を導出することで,スキル獲得とタスク実行の課題に対処する。
本手法の有効性と適応性を広範囲な実験により検証し,追加の訓練を必要とせず,多様な実環境における技術移転とタスク実行を実証した。
論文 参考訳(メタデータ) (2025-03-19T16:10:17Z) - Investigating the Effectiveness of a Socratic Chain-of-Thoughts Reasoning Method for Task Planning in Robotics, A Case Study [0.0]
本研究では,大規模言語モデル (LLM) が実世界の物理行動で複雑な空間的タスクをナビゲートできるかどうかを考察する。
我々は,Webots エンジンに擬似ティアゴロボットを組み込んだ GPT-4(Omni) をオブジェクト探索タスクに適用する。
予備的な結果は、チェーン・オブ・ソート推論と組み合わせることで、ソクラティック法が空間認識を必要とするロボットタスクのコード生成に利用できることを示している。
論文 参考訳(メタデータ) (2025-03-11T08:36:37Z) - EMPOWER: Embodied Multi-role Open-vocabulary Planning with Online Grounding and Execution [2.2369578015657954]
実生活環境におけるロボットのタスクプランニングは重要な課題である。
これらの課題は、目標を達成するためのステップの基底的なシーケンスを特定することの難しさ、高レベルのアクションと低レベルのコマンドの標準化されたマッピングの欠如、ロボットハードウェアの限られたリソースを考えると、計算オーバーヘッドを低く抑えることの3つの問題に起因している。
オープン・ボキャブラリ・オンライン・グラウンドディングのためのフレームワークであるEMPOWERを紹介し,これらの問題に対処するための具体的エージェントの計画について述べる。
論文 参考訳(メタデータ) (2024-08-30T16:15:28Z) - The Foundations of Computational Management: A Systematic Approach to
Task Automation for the Integration of Artificial Intelligence into Existing
Workflows [55.2480439325792]
本稿では,タスク自動化の体系的アプローチである計算管理を紹介する。
この記事では、ワークフロー内でAIを実装するプロセスを開始するための、ステップバイステップの手順を3つ紹介する。
論文 参考訳(メタデータ) (2024-02-07T01:45:14Z) - Towards Robust Continual Learning with Bayesian Adaptive Moment Regularization [51.34904967046097]
継続的な学習は、モデルが以前に学習した情報を忘れてしまう破滅的な忘れ込みの課題を克服しようとする。
本稿では,パラメータ成長の制約を緩和し,破滅的な忘れを減らし,新しい事前手法を提案する。
以上の結果から, BAdamは, 単頭クラスインクリメンタル実験に挑戦する先行手法に対して, 最先端の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2023-09-15T17:10:51Z) - Active Task Randomization: Learning Robust Skills via Unsupervised
Generation of Diverse and Feasible Tasks [37.73239471412444]
我々は、教師なしのトレーニングタスクの生成を通じて、堅牢なスキルを学ぶアプローチであるActive Task Randomization (ATR)を導入する。
ATRは、タスクの多様性と実現可能性のバランスをとることで、堅牢なスキルを学ぶために、初期環境状態と操作目標からなる適切なタスクを選択する。
本研究では,視覚的入力に基づく逐次操作問題の解決のために,タスクプランナが学習スキルを構成することを実証する。
論文 参考訳(メタデータ) (2022-11-11T11:24:55Z) - Autonomous Open-Ended Learning of Tasks with Non-Stationary
Interdependencies [64.0476282000118]
固有のモチベーションは、目標間のトレーニング時間を適切に割り当てるタスクに依存しないシグナルを生成することが証明されている。
内在的に動機付けられたオープンエンドラーニングの分野におけるほとんどの研究は、目標が互いに独立しているシナリオに焦点を当てているが、相互依存タスクの自律的な獲得を研究するのはごくわずかである。
特に,タスク間の関係に関する情報をアーキテクチャのより高レベルなレベルで組み込むことの重要性を示す。
そして、自律的に取得したシーケンスを格納する新しい学習層を追加することで、前者を拡張する新しいシステムであるH-GRAILを紹介する。
論文 参考訳(メタデータ) (2022-05-16T10:43:01Z) - Towards Coordinated Robot Motions: End-to-End Learning of Motion
Policies on Transform Trees [63.31965375413414]
人間による実証から構造化政策を学習し、マルチタスクの課題解決を提案します。
我々の構造化ポリシーは、異なる空間におけるサブタスクポリシーを組み合わせるためのフレームワークであるRMPflowにインスパイアされている。
マルチタスク問題に適したエンドツーエンドの学習目標関数を導き出します。
論文 参考訳(メタデータ) (2020-12-24T22:46:22Z) - Towards Robotic Assembly by Predicting Robust, Precise and Task-oriented
Grasps [17.07993278175686]
本稿では,3つのカスケードネットワークを学習することで,把握,精度,タスク性能を最適化する手法を提案する。
我々は,歯車をペグに挿入し,ブラケットをコーナーにアライメントし,形状をスロットに挿入する3つの一般的な組立作業のシミュレーションにおいて,本手法の評価を行った。
論文 参考訳(メタデータ) (2020-11-04T18:29:01Z) - CausalWorld: A Robotic Manipulation Benchmark for Causal Structure and
Transfer Learning [138.40338621974954]
CausalWorldは、ロボット操作環境における因果構造と伝達学習のベンチマークである。
タスクは、ブロックのセットから3D形状を構築することで構成される。
論文 参考訳(メタデータ) (2020-10-08T23:01:13Z) - Scalable Multi-Task Imitation Learning with Autonomous Improvement [159.9406205002599]
我々は、自律的なデータ収集を通じて継続的に改善できる模倣学習システムを構築している。
我々は、ロボット自身の試行を、実際に試みたタスク以外のタスクのデモとして活用する。
従来の模倣学習のアプローチとは対照的に,本手法は,継続的改善のための疎い監視によるデータ収集を自律的に行うことができる。
論文 参考訳(メタデータ) (2020-02-25T18:56:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。