論文の概要: Boosting Reinforcement Learning in 3D Visuospatial Tasks Through Human-Informed Curriculum Design
- arxiv url: http://arxiv.org/abs/2511.17595v1
- Date: Mon, 17 Nov 2025 18:28:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-25 18:34:24.272436
- Title: Boosting Reinforcement Learning in 3D Visuospatial Tasks Through Human-Informed Curriculum Design
- Title(参考訳): ヒューマンインフォームド・カリキュラムデザインによる3次元空間課題における強化学習の促進
- Authors: Markus D. Solbach, John K. Tsotsos,
- Abstract要約: 本研究は、知的行動の実証におけるRLの可能性と、より複雑で構造化されていない問題領域への対処の進展について考察する。
本稿では,現代のRLフレームワークが,一見単純な3次元同一差分空間課題に対処する能力について検討する。
PPO、行動クローニング、模倣学習など最先端の手法の初期応用は、最適な戦略を直接学習する上での課題を明らかにしたが、カリキュラム学習の成功する実装は、有望な道のりを提供する。
- 参考スコア(独自算出の注目度): 1.9766522384767218
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reinforcement Learning is a mature technology, often suggested as a potential route towards Artificial General Intelligence, with the ambitious goal of replicating the wide range of abilities found in natural and artificial intelligence, including the complexities of human cognition. While RL had shown successes in relatively constrained environments, such as the classic Atari games and specific continuous control problems, recent years have seen efforts to expand its applicability. This work investigates the potential of RL in demonstrating intelligent behaviour and its progress in addressing more complex and less structured problem domains. We present an investigation into the capacity of modern RL frameworks in addressing a seemingly straightforward 3D Same-Different visuospatial task. While initial applications of state-of-the-art methods, including PPO, behavioural cloning and imitation learning, revealed challenges in directly learning optimal strategies, the successful implementation of curriculum learning offers a promising avenue. Effective learning was achieved by strategically designing the lesson plan based on the findings of a real-world human experiment.
- Abstract(参考訳): 強化学習(Reinforcement Learning)は成熟した技術であり、人間の認知の複雑さを含む、自然および人工知能で見られる幅広い能力の複製を目標とする、人工知能への潜在的ルートとしてしばしば提案される。
RLは、古典的なアタリゲームや特定の連続制御問題など、比較的制約のある環境で成功を収めてきたが、近年は適用性の拡大に努めている。
本研究は、知的行動の実証におけるRLの可能性と、より複雑で構造化されていない問題領域への対処の進展について考察する。
本稿では,現代のRLフレームワークが,一見単純な3次元同一差分空間課題に対処する能力について検討する。
PPO,行動クローニング,模倣学習といった最先端の手法の初期応用は,最適な戦略を直接学習する上での課題を明らかにしたが,カリキュラム学習の成功する実装は有望な道のりを提供する。
実世界の人間実験の結果に基づいて,戦略的に授業計画を立てることにより,効果的な学習が達成された。
関連論文リスト
- Curriculum-Based Multi-Tier Semantic Exploration via Deep Reinforcement Learning [1.8374319565577155]
本稿では,資源効率の良い意味探索を目的とした新しいDeep Reinforcement Learningアーキテクチャを提案する。
重要な方法論的貢献は、層状報酬関数によるビジョンランゲージモデル(VLM)の共通センスの統合である。
本研究では,本エージェントがオブジェクト発見率を大幅に向上し,セマンティックにリッチな領域へ効果的にナビゲートする学習能力を開発したことを示す。
論文 参考訳(メタデータ) (2025-09-11T11:10:08Z) - Autonomous Learning From Success and Failure: Goal-Conditioned Supervised Learning with Negative Feedback [2.36462256498849]
Goal-Conditioned Supervised Learningは、自律システムのための自己アニメーション学習を可能にする、潜在的なソリューションとして登場した。
本稿では,GCSLフレームワークに対照的な学習原則を統合し,成功と失敗の両方から学ぶ新しいモデルを提案する。
論文 参考訳(メタデータ) (2025-09-03T10:50:48Z) - Parental Guidance: Efficient Lifelong Learning through Evolutionary Distillation [1.124958340749622]
本研究では, 自然種再現, 多様性のバランス, 特殊化といった, 再生モジュールを含むフレームワークを提案する。
RL、模倣学習(IL)、進化的エージェント・テランのカリキュラムを統合することで、複雑なタスクを通じてエージェントを継続的に進化させる。
最初の実験では,この手法が探索効率を向上し,オープンエンド学習を支援することを示した。
論文 参考訳(メタデータ) (2025-03-24T10:40:03Z) - Empowering Large Language Model Agents through Action Learning [85.39581419680755]
大規模言語モデル(LLM)エージェントは最近ますます関心を集めているが、試行錯誤から学ぶ能力は限られている。
我々は、経験から新しい行動を学ぶ能力は、LLMエージェントの学習の進歩に欠かせないものであると論じる。
我々はPython関数の形式でアクションを作成し改善するための反復学習戦略を備えたフレームワークLearningActを紹介した。
論文 参考訳(メタデータ) (2024-02-24T13:13:04Z) - Continual Visual Reinforcement Learning with A Life-Long World Model [55.05017177980985]
視覚力学モデリングのための新しい連続学習手法を提案する。
まず,タスク固有の潜在ダイナミクスを学習する長寿命世界モデルを紹介する。
そして,探索・保守的行動学習手法を用いて,過去の課題に対する価値推定問題に対処する。
論文 参考訳(メタデータ) (2023-03-12T05:08:03Z) - Human-Timescale Adaptation in an Open-Ended Task Space [56.55530165036327]
大規模にRLエージェントを訓練することで、オープンエンドの新規な3D問題に人間と同じくらい早く適応できる一般的なコンテキスト内学習アルゴリズムが実現可能であることを示す。
我々の研究は、より大規模で適応的なRLエージェントの基礎を築いた。
論文 参考訳(メタデータ) (2023-01-18T15:39:21Z) - Autonomous Reinforcement Learning: Formalism and Benchmarking [106.25788536376007]
人間や動物が行うような現実世界の具体的学習は、連続的で非エポゾディックな世界にある。
RLの一般的なベンチマークタスクはエピソジックであり、試行錯誤によってエージェントに複数の試行を行う環境がリセットされる。
この相違は、擬似環境向けに開発されたRLアルゴリズムを現実世界のプラットフォーム上で実行しようとする場合、大きな課題となる。
論文 参考訳(メタデータ) (2021-12-17T16:28:06Z) - Procedure Planning in Instructional Videosvia Contextual Modeling and
Model-based Policy Learning [114.1830997893756]
本研究は,実生活ビデオにおける目標指向アクションを計画するモデルを学習することに焦点を当てる。
本研究では,ベイズ推論とモデルに基づく模倣学習を通して,人間の行動のモデル化を行う新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-10-05T01:06:53Z) - Intrinsically Motivated Goal-Conditioned Reinforcement Learning: a Short
Survey [21.311739361361717]
開発アプローチは、学習エージェントは自身の問題を解決するために生成、選択、学習しなければならないと主張する。
近年、発達的アプローチと深層強化学習(RL)手法の融合が見られ、発達的機械学習の新しい領域を形成している。
本稿では,深層rlと発達的アプローチの交点におけるこれらの手法の類型論,最近のアプローチのサーベイ,今後の展望について述べる。
論文 参考訳(メタデータ) (2020-12-17T18:51:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。