論文の概要: Beyond Mimicry: Toward Lifelong Adaptability in Imitation Learning
- arxiv url: http://arxiv.org/abs/2602.19930v1
- Date: Mon, 23 Feb 2026 15:06:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.870615
- Title: Beyond Mimicry: Toward Lifelong Adaptability in Imitation Learning
- Title(参考訳): Beyond Mimicry: 模倣学習における生涯適応性を目指して
- Authors: Nathan Gavenski, Felipe Meneguzzi, Odinaldo Rodrigues,
- Abstract要約: 完全再生から構成適応性へ再定義する研究課題を提案する。
このような適応性は、振る舞いプリミティブを一度学習し、再訓練することなく、新しいコンテキストを通じてそれらを再結合する。
- 参考スコア(独自算出の注目度): 6.293245582268862
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Imitation learning stands at a crossroads: despite decades of progress, current imitation learning agents remain sophisticated memorisation machines, excelling at replay but failing when contexts shift or goals evolve. This paper argues that this failure is not technical but foundational: imitation learning has been optimised for the wrong objective. We propose a research agenda that redefines success from perfect replay to compositional adaptability. Such adaptability hinges on learning behavioural primitives once and recombining them through novel contexts without retraining. We establish metrics for compositional generalisation, propose hybrid architectures, and outline interdisciplinary research directions drawing on cognitive science and cultural evolution. Agents that embed adaptability at the core of imitation learning thus have an essential capability for operating in an open-ended world.
- Abstract(参考訳): 何十年も進歩してきたにもかかわらず、現在の模倣学習エージェントは洗練された記憶機械のままであり、リプレイに長けているが、状況の変化や目標が進化しても失敗する。
本稿では、この失敗は技術的ではなく基礎的なものであり、模倣学習は間違った目的のために最適化されていると論じる。
完全再生から構成適応性へ再定義する研究課題を提案する。
このような適応性は、振る舞いプリミティブを一度学習し、再訓練することなく、新しいコンテキストを通じてそれらを再結合する。
我々は、構成一般化のためのメトリクスを確立し、ハイブリッドアーキテクチャを提案し、認知科学と文化進化に焦点をあてた学際研究の方向性を概説する。
したがって、模倣学習のコアに適応性を組み込むエージェントは、オープンエンドな世界での運用に不可欠な能力を持つ。
関連論文リスト
- High-Order Deep Meta-Learning with Category-Theoretic Interpretation [0.0]
ニューラルネットワーク(NN)がタスクの階層をまたいだ構築、解決、一般化を可能にする新しい階層型ディープラーニングフレームワークを導入する。
このアプローチの中心は、Emphvirtualタスクを生成する生成メカニズムである。
これにより、フレームワークは独自の情報的タスクグラウンドデータセットを生成することができる。
我々は、このアーキテクチャが、自律的に新しい命令型タスクを生成できる次世代NNの基盤になるかもしれないと推測する。
論文 参考訳(メタデータ) (2025-07-03T14:01:14Z) - Fodor and Pylyshyn's Legacy -- Still No Human-like Systematic Compositionality in Neural Networks [22.014375474803813]
現代のニューラルなメタラーニングシステムは、メタラーニング設定の非常に狭く制限された定義の下では、そのようなタスクしか実行できない、と我々は主張する。
我々は、フォーダーとピリシンの遺産は存続し、現在まで、ニューラルネットワークで学習された人間のような体系的な構成性は存在しないと主張している。
論文 参考訳(メタデータ) (2025-06-02T16:02:53Z) - Normalization and effective learning rates in reinforcement learning [52.59508428613934]
正規化層は近年,深層強化学習と連続学習文学においてルネッサンスを経験している。
正規化は、ネットワークパラメータのノルムにおける成長と効果的な学習速度における崩壊の間の等価性という、微妙だが重要な副作用をもたらすことを示す。
そこで本研究では,正規化・プロジェクトと呼ぶ単純な再パラメータ化により,学習率を明示的にする手法を提案する。
論文 参考訳(メタデータ) (2024-07-01T20:58:01Z) - Incorporating Neuro-Inspired Adaptability for Continual Learning in
Artificial Intelligence [59.11038175596807]
継続的な学習は、現実世界に強い適応性を持つ人工知能を強化することを目的としている。
既存の進歩は主に、破滅的な忘れを克服するために記憶安定性を維持することに焦点を当てている。
本稿では,学習の可塑性を改善するため,パラメータ分布の古い記憶を適切に減衰させる汎用的手法を提案する。
論文 参考訳(メタデータ) (2023-08-29T02:43:58Z) - Understanding Hindsight Goal Relabeling Requires Rethinking Divergence
Minimization [10.854471763126117]
マルチゴール強化学習(RL)の基礎技術として,隠れたゴールレバーベリングが注目されている。
そこで本研究では,このような関係を説明する目標達成のための統一的な目標を策定する。
近年のゴール条件付き行動クローニングの進歩にもかかわらず、マルチゴールQ-ラーニングは依然としてBCライクな手法より優れていることが判明した。
論文 参考訳(メタデータ) (2022-09-26T22:00:27Z) - Importance Weighted Policy Learning and Adaptation [89.46467771037054]
政治外学習の最近の進歩の上に構築された,概念的にシンプルで,汎用的で,モジュール的な補完的アプローチについて検討する。
このフレームワークは確率論的推論文学のアイデアにインスパイアされ、堅牢な非政治学習と事前の行動を組み合わせる。
提案手法は,メタ強化学習ベースラインと比較して,ホールドアウトタスクにおける競合適応性能を実現し,複雑なスパース・リワードシナリオにスケールすることができる。
論文 参考訳(メタデータ) (2020-09-10T14:16:58Z) - Bridging the Imitation Gap by Adaptive Insubordination [88.35564081175642]
教官が特権情報にアクセスして意思決定を行う場合、この情報は模倣学習中に疎外されることを示す。
本稿では,このギャップに対処するため,適応的不規則化(ADVISOR)を提案する。
ADVISORは、トレーニング中の模倣と報酬に基づく強化学習損失を動的に重み付け、模倣と探索をオンザフライで切り替えることを可能にする。
論文 参考訳(メタデータ) (2020-07-23T17:59:57Z) - Automated Relational Meta-learning [95.02216511235191]
本稿では,クロスタスク関係を自動的に抽出し,メタ知識グラフを構築する自動リレーショナルメタ学習フレームワークを提案する。
我々は,2次元玩具の回帰と少数ショット画像分類に関する広範な実験を行い,ARMLが最先端のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-01-03T07:02:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。