Fugu-MT 論文翻訳(概要): Meta-Learning and Meta-Reinforcement Learning - Tracing the Path towards DeepMind's Adaptive Agent

論文の概要: Meta-Learning and Meta-Reinforcement Learning - Tracing the Path towards DeepMind's Adaptive Agent

arxiv url: http://arxiv.org/abs/2602.19837v1
Date: Mon, 23 Feb 2026 13:39:58 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-24 17:42:02.831542
Title: Meta-Learning and Meta-Reinforcement Learning - Tracing the Path towards DeepMind's Adaptive Agent
Title（参考訳）: メタラーニングとメタ強化学習 -DeepMindの適応エージェントへの道のりを辿る
Authors: Björn Hoppmann, Christoph Scholz,
Abstract要約: 人間は、新しいタスクに適応するために事前知識を利用するのに非常に効果的である。この調査は、メタ学習とメタ強化学習の厳格でタスクベースの形式化を提供する。
参考スコア（独自算出の注目度）: 0.3906427348768226
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Humans are highly effective at utilizing prior knowledge to adapt to novel tasks, a capability that standard machine learning models struggle to replicate due to their reliance on task-specific training. Meta-learning overcomes this limitation by allowing models to acquire transferable knowledge from various tasks, enabling rapid adaptation to new challenges with minimal data. This survey provides a rigorous, task-based formalization of meta-learning and meta-reinforcement learning and uses that paradigm to chronicle the landmark algorithms that paved the way for DeepMind's Adaptive Agent, consolidating the essential concepts needed to understand the Adaptive Agent and other generalist approaches.
Abstract（参考訳）: 人間は、タスク固有のトレーニングに依存しているため、標準的な機械学習モデルが複製に苦労する能力である、新しいタスクに適応するための事前知識を活用するのに非常に効果的である。メタラーニングはこの制限を克服し、モデルが様々なタスクから伝達可能な知識を取得できるようにし、最小限のデータで新しい課題に迅速に適応できるようにする。この調査は、メタラーニングとメタ強化学習の厳密でタスクベースの形式化を提供し、このパラダイムを使用して、DeepMindのAdaptive Agentへの道を開いたランドマークアルゴリズムを年代記し、Adaptive Agentや他のジェネラリストアプローチを理解するために必要な基本的な概念を統合する。

関連論文リスト

TLXML: Task-Level Explanation of Meta-Learning via Influence Functions [0.23090185577016445]
本稿では,学習課題の適応と推論に対する感性を測定するメタ学習を説明するための影響関数を提案する。また,ガウス・ニュートン行列を用いたヘッセン方程式の近似はメタラーニング特有の計算障壁を解くことを主張する。
論文参考訳（メタデータ） (2025-01-24T06:31:48Z)
Learning to Learn with Contrastive Meta-Objective [48.27877062976768]
本稿では,メタトレーニングにおけるタスクアイデンティティのさらなる監視として活用することを提案する。提案したConMLは、対照的なメタオブジェクトの評価と最適化を行っている。我々は、ConMLが既存のメタ学習モデルだけでなく、既存のメタ学習モデルとシームレスに統合できることを実証した。
論文参考訳（メタデータ） (2024-10-08T12:22:10Z)
Rethinking Meta-Learning from a Learning Lens [35.98940987691948]
メタラーニングの理論的理解と実践的実践のギャップを埋める方法について考察する。タスク関係を利用してメタ学習を校正するプラグイン・アンド・プレイ方式TRLearnerを提案する。
論文参考訳（メタデータ） (2024-09-13T02:00:16Z)
Efficient Meta Reinforcement Learning for Preference-based Fast Adaptation [17.165083095799712]
本研究では,ループ内強化学習の文脈における少数ショット適応の問題について検討する。そこで我々は,嗜好に基づくフィードバックによる迅速なポリシー適応を実現するメタRLアルゴリズムを開発した。
論文参考訳（メタデータ） (2022-11-20T03:55:09Z)
On the Effectiveness of Fine-tuning Versus Meta-reinforcement Learning [71.55412580325743]
本稿では,新しいタスクを微調整したマルチタスク事前学習がメタテスト時間適応によるメタ事前学習と同等かそれ以上に機能することを示す。マルチタスク事前学習はメタRLよりもシンプルで計算的に安価である傾向があるため、これは将来の研究を奨励している。
論文参考訳（メタデータ） (2022-06-07T13:24:00Z)
Skill-based Meta-Reinforcement Learning [65.31995608339962]
本研究では,長期的スパース・リワードタスクにおけるメタラーニングを実現する手法を提案する。私たちの中核となる考え方は、メタ学習中にオフラインデータセットから抽出された事前経験を活用することです。
論文参考訳（メタデータ） (2022-04-25T17:58:19Z)
Fully Online Meta-Learning Without Task Boundaries [80.09124768759564]
この性質のオンライン問題にメタラーニングを適用する方法について検討する。タスク境界に関する基礎的な真理知識を必要としない完全オンラインメタラーニング(FOML)アルゴリズムを提案する。実験の結果,FOMLは最先端のオンライン学習手法よりも高速に新しいタスクを学習できることがわかった。
論文参考訳（メタデータ） (2022-02-01T07:51:24Z)
Learning an Explicit Hyperparameter Prediction Function Conditioned on Tasks [62.63852372239708]
メタ学習は、観察されたタスクから機械学習の学習方法論を学び、新しいクエリタスクに一般化することを目的としている。我々は、これらの学習手法を、全てのトレーニングタスクで共有される明示的なハイパーパラメータ予測関数の学習として解釈する。このような設定は、メタ学習方法論が多様なクエリタスクに柔軟に適合できることを保証する。
論文参考訳（メタデータ） (2021-07-06T04:05:08Z)
Meta-Learning with Fewer Tasks through Task Interpolation [67.03769747726666]
現在のメタ学習アルゴリズムは多数のメタトレーニングタスクを必要としており、実際のシナリオではアクセスできない可能性がある。タスクグラデーションを用いたメタラーニング(MLTI)により,タスクのペアをランダムにサンプリングし,対応する特徴やラベルを補間することにより,タスクを効果的に生成する。実証的な実験では,提案する汎用MLTIフレームワークが代表的なメタ学習アルゴリズムと互換性があり,他の最先端戦略を一貫して上回っていることがわかった。
論文参考訳（メタデータ） (2021-06-04T20:15:34Z)
Meta-Reinforcement Learning Robust to Distributional Shift via Model Identification and Experience Relabeling [126.69933134648541]
本稿では,テスト時にアウト・オブ・ディストリビューション・タスクに直面した場合に,効率よく外挿できるメタ強化学習アルゴリズムを提案する。我々の手法は単純な洞察に基づいており、動的モデルが非政治データに効率的かつ一貫して適応可能であることを認識している。
論文参考訳（メタデータ） (2020-06-12T13:34:46Z)
Automated Relational Meta-learning [95.02216511235191]
本稿では,クロスタスク関係を自動的に抽出し,メタ知識グラフを構築する自動リレーショナルメタ学習フレームワークを提案する。我々は,2次元玩具の回帰と少数ショット画像分類に関する広範な実験を行い,ARMLが最先端のベースラインよりも優れていることを示す。
論文参考訳（メタデータ） (2020-01-03T07:02:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。