論文の概要: Latent Properties of Lifelong Learning Systems
- arxiv url: http://arxiv.org/abs/2207.14378v1
- Date: Thu, 28 Jul 2022 20:58:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-01 12:19:29.184803
- Title: Latent Properties of Lifelong Learning Systems
- Title(参考訳): 生涯学習システムの潜時特性
- Authors: Corban Rivera, Chace Ashcraft, Alexander New, James Schmidt, Gautam
Vallabha
- Abstract要約: 本稿では,生涯学習アルゴリズムの潜伏特性を推定するために,アルゴリズムに依存しないサロゲート・モデリング手法を提案する。
合成データを用いた実験により,これらの特性を推定するためのアプローチを検証する。
- 参考スコア(独自算出の注目度): 59.50307752165016
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Creating artificial intelligence (AI) systems capable of demonstrating
lifelong learning is a fundamental challenge, and many approaches and metrics
have been proposed to analyze algorithmic properties. However, for existing
lifelong learning metrics, algorithmic contributions are confounded by task and
scenario structure. To mitigate this issue, we introduce an algorithm-agnostic
explainable surrogate-modeling approach to estimate latent properties of
lifelong learning algorithms. We validate the approach for estimating these
properties via experiments on synthetic data. To validate the structure of the
surrogate model, we analyze real performance data from a collection of popular
lifelong learning approaches and baselines adapted for lifelong classification
and lifelong reinforcement learning.
- Abstract(参考訳): 生涯学習を実証できる人工知能(AI)システムを作成することは根本的な課題であり、アルゴリズム特性を分析するために多くのアプローチやメトリクスが提案されている。
しかし、既存の生涯学習メトリクスでは、アルゴリズムによる貢献はタスクとシナリオ構造によって決定される。
この問題を軽減するために,生涯学習アルゴリズムの潜在特性を推定するアルゴリズム非依存なサロゲートモデリング手法を提案する。
合成データを用いた実験により,これらの特性を推定する手法を検証する。
サーロゲートモデルの構造を検証するために,生涯学習と生涯強化学習に適応した一般的な生涯学習手法とベースラインの集合から,実性能データを分析する。
関連論文リスト
- Representation Learning with Multi-Step Inverse Kinematics: An Efficient
and Optimal Approach to Rich-Observation RL [106.82295532402335]
既存の強化学習アルゴリズムは、計算的難易度、強い統計的仮定、最適なサンプルの複雑さに悩まされている。
所望の精度レベルに対して、レート最適サンプル複雑性を実現するための、最初の計算効率の良いアルゴリズムを提供する。
我々のアルゴリズムMusIKは、多段階の逆運動学に基づく表現学習と体系的な探索を組み合わせる。
論文 参考訳(メタデータ) (2023-04-12T14:51:47Z) - Latent Variable Representation for Reinforcement Learning [131.03944557979725]
モデルに基づく強化学習のサンプル効率を改善するために、潜在変数モデルが学習、計画、探索をいかに促進するかは理論上、実証上、不明である。
状態-作用値関数に対する潜在変数モデルの表現ビューを提供する。これは、抽出可能な変分学習アルゴリズムと楽観主義/悲観主義の原理の効果的な実装の両方を可能にする。
特に,潜伏変数モデルのカーネル埋め込みを組み込んだUPB探索を用いた計算効率の良い計画アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-17T00:26:31Z) - Deep Active Learning with Noise Stability [47.956819755671944]
ラベルのないデータの不確実性推定は、アクティブな学習に不可欠である。
単一学習型マルチ推論方式で、ノイズ安定性を利用してデータの不確実性を推定する新しいアルゴリズムを提案する。
本手法は,様々なタスクにおいて,最先端のアクティブラーニングベースラインを上回っている。
論文 参考訳(メタデータ) (2022-05-26T13:21:01Z) - What Makes Good Contrastive Learning on Small-Scale Wearable-based
Tasks? [59.51457877578138]
本研究では,ウェアラブル型行動認識タスクにおけるコントラスト学習について検討する。
本稿では,PyTorchライブラリのtextttCL-HAR について述べる。
論文 参考訳(メタデータ) (2022-02-12T06:10:15Z) - Measuring disentangled generative spatio-temporal representation [9.264758623908813]
我々は2つの最先端の非絡み合い表現学習手法を採用し、これらを3つの大規模公共時間データセットに適用する。
学習した表現の変数を記述するために,本手法が現実世界のセマンティクスの発見に有効であることが判明した。
論文 参考訳(メタデータ) (2022-02-10T03:57:06Z) - Lifelong Learning from Event-based Data [22.65311698505554]
イベントカメラが生成したデータから学習する方法を検討する。
特徴抽出と連続学習の両方からなるモデルを提案する。
論文 参考訳(メタデータ) (2021-11-11T17:59:41Z) - Goal Agnostic Planning using Maximum Likelihood Paths in Hypergraph
World Models [1.370633147306388]
本稿では,ハイパーグラフに基づく機械学習アルゴリズム,データ構造駆動型メンテナンス手法,およびDijkstraのアルゴリズムの確率的応用に基づく計画アルゴリズムを提案する。
このアルゴリズムが問題空間内の最適解を決定すること、数学的に有界な学習性能を証明し、時間を通してシステム状態の進行を解析する数学的モデルを提供する。
論文 参考訳(メタデータ) (2021-10-18T16:22:33Z) - Learnability of Learning Performance and Its Application to Data
Valuation [11.78594243870616]
ほとんどの機械学習(ML)タスクでは、与えられたデータセットで学習パフォーマンスを評価するには、集中的な計算が必要である。
学習性能を効率的に推定する能力は、アクティブラーニング、データ品質管理、データバリュエーションといった幅広いアプリケーションに恩恵をもたらす可能性がある。
最近の実証研究では、多くの一般的なMLモデルに対して、少量のサンプルを用いて任意の入力データセットの学習性能を予測するパラメトリックモデルを正確に学習できることが示されている。
論文 参考訳(メタデータ) (2021-07-13T18:56:04Z) - Model-Augmented Actor-Critic: Backpropagating through Paths [81.86992776864729]
現在のモデルに基づく強化学習アプローチでは、単に学習されたブラックボックスシミュレータとしてモデルを使用する。
その微分可能性を利用してモデルをより効果的に活用する方法を示す。
論文 参考訳(メタデータ) (2020-05-16T19:18:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。