論文の概要: Latent Properties of Lifelong Learning Systems
- arxiv url: http://arxiv.org/abs/2207.14378v1
- Date: Thu, 28 Jul 2022 20:58:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-01 12:19:29.184803
- Title: Latent Properties of Lifelong Learning Systems
- Title(参考訳): 生涯学習システムの潜時特性
- Authors: Corban Rivera, Chace Ashcraft, Alexander New, James Schmidt, Gautam
Vallabha
- Abstract要約: 本稿では,生涯学習アルゴリズムの潜伏特性を推定するために,アルゴリズムに依存しないサロゲート・モデリング手法を提案する。
合成データを用いた実験により,これらの特性を推定するためのアプローチを検証する。
- 参考スコア(独自算出の注目度): 59.50307752165016
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Creating artificial intelligence (AI) systems capable of demonstrating
lifelong learning is a fundamental challenge, and many approaches and metrics
have been proposed to analyze algorithmic properties. However, for existing
lifelong learning metrics, algorithmic contributions are confounded by task and
scenario structure. To mitigate this issue, we introduce an algorithm-agnostic
explainable surrogate-modeling approach to estimate latent properties of
lifelong learning algorithms. We validate the approach for estimating these
properties via experiments on synthetic data. To validate the structure of the
surrogate model, we analyze real performance data from a collection of popular
lifelong learning approaches and baselines adapted for lifelong classification
and lifelong reinforcement learning.
- Abstract(参考訳): 生涯学習を実証できる人工知能(AI)システムを作成することは根本的な課題であり、アルゴリズム特性を分析するために多くのアプローチやメトリクスが提案されている。
しかし、既存の生涯学習メトリクスでは、アルゴリズムによる貢献はタスクとシナリオ構造によって決定される。
この問題を軽減するために,生涯学習アルゴリズムの潜在特性を推定するアルゴリズム非依存なサロゲートモデリング手法を提案する。
合成データを用いた実験により,これらの特性を推定する手法を検証する。
サーロゲートモデルの構造を検証するために,生涯学習と生涯強化学習に適応した一般的な生涯学習手法とベースラインの集合から,実性能データを分析する。
関連論文リスト
- Deep End-to-End Survival Analysis with Temporal Consistency [49.77103348208835]
本稿では,大規模長手データの処理を効率的に行うために,Survival Analysisアルゴリズムを提案する。
我々の手法における中心的な考え方は、時間とともにデータにおける過去と将来の成果が円滑に進化するという仮説である時間的一貫性である。
我々のフレームワークは、安定したトレーニング信号を提供することで、時間的一貫性を大きなデータセットに独自に組み込む。
論文 参考訳(メタデータ) (2024-10-09T11:37:09Z) - Understanding active learning of molecular docking and its applications [0.6554326244334868]
本研究では,2次元構造のみを用いて,能動的学習手法がドッキングスコアを効果的に予測する方法を検討する。
以上の結果から,サロゲートモデルではドッキング量の高い化合物に代表される構造パターンを記憶する傾向が示唆された。
我々の総合的な分析は、仮想スクリーニングキャンペーンにおけるアクティブラーニング手法の信頼性と潜在的な適用可能性を示している。
論文 参考訳(メタデータ) (2024-06-14T05:43:42Z) - Runtime Verification of Learning Properties for Reinforcement Learning
Algorithms [0.0]
強化学習(RL)アルゴリズムは、試行錯誤方式で環境と相互作用する。
この研究は、学習フェーズが満たされていないか、定性的でタイムリーな期待を満たさないかを予測するために、新しい実行時検証技術を開発する。
論文 参考訳(メタデータ) (2023-11-16T11:34:37Z) - Learning Objective-Specific Active Learning Strategies with Attentive
Neural Processes [72.75421975804132]
学び アクティブラーニング(LAL)は、アクティブラーニング戦略自体を学ぶことを提案し、与えられた設定に適応できるようにする。
能動学習問題の対称性と独立性を利用した新しい分類法を提案する。
私たちのアプローチは、筋電図から学ぶことに基づいており、モデルに標準ではない目的に適応する能力を与えます。
論文 参考訳(メタデータ) (2023-09-11T14:16:37Z) - Learning ECG signal features without backpropagation [0.0]
時系列型データの表現を生成する新しい手法を提案する。
この方法は理論物理学の考えに頼り、データ駆動方式でコンパクトな表現を構築する。
本稿では,ECG信号分類の課題に対するアプローチの有効性を示す。
論文 参考訳(メタデータ) (2023-07-04T21:35:49Z) - Latent Variable Representation for Reinforcement Learning [131.03944557979725]
モデルに基づく強化学習のサンプル効率を改善するために、潜在変数モデルが学習、計画、探索をいかに促進するかは理論上、実証上、不明である。
状態-作用値関数に対する潜在変数モデルの表現ビューを提供する。これは、抽出可能な変分学習アルゴリズムと楽観主義/悲観主義の原理の効果的な実装の両方を可能にする。
特に,潜伏変数モデルのカーネル埋め込みを組み込んだUPB探索を用いた計算効率の良い計画アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-17T00:26:31Z) - Finite-Time Analysis of Temporal Difference Learning: Discrete-Time
Linear System Perspective [3.5823366350053325]
TD学習は強化学習(RL)の分野における基礎的アルゴリズムである
最近の研究では、有限時間誤差境界を開発することで、その統計的効率に関する保証を明らかにしている。
論文 参考訳(メタデータ) (2022-04-22T03:21:30Z) - What Makes Good Contrastive Learning on Small-Scale Wearable-based
Tasks? [59.51457877578138]
本研究では,ウェアラブル型行動認識タスクにおけるコントラスト学習について検討する。
本稿では,PyTorchライブラリのtextttCL-HAR について述べる。
論文 参考訳(メタデータ) (2022-02-12T06:10:15Z) - Goal Agnostic Planning using Maximum Likelihood Paths in Hypergraph
World Models [1.370633147306388]
本稿では,ハイパーグラフに基づく機械学習アルゴリズム,データ構造駆動型メンテナンス手法,およびDijkstraのアルゴリズムの確率的応用に基づく計画アルゴリズムを提案する。
このアルゴリズムが問題空間内の最適解を決定すること、数学的に有界な学習性能を証明し、時間を通してシステム状態の進行を解析する数学的モデルを提供する。
論文 参考訳(メタデータ) (2021-10-18T16:22:33Z) - Model-Augmented Actor-Critic: Backpropagating through Paths [81.86992776864729]
現在のモデルに基づく強化学習アプローチでは、単に学習されたブラックボックスシミュレータとしてモデルを使用する。
その微分可能性を利用してモデルをより効果的に活用する方法を示す。
論文 参考訳(メタデータ) (2020-05-16T19:18:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。