論文の概要: BAM: Bayes with Adaptive Memory
- arxiv url: http://arxiv.org/abs/2202.02405v1
- Date: Fri, 4 Feb 2022 21:55:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-13 18:32:50.072361
- Title: BAM: Bayes with Adaptive Memory
- Title(参考訳): BAM: アダプティブメモリを備えたベイズ
- Authors: Josue Nassar and Jennifer Brennan and Ben Evans and Kendall Lowrey
- Abstract要約: ベイズの定理は、新しいデータをエージェントの現在の信念に連続的に組み込むことを可能にする。
環境の変化を学ぶときの一般的な解決策は、過去のデータを破棄/ダウンウェイトすることです。
我々は、過去の経験を生かした新しいフレームワーク、Bayes with Adaptive Memory (BAM)を提案する。
- 参考スコア(独自算出の注目度): 5.916644920146454
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Online learning via Bayes' theorem allows new data to be continuously
integrated into an agent's current beliefs. However, a naive application of
Bayesian methods in non-stationary environments leads to slow adaptation and
results in state estimates that may converge confidently to the wrong parameter
value. A common solution when learning in changing environments is to
discard/downweight past data; however, this simple mechanism of "forgetting"
fails to account for the fact that many real-world environments involve
revisiting similar states. We propose a new framework, Bayes with Adaptive
Memory (BAM), that takes advantage of past experience by allowing the agent to
choose which past observations to remember and which to forget. We demonstrate
that BAM generalizes many popular Bayesian update rules for non-stationary
environments. Through a variety of experiments, we demonstrate the ability of
BAM to continuously adapt in an ever-changing world.
- Abstract(参考訳): ベイズの定理によるオンライン学習は、新しいデータをエージェントの現在の信念に継続的に組み込むことを可能にする。
しかし、ベイズ法を非定常環境に適用すると適応が遅くなり、誤ったパラメータ値に自信を持って収束する状態推定が得られる。
しかし、この「偽造」の単純なメカニズムは、多くの現実世界の環境が同様の状態を再考するという事実を説明できない。
我々は,エージェントが記憶すべき過去と記憶すべき過去を選択できるようにすることで,過去の経験を生かした新しいフレームワーク bayes with adaptive memory (bam) を提案する。
我々は,BAMが非定常環境におけるベイズ更新規則を一般化することを実証した。
さまざまな実験を通じて、常に変化する世界でBAMが継続的に適応できることを示します。
関連論文リスト
- No Regrets: Investigating and Improving Regret Approximations for Curriculum Discovery [53.08822154199948]
非教師なし環境設計(UED)手法は、エージェントがイン・オブ・アウト・ディストリビューションタスクに対して堅牢になることを約束する適応的カリキュラムとして近年注目を集めている。
本研究は,既存のUEDメソッドがいかにトレーニング環境を選択するかを検討する。
本研究では,学習性の高いシナリオを直接訓練する手法を開発した。
論文 参考訳(メタデータ) (2024-08-27T14:31:54Z) - EverAdapt: Continuous Adaptation for Dynamic Machine Fault Diagnosis Environments [23.190374196679766]
教師なしドメイン適応(Unsupervised Domain Adaptation, UDA)は、データ駆動型障害診断における重要なソリューションである。
UDAは、新しいドメインに適応する際、これまで見られたドメインではパフォーマンスが低くなる傾向にある。
動的環境における継続的モデル適応に特化して設計されたEverAdaptフレームワークを紹介します。
論文 参考訳(メタデータ) (2024-07-24T09:25:54Z) - Is user feedback always informative? Retrieval Latent Defending for Semi-Supervised Domain Adaptation without Source Data [34.55109747972333]
本稿では,現実のアプリケーションで容易に利用できるユーザフィードバックを用いて,ソースモデルをターゲット環境に適用することを目的とする。
負バイアスフィードバック(NBF)と呼ばれる新しい概念を用いて、この現象を解析する。
スケーラブルな適応アプローチであるRetrieval Latent Defendingを提案する。
論文 参考訳(メタデータ) (2024-07-22T05:15:41Z) - How to Leverage Predictive Uncertainty Estimates for Reducing Catastrophic Forgetting in Online Continual Learning [12.33899500566626]
この研究は、異なる不確実性推定とメモリの投入戦略を詳細に分析する。
負の対数類似度によって誘導される一般化分散を用いて予測の不確かさを推定する別の方法を提案する。
予測不確実性対策を用いることで, CFを異なる設定で低減できることが実証された。
論文 参考訳(メタデータ) (2024-07-10T13:51:15Z) - Quasi Black-Box Variational Inference with Natural Gradients for
Bayesian Learning [84.90242084523565]
複素モデルにおけるベイズ学習に適した最適化アルゴリズムを開発した。
我々のアプローチは、モデル固有導出に制限のある効率的なトレーニングのための一般的なブラックボックスフレームワーク内の自然な勾配更新に依存している。
論文 参考訳(メタデータ) (2022-05-23T18:54:27Z) - Continual Test-Time Domain Adaptation [94.51284735268597]
テスト時ドメイン適応は、ソースデータを使用しずに、ソース事前訓練されたモデルをターゲットドメインに適応することを目的としている。
CoTTAは実装が容易で、市販の事前訓練モデルに簡単に組み込むことができる。
論文 参考訳(メタデータ) (2022-03-25T11:42:02Z) - Regularizing Variational Autoencoder with Diversity and Uncertainty
Awareness [61.827054365139645]
変分オートエンコーダ(VAE)は、償却変分推論に基づいて潜伏変数の後部を近似する。
よりディバースで不確実な潜在空間を学習するための代替モデルDU-VAEを提案する。
論文 参考訳(メタデータ) (2021-10-24T07:58:13Z) - Semi-Supervised Learning with Variational Bayesian Inference and Maximum
Uncertainty Regularization [62.21716612888669]
半教師付き学習(SSL)を改善するための2つの一般的な方法を提案する。
第一に、重量摂動(WP)を既存のCR(Consistency regularization)ベースの手法に統合する。
第2の手法は「最大不確実性正規化(MUR)」と呼ばれる新しい整合性損失を提案する。
論文 参考訳(メタデータ) (2020-12-03T09:49:35Z) - Self-Supervised Policy Adaptation during Deployment [98.25486842109936]
セルフスーパービジョンでは、報酬を使わずに、デプロイ後のトレーニングを継続することができる。
DeepMind Control スイートと ViZDoom の様々なシミュレーション環境で実証評価を行う。
提案手法は,36環境中31環境での一般化を向上し,多くの環境においてドメインランダム化に優れる。
論文 参考訳(メタデータ) (2020-07-08T17:56:27Z) - The FMRIB Variational Bayesian Inference Tutorial II: Stochastic
Variational Bayes [1.827510863075184]
このチュートリアルは、オリジナルのFMRIB Variational Bayesチュートリアルを再考する。
この新しいアプローチは、機械学習アルゴリズムに適用された計算方法に多くの類似性を持ち、恩恵を受けている。
論文 参考訳(メタデータ) (2020-07-03T11:31:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。