論文の概要: Retraining as Approximate Bayesian Inference
- arxiv url: http://arxiv.org/abs/2603.25480v1
- Date: Thu, 26 Mar 2026 14:20:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:48.327641
- Title: Retraining as Approximate Bayesian Inference
- Title(参考訳): 近似ベイズ推論としてのリトレーニング
- Authors: Harrison Katz,
- Abstract要約: ハリソン・カッツ(Harrison Katz)は、再訓練は計算制約の下で近似ベイズ推論としてよりよく理解できると主張している。
この記事では、Katz氏がポリシーの再トレーニングのための決定論的フレームワークを提供する。
その結果はエビデンスベースのトリガで、カレンダーのスケジュールを置き換え、ガバナンスを監査可能にする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Model retraining is usually treated as an ongoing maintenance task. But as Harrison Katz now argues, retraining can be better understood as approximate Bayesian inference under computational constraints. The gap between a continuously updated belief state and your frozen deployed model is "learning debt," and the retraining decision is a cost minimization problem with a threshold that falls out of your loss function. In this article Katz provides a decision-theoretic framework for retraining policies. The result is evidence-based triggers that replace calendar schedules and make governance auditable. For readers less familiar with the Bayesian and decision-theoretic language, key terms are defined in a glossary at the end of the article.
- Abstract(参考訳): モデル再訓練は通常、継続するメンテナンスタスクとして扱われる。
しかし、ハリソン・カッツ(Harrison Katz)が論じているように、再訓練は計算制約の下で近似ベイズ推論として理解しやすい。
継続的更新された信念状態とフリーズされたモデルの間のギャップは"学習負債"であり、再トレーニングの決定は損失関数から外れた閾値を持つコスト最小化の問題です。
この記事では、Katz氏がポリシーの再トレーニングのための決定論的フレームワークを提供する。
その結果はエビデンスベースのトリガで、カレンダーのスケジュールを置き換え、ガバナンスを監査可能にする。
ベイズ語と決定論的な言語にあまり馴染みのない読者にとって、重要な用語は記事の終わりの用語集で定義される。
関連論文リスト
- On Corruption-Robustness in Performative Reinforcement Learning [13.509499718691016]
本研究では,反復的再訓練アプローチの適応的安定政策への収束性について検討する。
私たちはこれらのアプローチを拡張して、腐敗したデータの下で運用します。
我々は,我々のアプローチがほぼ安定な政策に最終段階の収束を示すことを証明した。
論文 参考訳(メタデータ) (2025-05-08T19:37:35Z) - Rethinking Early Stopping: Refine, Then Calibrate [49.966899634962374]
キャリブレーション・リファインメント分解の新規な変分定式化について述べる。
我々は,校正誤差と精錬誤差が訓練中に同時に最小化されないという理論的,実証的な証拠を提供する。
論文 参考訳(メタデータ) (2025-01-31T15:03:54Z) - Temporal-Difference Variational Continual Learning [77.92320830700797]
複数の先行推定の正則化効果を統合する新たな学習目標を提案する。
提案手法は, 変分CL法より優れたカタストロフィックフォーミングを効果的に緩和する。
論文 参考訳(メタデータ) (2024-10-10T10:58:41Z) - Explicit Lipschitz Value Estimation Enhances Policy Robustness Against Perturbation [2.2120851074630177]
ロボット制御タスクでは、シミュレーションにおいて強化学習(RL)によって訓練されたポリシーは、物理ハードウェアにデプロイされた場合、しばしばパフォーマンス低下を経験する。
リプシッツ正則化は、近似値関数勾配の条件付けに役立ち、訓練後のロバスト性の向上につながる。
論文 参考訳(メタデータ) (2024-04-22T05:01:29Z) - Mitigating Catastrophic Forgetting in Task-Incremental Continual
Learning with Adaptive Classification Criterion [50.03041373044267]
本稿では,継続的学習のための適応型分類基準を用いた教師付きコントラスト学習フレームワークを提案する。
実験により, CFLは最先端の性能を達成し, 分類基準に比べて克服する能力が強いことが示された。
論文 参考訳(メタデータ) (2023-05-20T19:22:40Z) - Scaling Laws Beyond Backpropagation [64.0476282000118]
因果デコーダのみの変換器を効率的に訓練するための直接フィードバックアライメントの有効性について検討した。
DFAはバックプロパゲーションよりも効率的なスケーリングを提供していないことが分かりました。
論文 参考訳(メタデータ) (2022-10-26T10:09:14Z) - Remembering for the Right Reasons: Explanations Reduce Catastrophic
Forgetting [100.75479161884935]
我々は、RRR(Remembering for the Right Reasons)と呼ばれる新しいトレーニングパラダイムを提案する。
RRRは、各例の視覚モデル説明をバッファに格納し、モデルが予測に「正しい理由」を持つことを保証する。
メモリや正規化ベースのアプローチでRRRを容易に追加できることを示し、その結果、忘れを少なくする。
論文 参考訳(メタデータ) (2020-10-04T10:05:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。