論文の概要: Adaptive Learning Guided by Bias-Noise-Alignment Diagnostics
- arxiv url: http://arxiv.org/abs/2512.24445v1
- Date: Tue, 30 Dec 2025 19:57:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-01 23:27:28.479163
- Title: Adaptive Learning Guided by Bias-Noise-Alignment Diagnostics
- Title(参考訳): Bias-Noise-Alignment 法による適応学習
- Authors: Akash Samanta, Sheldon Williamson,
- Abstract要約: 非定常的で安全にクリティカルな環境での学習システムは、学習のダイナミクスが時間とともに進化するときに不安定、緩やかな収束、不安定な適応に悩まされることが多い。
本稿では, 偏差の原理分解による誤り進化を明示的にモデル化する, 診断駆動適応学習フレームワークを提案する。
提案したバイアスノイズアライメントは,教師付き最適化,アクター-批評家強化学習,分解学習のための統一制御バックボーンを提供する。
- 参考スコア(独自算出の注目度): 0.7519872646378835
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning systems deployed in nonstationary and safety-critical environments often suffer from instability, slow convergence, or brittle adaptation when learning dynamics evolve over time. While modern optimization, reinforcement learning, and meta-learning methods adapt to gradient statistics, they largely ignore the temporal structure of the error signal itself. This paper proposes a diagnostic-driven adaptive learning framework that explicitly models error evolution through a principled decomposition into bias, capturing persistent drift; noise, capturing stochastic variability; and alignment, capturing repeated directional excitation leading to overshoot. These diagnostics are computed online from lightweight statistics of loss or temporal-difference error trajectories and are independent of model architecture or task domain. We show that the proposed bias-noise-alignment decomposition provides a unifying control backbone for supervised optimization, actor-critic reinforcement learning, and learned optimizers. Building on this framework, we derive diagnostic-driven instantiations including a stabilized supervised optimizer, a diagnostic-regulated actor-critic scheme, and a diagnostic-conditioned learned optimizer. Under standard smoothness assumptions, we establish bounded effective updates and stability properties for all cases. Representative diagnostic illustrations in actor-critic learning highlight how the proposed signals modulate adaptation in response to temporal-difference error structure. Overall, this work elevates error evolution to a first-class object in adaptive learning and provides an interpretable, lightweight foundation for reliable learning in dynamic environments.
- Abstract(参考訳): 非定常的かつ安全クリティカルな環境にデプロイされる学習システムは、学習ダイナミクスが時間とともに進化するときに不安定、収束が遅い、あるいは不安定な適応に悩まされることが多い。
現代の最適化、強化学習、メタラーニング手法は勾配統計に適応するが、エラー信号自体の時間的構造は無視される。
本稿では,過度に起因する過度な方向励振を再現し,ノイズ,確率的変動を捉え,アライメントを計測し,過度に起因する過度な方向励振を捉える,診断駆動適応学習フレームワークを提案する。
これらの診断は、損失の軽量統計や時間差誤差の軌跡からオンラインで計算され、モデルアーキテクチャやタスクドメインとは独立している。
提案したバイアスノイズアライメント分解は,教師付き最適化,アクタ・クリティカル強化学習,学習オプティマイザのための統一制御バックボーンを提供する。
この枠組みを基盤として、安定化された教師付きオプティマイザ、診断規制されたアクタ・クリティック・スキーム、診断条件付き学習オプティマイザなど、診断駆動のインスタンス化を導出する。
標準的な滑らか性仮定の下では、すべてのケースに対して有界な効率的な更新と安定性特性を確立する。
アクター・クリティカル・ラーニングにおける代表的な診断図は、時間差誤差構造に応答して、提案した信号がどのように適応を変調するかを強調している。
全体として、この研究は適応学習における第一級オブジェクトへのエラー進化を増大させ、動的環境における信頼性学習のための解釈可能で軽量な基盤を提供する。
関連論文リスト
- Interpretable Hybrid Deep Q-Learning Framework for IoT-Based Food Spoilage Prediction with Synthetic Data Generation and Hardware Validation [0.5417521241272645]
インテリジェントでリアルタイムな腐敗予測システムの必要性は、現代のIoT駆動食品サプライチェーンにおいて重要になっている。
本稿では,Long Short-Term Memory(LSTM)とRecurrent Neural Networks(RNN)を統合したハイブリッド強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-22T12:59:48Z) - Contrastive Learning-Based Dependency Modeling for Anomaly Detection in Cloud Services [6.382793463325052]
本稿では,コントラスト学習を統合した依存性モデリングと異常検出手法を提案する。
対照的な学習フレームワークを導入し、正と負のサンプルペアを構築し、正常パターンと異常パターンの分離性を高める。
提案手法は、Precision、Recall、F1-Score、AUCといった主要なメトリクスにおいて、既存の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2025-10-15T09:59:16Z) - Activation Function Design Sustains Plasticity in Continual Learning [1.618563064839635]
継続的な学習では、モデルは適応する能力を失う可能性がある。
可塑性損失を軽減するため, アクティベーション選択はアーキテクチャに依存しない主要なレバーであることを示す。
論文 参考訳(メタデータ) (2025-09-26T16:41:47Z) - From Physics to Machine Learning and Back: Part II - Learning and Observational Bias in PHM [52.64097278841485]
物理インフォームドモデリングとデータストラテジーによる学習と観察バイアスの導入は、モデルを物理的に一貫した信頼性のある予測へと導くことができるかを検討する。
メタラーニングや少数ショットラーニングなどの高速適応手法をドメイン一般化手法とともに検討する。
論文 参考訳(メタデータ) (2025-09-25T14:15:43Z) - Model Hemorrhage and the Robustness Limits of Large Language Models [119.46442117681147]
大規模言語モデル(LLM)は、自然言語処理タスク全体で強力なパフォーマンスを示すが、デプロイメント用に修正された場合、大幅なパフォーマンス低下を経験する。
この現象をモデル出血(パラメータ変更とアーキテクチャ変更によるパフォーマンス低下)と定義する。
論文 参考訳(メタデータ) (2025-03-31T10:16:03Z) - Robust Deep Reinforcement Learning with Adaptive Adversarial Perturbations in Action Space [3.639580365066386]
本稿では,トレーニング中の対向摂動の影響を調整するための適応的対向係数フレームワークを提案する。
提案手法の特長は,実世界のアプリケーションに簡単にデプロイでき,シミュレータに事前にアクセスする必要がなくなることである。
MuJoCoの実験から,本手法はトレーニングの安定性を向上し,異なるテスト環境に移行する際の堅牢なポリシを学習できることが示された。
論文 参考訳(メタデータ) (2024-05-20T12:31:11Z) - Diffusion Model Driven Test-Time Image Adaptation for Robust Skin Lesion Classification [24.08402880603475]
テストデータ上でのモデルの精度を高めるためのテスト時間画像適応手法を提案する。
拡散モデルを用いて、対象の試験画像をソース領域に投影して修正する。
私たちの手法は、さまざまな汚職、アーキテクチャ、データレシエーションにおいて、堅牢性をより堅牢にします。
論文 参考訳(メタデータ) (2024-05-18T13:28:51Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Training Generative Adversarial Networks by Solving Ordinary
Differential Equations [54.23691425062034]
GANトレーニングによって引き起こされる連続時間ダイナミクスについて検討する。
この観点から、GANのトレーニングにおける不安定性は積分誤差から生じると仮定する。
本研究では,有名なODEソルバ(Runge-Kutta など)がトレーニングを安定化できるかどうかを実験的に検証する。
論文 参考訳(メタデータ) (2020-10-28T15:23:49Z) - Learning perturbation sets for robust machine learning [97.6757418136662]
我々は、潜在空間の制約領域上に設定された摂動を定義する条件生成器を用いる。
学習した摂動集合の質を定量的かつ質的に測定する。
我々は、学習した摂動集合を利用して、敵画像の破損や逆光の変動に対して経験的かつ確実に堅牢なモデルを訓練する。
論文 参考訳(メタデータ) (2020-07-16T16:39:54Z) - Dynamic Federated Learning [57.14673504239551]
フェデレートラーニング(Federated Learning)は、マルチエージェント環境における集中的なコーディネーション戦略の包括的用語として登場した。
我々は、各イテレーションにおいて、利用可能なエージェントのランダムなサブセットがそのデータに基づいてローカル更新を実行する、フェデレートされた学習モデルを考える。
集約最適化問題に対する真の最小化器上の非定常ランダムウォークモデルの下で、アーキテクチャの性能は、各エージェントにおけるデータ変動率、各エージェントにおけるモデル変動率、アルゴリズムの学習率に逆比例する追跡項の3つの要因によって決定されることを示す。
論文 参考訳(メタデータ) (2020-02-20T15:00:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。