論文の概要: Temporal Memory for Resource-Constrained Agents: Continual Learning via Stochastic Compress-Add-Smooth
- arxiv url: http://arxiv.org/abs/2604.00067v1
- Date: Tue, 31 Mar 2026 12:04:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-02 16:44:31.660922
- Title: Temporal Memory for Resource-Constrained Agents: Continual Learning via Stochastic Compress-Add-Smooth
- Title(参考訳): 資源拘束型エージェントの時間記憶:確率圧縮付加平滑化による継続的な学習
- Authors: Michael Chertkov,
- Abstract要約: シーケンシャルに動作するエージェントは、固定メモリ予算の下で、古い経験を忘れずに新しい経験を取り入れなければならない。
本稿では,メモリをパラメータベクトルではなくプロセスとするフレームワークを提案する。
このフレームワークは連続学習の完全な分析的イジングモデル’を提供し、数学的精度でそのメカニズム、速度、形態を研究できる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: An agent that operates sequentially must incorporate new experience without forgetting old experience, under a fixed memory budget. We propose a framework in which memory is not a parameter vector but a stochastic process: a Bridge Diffusion on a replay interval $[0,1]$, whose terminal marginal encodes the present and whose intermediate marginals encode the past. New experience is incorporated via a three-step \emph{Compress--Add--Smooth} (CAS) recursion. We test the framework on the class of models with marginal probability densities modeled via Gaussian mixtures of fixed number of components~$K$ in $d$ dimensions; temporal complexity is controlled by a fixed number~$L$ of piecewise-linear protocol segments whose nodes store Gaussian-mixture states. The entire recursion costs $O(LKd^2)$ flops per day -- no backpropagation, no stored data, no neural networks -- making it viable for controller-light hardware. Forgetting in this framework arises not from parameter interference but from lossy temporal compression: the re-approximation of a finer protocol by a coarser one under a fixed segment budget. We find that the retention half-life scales linearly as $a_{1/2}\approx c\,L$ with a constant $c>1$ that depends on the dynamics but not on the mixture complexity~$K$, the dimension~$d$, or the geometry of the target family. The constant~$c$ admits an information-theoretic interpretation analogous to the Shannon channel capacity. The stochastic process underlying the bridge provides temporally coherent ``movie'' replay -- compressed narratives of the agent's history, demonstrated visually on an MNIST latent-space illustration. The framework provides a fully analytical ``Ising model'' of continual learning in which the mechanism, rate, and form of forgetting can be studied with mathematical precision.
- Abstract(参考訳): シーケンシャルに動作するエージェントは、固定メモリ予算の下で、古い経験を忘れずに新しい経験を取り入れなければならない。
本稿では,メモリがパラメータベクトルではなく確率過程であるようなフレームワークを提案する。リプレイ間隔$[0,1]$のブリッジ拡散であり,その終端辺が現在を符号化し,中間辺縁が過去を符号化する。
新しい体験は3ステップの \emph{Compress--Add--Smooth} (CAS) 再帰によって取り入れられる。
このフレームワークは,ガウス的混合状態を持つノードがガウス的混合状態を保持するような断片的線形プロトコルセグメントの固定数~$L$により,時間的複雑性が制御されるような,ガウス的混合数〜$d$次元のガウス的混合によってモデル化された限界確率密度を持つモデルのクラス上でテストする。
再帰のコストは1日$O(LKd^2)$ flops -- バックプロパゲーションなし、ストアドデータなし、ニューラルネットワークなし -- で、コントローラライトハードウェアで使用することができる。
このフレームワークでは、パラメータ干渉ではなく、時間圧縮の損失が生じる:固定セグメント予算の下で、粗いプロトコルによるより細かいプロトコルの再近似。
保留半減期は、定数$c>1$を持つ$a_{1/2}\approx c\,L$として線形にスケールするが、これは混合複雑性~K$、次元~d$、ターゲットファミリーの幾何学に依存しない。
定数~$c$はシャノンチャネルのキャパシティに類似した情報理論の解釈を認める。
橋の裏側にある確率的過程は、MNISTラテントスペースのイラストで視覚的に実証された、エージェントの歴史を圧縮した物語を時間的にコヒーレントな ``movie'' のリプレイを提供する。
このフレームワークは、連続学習の完全な分析的『Ising model』を提供し、数学的精度でそのメカニズム、速度、形態を研究できる。
関連論文リスト
- Persistent Memory Through Triple-Loop Consolidation in a Non-Gradient Dissipative Cognitive Architecture [0.0]
本稿では,三重ループ統合サイクルを通した非段階的な永続メモリ機構であるDeep Memoryを紹介する。
我々は、Mixture-of-Experts (MoE) ゲーティングによる個別のエキスパートルーティングがDMの因果的前提であることを示した。
以上の結果から, DMは, 海馬統合と機能的並行性を有する非段階認知システムにおいて, 持続記憶の機構として確立された。
論文 参考訳(メタデータ) (2026-03-28T08:29:48Z) - Phase Diagrams of Information Backflow: Unifying Entanglement Revivals and Entropy Overshoots in Minimal Non-Markovian Models [0.0]
非マルコフ力学における記憶効果は、量子相関回復または非単調古典情報測度によってしばしば診断される。
本稿では,エンファンタムエンタングルメントとエントロピーオーバーシュートを配置する情報バックフロー位相図手法を提案する。
我々は,確率単純度に基づくエントロピーオーバーシュート$H$とKLに基づく診断によって,非単調性を定量化する。
論文 参考訳(メタデータ) (2026-01-25T02:58:47Z) - One-Shot Federated Ridge Regression: Exact Recovery via Sufficient Statistic Aggregation [0.7106986689736825]
フェデレート・リッジ回帰(Federated ridge regression)は、各クライアントが局所的な十分な統計を計算し、一度送信する分散平衡問題である。
我々は、クライアント1回に1回ノイズが注入された場合の差分プライバシー保証を確立し、マルチラウンドプロトコルのプライバシを低下させる構成ペナルティを排除した。
合成ヘテロジニアス回帰の実験では、単発核融合はFedAvgの精度と一致し、通信コストは最大38時間以下であることが示されている。
論文 参考訳(メタデータ) (2026-01-13T04:47:22Z) - Phase-space entropy at acquisition reflects downstream learnability [54.4100065023873]
楽器分解位相空間に基づく取得レベルスカラー$S_mathcal B$を提案する。
本稿では, (S_mathcal B) が周期サンプリングの位相空間コヒーレンスを正確に同定できることを理論的に示す。
$|S_mathcal B|$は一貫してサンプリングジオメトリをランク付けし、トレーニングなしで下流での再構築/認識の困難を予測します。
論文 参考訳(メタデータ) (2025-12-22T10:03:51Z) - INC: An Indirect Neural Corrector for Auto-Regressive Hybrid PDE Solvers [61.84396402100827]
本稿では,学習した補正を支配方程式に統合する間接ニューラルコレクタ(mathrmINC$)を提案する。
$mathrmINC$は、$t-1 + L$の順番でエラー増幅を減らし、$t$はタイムステップ、$L$はリプシッツ定数である。
大規模なベンチマークで$mathrmINC$をテストし、1Dカオスシステムから3D乱流まで、多くの異なる解法、神経バックボーン、テストケースをカバーした。
論文 参考訳(メタデータ) (2025-11-16T20:14:28Z) - From Continual Learning to SGD and Back: Better Rates for Continual Linear Models [50.11453013647086]
以前見られたタスクの損失を、$k$の繰り返しの後、忘れること、すなわち、分析する。
実現可能な最小二乗の設定において、新しい最上界を創出する。
我々は、タスクを繰り返しないランダム化だけで、十分に長いタスクシーケンスで破滅的な事態を防げることを初めて証明した。
論文 参考訳(メタデータ) (2025-04-06T18:39:45Z) - Projection by Convolution: Optimal Sample Complexity for Reinforcement Learning in Continuous-Space MDPs [56.237917407785545]
本稿では,円滑なベルマン作用素を持つ連続空間マルコフ決定過程(MDP)の一般クラスにおいて,$varepsilon$-optimal Policyを学習する問題を考察する。
我々のソリューションの鍵となるのは、調和解析のアイデアに基づく新しい射影技術である。
我々の結果は、連続空間 MDP における2つの人気と矛盾する視点のギャップを埋めるものである。
論文 参考訳(メタデータ) (2024-05-10T09:58:47Z) - Improved Algorithm for Adversarial Linear Mixture MDPs with Bandit
Feedback and Unknown Transition [71.33787410075577]
線形関数近似,未知遷移,および逆損失を用いた強化学習について検討した。
我々は高い確率で$widetildeO(dsqrtHS3K + sqrtHSAK)$ regretを実現する新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-03-07T15:03:50Z) - Posterior Coreset Construction with Kernelized Stein Discrepancy for
Model-Based Reinforcement Learning [78.30395044401321]
我々は、強化学習(MBRL)のための新しいモデルベースアプローチを開発する。
ターゲット遷移モデルの仮定を緩和し、混合モデルの一般的な族に属する。
連続的な制御環境では、壁時計の時間を最大50%削減することができる。
論文 参考訳(メタデータ) (2022-06-02T17:27:49Z) - An Improved Analysis of Gradient Tracking for Decentralized Machine
Learning [34.144764431505486]
トレーニングデータが$n$エージェントに分散されるネットワーク上での分散機械学習を検討する。
エージェントの共通の目標は、すべての局所損失関数の平均を最小化するモデルを見つけることである。
ノイズのない場合、$p$を$mathcalO(p-1)$から$mathcalO(p-1)$に改善します。
論文 参考訳(メタデータ) (2022-02-08T12:58:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。