論文の概要: The Bayesian Reflex: Online Learning as the Autonomic Nervous System of Modern and Future AI
- arxiv url: http://arxiv.org/abs/2605.02825v1
- Date: Mon, 04 May 2026 17:01:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.421955
- Title: The Bayesian Reflex: Online Learning as the Autonomic Nervous System of Modern and Future AI
- Title(参考訳): ベイズ反射:現代と未来のAIの自律神経系としてのオンライン学習
- Authors: Durba Bhattacharya, Sucharita Roy, Sourabh Bhattacharya,
- Abstract要約: ベイズ反射は自律神経系と類似している。
AIにおけるオンライン学習のための統一フレームワークである。
継続的に学習する適応型AIの基盤となるインフラストラクチャを提供する。
- 参考スコア(独自算出の注目度): 0.9176056742068814
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This chapter introduces the Bayesian reflex -- an analogy with the autonomic nervous system -- as a unifying framework for online learning in AI. Bayesian online algorithms automatically maintain equilibrium in dynamic environments via three mechanisms: belief maintenance through probabilistic representations, sequential updating via Bayes' theorem, and uncertainty-driven action balancing exploration and exploitation. We survey online Bayesian methods, highlighting two computational principles: the look-up table principle for sequential inference in function space, and the ellipsoidal decomposition framework for nearly exact i.i.d. sampling from arbitrary posteriors. These principles are generalized across dynamic emulation, nonparametric state-space models, circular time series, inverse regression for climate model evaluation, and deep architectures via Recursive Gaussian Processes. Decision-making is explored via Thompson sampling and restless bandits. We extend the framework to assess infinite series convergence (applied to climate dynamics and the Riemann Hypothesis), model prime number distributions leading to the discovery of 184 strong Mersenne prime candidates, detect stationarity, and characterize point processes. The Bayesian reflex provides a foundational infrastructure for adaptive AI that continuously learns in a complex world.
- Abstract(参考訳): この章では、AIにおけるオンライン学習の統一フレームワークとして、ベイズ反射(Bayesian reflex、自律神経システムの類似)を紹介している。
ベイズオンラインアルゴリズムは、確率的表現による信念維持、ベイズの定理による逐次更新、不確実性駆動による行動バランスの探索と利用の3つのメカニズムを通じて、動的環境における平衡を自動的に維持する。
関数空間における逐次推論のためのルックアップテーブル原理と、ほぼ正確には任意の後部からサンプリングする楕円型分解フレームワークである。
これらの原理は、動的エミュレーション、非パラメトリック状態空間モデル、円形時系列、気候モデル評価のための逆回帰、および再帰ガウス過程による深いアーキテクチャにまたがって一般化される。
決定はトンプソンサンプリングとレスレス・バンディットによって行われる。
我々はこの枠組みを拡張し、無限級数収束(気候力学とリーマン仮説に応用)、モデル素数分布から184の強いメルセンヌ素数候補を発見し、定常性を検出し、点過程を特徴づける。
ベイズ反射は、複雑な世界で継続的に学習する適応AIの基盤となる基盤を提供する。
関連論文リスト
- Agentic World Modeling: Foundations, Capabilities, Laws, and Beyond [209.35045331678043]
2つの軸に沿って組織された「レベルx法」の分類を導入します。
第一に、3つの能力レベルを定義している: 1段階の局所遷移演算子を学ぶL1 Predictor、それらをドメインの法則を尊重する多段階のアクション条件付きロールアウトに構成するL2 Simulator、新しいエビデンスに対して予測が失敗すると自己のモデルを自動で修正するL3 Evolver。
我々は400以上の作品を合成し、モデルに基づく強化学習、ビデオ生成、WebおよびGUIエージェント、マルチエージェント社会シミュレーション、AIによる科学的発見にまたがる100以上の代表システムを要約する。
論文 参考訳(メタデータ) (2026-04-24T17:48:47Z) - Cross-Scenario Deraining Adaptation with Unpaired Data: Superpixel Structural Priors and Multi-Stage Pseudo-Rain Synthesis [48.809049043865905]
低レベルのコンピュータビジョンでは,イメージデライン化が重要な役割を担っている。
ディープラーニングのパラダイムは、目に見えないアウト・オブ・ディストリビューションシナリオに一般化された場合、厳しいパフォーマンス劣化に悩まされることが多い。
本稿では,クロスシナリオ・デライニング適応フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-23T07:38:55Z) - Online identification of nonlinear time-varying systems with uncertain information [7.071760583269057]
デジタルツイン(DT)は、複雑なサイバー物理システムのリアルタイム監視と予測保守のためのコアイネーブラーとして機能する。
既存の技術はこれらの要求を同時に満たすのに苦労している。
本稿では,ベイズ回帰に基づくシンボリックラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-15T13:33:48Z) - Interpretable Neural Approximation of Stochastic Reaction Dynamics with Guaranteed Reliability [4.736119820998459]
我々は,解釈可能性,信頼性保証,実質的な計算ゲインを実現するニューラルネットワークフレームワークであるDeepSKAを紹介する。
DeepSKAは、状態、時間、出力関数にまたがって一般化する数学的に透明な表現を生成し、この構造を少数のシミュレーションと統合し、古典的モンテカルロよりも非バイアスで、確率的に収束し、劇的に低いマグニチュード推定を生成する。
論文 参考訳(メタデータ) (2025-12-06T04:45:31Z) - STARec: An Efficient Agent Framework for Recommender Systems via Autonomous Deliberate Reasoning [54.28691219536054]
我々は、自律的な熟考的推論機能を備えたレコメンデータシステムを支援する、ゆっくり考えられた拡張エージェントフレームワークSTARecを紹介する。
我々は,先進的推論モデルと嗜好整合型報酬形成から構造化知識の蒸留を組み合わせた2段階のパラダイムであるアンカー強化訓練を開発する。
MovieLens 1MとAmazon CDsベンチマークの実験では、STARecは最先端のベースラインと比較して、大幅なパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2025-08-26T08:47:58Z) - A Novel Framework for Learning Stochastic Representations for Sequence Generation and Recognition [0.0]
シーケンシャルなデータの生成と認識は、動的環境で動作する自律システムの基本である。
パラメトリックバイアスを用いた新しいリカレントネットワーク(RNNPB)を提案する。
我々のアプローチは、時間パターンをモデル化するためのフレームワークを提供し、人工知能とロボティクスにおける堅牢なシステムの開発を前進させる。
論文 参考訳(メタデータ) (2024-12-30T07:27:50Z) - A Bayesian Approach to Robust Inverse Reinforcement Learning [54.24816623644148]
我々は、オフラインモデルに基づく逆強化学習(IRL)に対するベイズ的アプローチを考える。
提案フレームワークは,専門家の報酬関数と環境力学の主観的モデルとを同時推定することにより,既存のオフラインモデルベースIRLアプローチとは異なる。
本分析は, 専門家が環境の高精度なモデルを持つと考えられる場合, 評価政策が堅牢な性能を示すという新たな知見を提示する。
論文 参考訳(メタデータ) (2023-09-15T17:37:09Z) - Distributed Bayesian Learning of Dynamic States [65.7870637855531]
提案アルゴリズムは有限状態隠れマルコフモデルに対する分散ベイズフィルタタスクである。
逐次状態推定や、動的環境下でのソーシャルネットワーク上での意見形成のモデル化に使用できる。
論文 参考訳(メタデータ) (2022-12-05T19:40:17Z) - Variational Inference for Continuous-Time Switching Dynamical Systems [29.984955043675157]
従属拡散過程を変調したマルコフジャンプ過程に基づくモデルを提案する。
我々は,新しい連続時間変動推定アルゴリズムを開発した。
モデル仮定と実世界の実例に基づいて,我々のアルゴリズムを広範囲に評価する。
論文 参考訳(メタデータ) (2021-09-29T15:19:51Z) - Variational Auto-Regressive Gaussian Processes for Continual Learning [17.43751039943161]
連続学習におけるシーケンシャルなタスクを解くための原則的後続更新機構を開発する。
スケーラブルな後続に対するスパース誘導点近似を頼りに、新しい自己回帰変動分布を提案する。
平均的な予測エントロピー推定は、VAR-GPが破滅的な忘れを防いでいることを示している。
論文 参考訳(メタデータ) (2020-06-09T19:23:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。