論文の概要: Recursive Nested Filtering for Efficient Amortized Bayesian Experimental Design
- arxiv url: http://arxiv.org/abs/2409.05354v1
- Date: Mon, 9 Sep 2024 06:27:54 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-10 15:40:55.234241
- Title: Recursive Nested Filtering for Efficient Amortized Bayesian Experimental Design
- Title(参考訳): 効率よいベイズ実験設計のための再帰ネストフィルタ
- Authors: Sahel Iqbal, Hany Abdulsamad, Sara Pérez-Vieites, Simo Särkkä, Adrien Corenflos,
- Abstract要約: Inside-Out Nested Particle Filter (IO-NPF)
非交換不能な環境での逐次ベイズ実験設計のためのアルゴリズム
軌道縮退を低減する後方サンプリングアルゴリズム
- 参考スコア(独自算出の注目度): 10.420092609356217
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper introduces the Inside-Out Nested Particle Filter (IO-NPF), a novel, fully recursive, algorithm for amortized sequential Bayesian experimental design in the non-exchangeable setting. We frame policy optimization as maximum likelihood estimation in a non-Markovian state-space model, achieving (at most) $\mathcal{O}(T^2)$ computational complexity in the number of experiments. We provide theoretical convergence guarantees and introduce a backward sampling algorithm to reduce trajectory degeneracy. IO-NPF offers a practical, extensible, and provably consistent approach to sequential Bayesian experimental design, demonstrating improved efficiency over existing methods.
- Abstract(参考訳): 本稿では,非交換性条件下での逐次ベイズ実験設計のための新しい完全再帰的アルゴリズムであるInterside-Out Nested Particle Filter (IO-NPF)を紹介する。
我々は、非マルコフ状態空間モデルにおける最大推定としてポリシーの最適化を定式化し、(ほとんどの場合)$\mathcal{O}(T^2)$計算複雑性を実験数で達成する。
理論的収束保証を提供し、軌道縮退を低減するために後方サンプリングアルゴリズムを導入する。
IO-NPFはシーケンシャルなベイズの実験設計に対して実用的で拡張性があり、確実に一貫したアプローチを提供し、既存の手法よりも優れた効率性を示している。
関連論文リスト
- Faster WIND: Accelerating Iterative Best-of-$N$ Distillation for LLM Alignment [81.84950252537618]
本稿では,反復的BONDと自己プレイアライメントの統一的なゲーム理論接続を明らかにする。
WINレート支配(WIN rate Dominance, WIND)という新しいフレームワークを構築し, 正規化利率支配最適化のためのアルゴリズムを多数提案する。
論文 参考訳(メタデータ) (2024-10-28T04:47:39Z) - Bayesian Experimental Design via Contrastive Diffusions [2.2186678387006435]
実験設計(BOED)は、一連の実験の実行コストを削減する強力なツールである。
コスト効率の良い後続分布を導入し,EIGコントラストへのトラクタアクセスを提供する。
生成モデルをBOEDフレームワークに組み込むことで、以前は非現実的であったシナリオにおいて、そのスコープと使用範囲を広げる。
論文 参考訳(メタデータ) (2024-10-15T17:53:07Z) - Probabilistic Guarantees of Stochastic Recursive Gradient in Non-Convex
Finite Sum Problems [1.5586874069708228]
本稿では,ランダムな個人境界を持つマーチンゲール差分列のノルムに基づく,次元自由なアゴホフディング型を新たに開発する。
本稿では,提案アルゴリズムであるProb-SARAHにおける勾配ノルム推定器の高確率境界について述べる。
論文 参考訳(メタデータ) (2024-01-29T05:05:03Z) - Online estimation of the inverse of the Hessian for stochastic optimization with application to universal stochastic Newton algorithms [4.389938747401259]
本稿では,期待値として記述された凸関数の最小値推定のための2次最適化について述べる。
Robbins-Monro 法を用いて逆 Hessian 行列の直接帰納的推定手法を提案する。
とりわけ、普遍的なニュートン法を開発し、提案手法の効率性を調べることができる。
論文 参考訳(メタデータ) (2024-01-15T13:58:30Z) - D4FT: A Deep Learning Approach to Kohn-Sham Density Functional Theory [79.50644650795012]
コーンシャム密度汎関数論(KS-DFT)を解くための深層学習手法を提案する。
このような手法はSCF法と同じ表現性を持つが,計算複雑性は低下する。
さらに,本手法により,より複雑なニューラルベース波動関数の探索が可能となった。
論文 参考訳(メタデータ) (2023-03-01T10:38:10Z) - Fast Computation of Optimal Transport via Entropy-Regularized Extragradient Methods [75.34939761152587]
2つの分布間の最適な輸送距離の効率的な計算は、様々な応用を促進するアルゴリズムとして機能する。
本稿では,$varepsilon$加法精度で最適な輸送を計算できるスケーラブルな一階最適化法を提案する。
論文 参考訳(メタデータ) (2023-01-30T15:46:39Z) - Maximum-Likelihood Inverse Reinforcement Learning with Finite-Time
Guarantees [56.848265937921354]
逆強化学習(IRL)は報酬関数と関連する最適ポリシーを回復することを目的としている。
IRLの多くのアルゴリズムは本質的にネスト構造を持つ。
我々は、報酬推定精度を損なわないIRLのための新しいシングルループアルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-10-04T17:13:45Z) - New Paradigms for Exploiting Parallel Experiments in Bayesian
Optimization [0.0]
本稿では,システムの構造を利用して設計空間を分割する並列BOパラダイムを提案する。
具体的には,性能関数のレベルセットに従って設計空間を分割する手法を提案する。
以上の結果から,本手法は検索時間を大幅に削減し,グローバルな(ローカルではなく)ソリューションを見つける可能性を高めることが示唆された。
論文 参考訳(メタデータ) (2022-10-03T16:45:23Z) - Bayesian Sequential Optimal Experimental Design for Nonlinear Models
Using Policy Gradient Reinforcement Learning [0.0]
この逐次最適設計(sOED)問題を有限水平部分観測可能なマルコフ決定過程(POMDP)として定式化する。
連続確率変数、一般のガウス的非ガウス的後部モデル、高価な非線形フォワードモデルに対応するために構築されている。
我々は、強化学習から政策勾配(PG)法を用いてsOEDポリシーを数値的に解き、sOEDのPG式を導出し、証明する。
PG-sOED法全体を線形ガウスベンチマークで検証し, 汚染源逆転問題により, バッチおよびグレディ設計よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-10-28T17:47:31Z) - Momentum Accelerates the Convergence of Stochastic AUPRC Maximization [80.8226518642952]
高精度リコール曲線(AUPRC)に基づく領域の最適化について検討し,不均衡なタスクに広く利用されている。
我々は、$O (1/epsilon4)$のより優れた反復による、$epsilon$定常解を見つけるための新しい運動量法を開発する。
また,O(1/epsilon4)$と同じ複雑さを持つ適応手法の新たなファミリを設計し,実際により高速な収束を享受する。
論文 参考訳(メタデータ) (2021-07-02T16:21:52Z) - Sequential Subspace Search for Functional Bayesian Optimization
Incorporating Experimenter Intuition [63.011641517977644]
本アルゴリズムは,実験者のガウス過程から引き出された一組の引き数で区切られた関数空間の有限次元ランダム部分空間列を生成する。
標準ベイズ最適化は各部分空間に適用され、次の部分空間の出発点(オリジン)として用いられる最良の解である。
シミュレーションおよび実世界の実験,すなわちブラインド関数マッチング,アルミニウム合金の最適析出強化関数の探索,深層ネットワークの学習速度スケジュール最適化において,本アルゴリズムを検証した。
論文 参考訳(メタデータ) (2020-09-08T06:54:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。