Fugu-MT 論文翻訳(概要): Nesting Particle Filters for Experimental Design in Dynamical Systems

論文の概要: Nesting Particle Filters for Experimental Design in Dynamical Systems

arxiv url: http://arxiv.org/abs/2402.07868v1
Date: Mon, 12 Feb 2024 18:29:17 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-13 13:08:19.304846
Title: Nesting Particle Filters for Experimental Design in Dynamical Systems
Title（参考訳）: 力学系における実験設計のためのネスティング粒子フィルタ
Authors: Sahel Iqbal, Adrien Corenflos, Simo S\"arkk\"a, Hany Abdulsamad
Abstract要約: Inside-Out SMC2アルゴリズムを開発した。これは、実験のコストを償却するために期待される情報のバイアス付き推定器に依存する最近のアプローチとは対照的である。
参考スコア（独自算出の注目度）: 3.9410617513331863
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In this paper, we propose a novel approach to Bayesian Experimental Design (BED) for non-exchangeable data that formulates it as risk-sensitive policy optimization. We develop the Inside-Out SMC^2 algorithm that uses a nested sequential Monte Carlo (SMC) estimator of the expected information gain and embeds it into a particle Markov chain Monte Carlo (pMCMC) framework to perform gradient-based policy optimization. This is in contrast to recent approaches that rely on biased estimators of the expected information gain (EIG) to amortize the cost of experiments by learning a design policy in advance. Numerical validation on a set of dynamical systems showcases the efficacy of our method in comparison to other state-of-the-art strategies.
Abstract（参考訳）: 本稿では,非交換可能データに対するベイズ実験設計(bed)を,リスクに敏感な政策最適化として定式化する新しい手法を提案する。 Inside-Out SMC^2アルゴリズムは,予測情報ゲインのネストされた連続モンテカルロ(SMC)推定器を使用し,それを粒子マルコフ連鎖モンテカルロ(pMCMC)フレームワークに埋め込んで勾配に基づく政策最適化を行う。これは、先進的な設計方針を学習することで実験のコストを減らし、期待情報ゲイン(EIG)のバイアス推定に頼っている最近のアプローチとは対照的である。一連の力学系の数値検証は,他の最先端戦略と比較して,本手法の有効性を示す。

関連論文リスト

Test-Time Alignment of Discrete Diffusion Models with Sequential Monte Carlo [19.81513273510523]
本研究では,SMC(Sequential Monte Carlo)をベースとしたトレーニングフリー手法を提案する。提案手法は, 報酬関数の1次テイラー展開により得られる局所的最適提案をツイストしたSMCを利用する。離散空間における不定義勾配の挑戦に対処するために、Gumbel-Softmax 緩和を導入し、離散生成フレームワーク内で効率的な勾配に基づく近似を可能にする。
論文参考訳（メタデータ） (2025-05-28T16:12:03Z)
Achieving $\widetilde{\mathcal{O}}(\sqrt{T})$ Regret in Average-Reward POMDPs with Known Observation Models [56.92178753201331]
平均逆無限水平POMDPを未知の遷移モデルで扱う。この障壁を克服する斬新でシンプルな推定器を提示する。
論文参考訳（メタデータ） (2025-01-30T22:29:41Z)
Recursive Nested Filtering for Efficient Amortized Bayesian Experimental Design [10.420092609356217]
Inside-Out Nested Particle Filter (IO-NPF) 非交換不能な環境での逐次ベイズ実験設計のためのアルゴリズム軌道縮退を低減する後方サンプリングアルゴリズム
論文参考訳（メタデータ） (2024-09-09T06:27:54Z)
Improving sample efficiency of high dimensional Bayesian optimization with MCMC [7.241485121318798]
本稿ではマルコフ・チェイン・モンテカルロに基づく新しい手法を提案する。提案アルゴリズムのMetropolis-HastingsとLangevin Dynamicsの両バージョンは、高次元逐次最適化および強化学習ベンチマークにおいて最先端の手法より優れていることを示す。
論文参考訳（メタデータ） (2024-01-05T05:56:42Z)
Variational Sequential Optimal Experimental Design using Reinforcement Learning [0.0]
対OEDは、変分後部近似を用いた一点報酬の定式化を採用し、期待される情報ゲインに対する証明可能な低いバウンドを提供する。我々は,既存の逐次実験設計アルゴリズムと比較して,サンプル効率が優れていることを示しながら,様々な工学・科学応用における vsOED の実証を行った。
論文参考訳（メタデータ） (2023-06-17T21:47:19Z)
Guaranteed Conservation of Momentum for Learning Particle-based Fluid Dynamics [96.9177297872723]
本稿では,学習物理シミュレーションにおける線形運動量を保証する新しい手法を提案する。我々は、強い制約で運動量の保存を強制し、反対称的な連続的な畳み込み層を通して実現する。提案手法により,学習シミュレータの物理的精度を大幅に向上させることができる。
論文参考訳（メタデータ） (2022-10-12T09:12:59Z)
Planning with Diffusion for Flexible Behavior Synthesis [125.24438991142573]
我々は、できるだけ多くの軌道最適化パイプラインをモデリング問題に折り畳むことがどう見えるか検討する。我々の技術的アプローチの核心は、軌道を反復的にデノベーションすることで計画する拡散確率モデルにある。
論文参考訳（メタデータ） (2022-05-20T07:02:03Z)
Optimizing Sequential Experimental Design with Deep Reinforcement Learning [7.589363597086081]
我々は、ポリシーを最適化する問題は、マルコフ決定プロセス(MDP)の解決に還元できることを示した。また,本手法はデプロイ時に計算効率が高く,連続的かつ離散的な設計空間上での最先端性能を示す。
論文参考訳（メタデータ） (2022-02-02T00:23:05Z)
Bayesian Sequential Optimal Experimental Design for Nonlinear Models Using Policy Gradient Reinforcement Learning [0.0]
この逐次最適設計(sOED)問題を有限水平部分観測可能なマルコフ決定過程(POMDP)として定式化する。連続確率変数、一般のガウス的非ガウス的後部モデル、高価な非線形フォワードモデルに対応するために構築されている。我々は、強化学習から政策勾配(PG)法を用いてsOEDポリシーを数値的に解き、sOEDのPG式を導出し、証明する。 PG-sOED法全体を線形ガウスベンチマークで検証し, 汚染源逆転問題により, バッチおよびグレディ設計よりも優れていることを示す。
論文参考訳（メタデータ） (2021-10-28T17:47:31Z)
Sampling in Combinatorial Spaces with SurVAE Flow Augmented MCMC [83.48593305367523]
ハイブリッドモンテカルロ(Hybrid Monte Carlo)は、複素連続分布からサンプリングする強力なマルコフ連鎖モンテカルロ法である。本稿では,SurVAEフローを用いたモンテカルロ法の拡張に基づく新しい手法を提案する。本稿では,統計学,計算物理学,機械学習など,様々な分野におけるアルゴリズムの有効性を実証し,代替アルゴリズムと比較した改良点を考察する。
論文参考訳（メタデータ） (2021-02-04T02:21:08Z)
Optimal Bayesian experimental design for subsurface flow problems [77.34726150561087]
本稿では,設計ユーティリティ機能のためのカオス拡張サロゲートモデル(PCE)の開発のための新しいアプローチを提案する。この手法により,対象関数に対する適切な品質応答面の導出が可能となり,計算予算は複数の単点評価に匹敵する。
論文参考訳（メタデータ） (2020-08-10T09:42:59Z)
Control as Hybrid Inference [62.997667081978825]
本稿では、反復推論と償却推論のバランスを自然に仲介するCHIの実装について述べる。連続的な制御ベンチマークでアルゴリズムのスケーラビリティを検証し、強力なモデルフリーおよびモデルベースラインを上回る性能を示す。
論文参考訳（メタデータ） (2020-07-11T19:44:09Z)
SAMBA: Safe Model-Based & Active Reinforcement Learning [59.01424351231993]
SAMBAは、確率論的モデリング、情報理論、統計学といった側面を組み合わせた安全な強化学習のためのフレームワークである。我々は,低次元および高次元の状態表現を含む安全な力学系ベンチマークを用いて,アルゴリズムの評価を行った。アクティブなメトリクスと安全性の制約を詳細に分析することで,フレームワークの有効性を直感的に評価する。
論文参考訳（メタデータ） (2020-06-12T10:40:46Z)
Unbiased MLMC stochastic gradient-based optimization of Bayesian experimental designs [4.112293524466434]
実験的な設計パラメータに対する期待情報ゲインの勾配は、ネスト予測によって与えられる。我々は,期待される情報ゲインの勾配を,期待される$ell$-norm,期待されるサンプル当たりの計算コストで推定するモンテカルロ推定器を導入する。
論文参考訳（メタデータ） (2020-05-18T01:02:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。