Fugu-MT 論文翻訳(概要): Variational Sequential Optimal Experimental Design using Reinforcement Learning

論文の概要: Variational Sequential Optimal Experimental Design using Reinforcement Learning

arxiv url: http://arxiv.org/abs/2306.10430v1
Date: Sat, 17 Jun 2023 21:47:19 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-21 20:55:29.534829
Title: Variational Sequential Optimal Experimental Design using Reinforcement Learning
Title（参考訳）: 強化学習を用いた変分逐次最適実験設計
Authors: Wanggang Shen, Jiayuan Dong, Xun Huan
Abstract要約: ベイジアン・フレームワークと情報ゲイン・ユーティリティを用いた有限列実験を最適に設計する新しい手法である変分逐次最適実験設計(vsOED)を導入する。以上の結果から,従来の逐次設計アルゴリズムと比較して,サンプル効率が大幅に向上し,前方モデルシミュレーションの数が減少したことが示唆された。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We introduce variational sequential Optimal Experimental Design (vsOED), a new method for optimally designing a finite sequence of experiments under a Bayesian framework and with information-gain utilities. Specifically, we adopt a lower bound estimator for the expected utility through variational approximation to the Bayesian posteriors. The optimal design policy is solved numerically by simultaneously maximizing the variational lower bound and performing policy gradient updates. We demonstrate this general methodology for a range of OED problems targeting parameter inference, model discrimination, and goal-oriented prediction. These cases encompass explicit and implicit likelihoods, nuisance parameters, and physics-based partial differential equation models. Our vsOED results indicate substantially improved sample efficiency and reduced number of forward model simulations compared to previous sequential design algorithms.
Abstract（参考訳）: 本稿では,ベイズフレームワークと情報収集ユーティリティを用いて,有限列実験を最適に設計する新しい手法である変分逐次最適実験設計(vsoed)を提案する。具体的には,ベイズ後方への変分近似により,期待効用として下限推定器を採用する。変分下限とポリシー勾配更新を同時に最大化することにより最適な設計方針を数値的に解く。本稿では,パラメータ推定,モデル識別,目標指向予測を対象とするOED問題に対して,本手法を実証する。これらのケースは、明示的かつ暗黙的な可能性、迷惑パラメータ、物理学に基づく偏微分方程式モデルを含む。 vsoedの結果,従来の逐次設計アルゴリズムと比較して,サンプル効率が大幅に向上し,フォワードモデルシミュレーション数が減少した。

関連論文リスト

Gradient-Free Sequential Bayesian Experimental Design via Interacting Particle Systems [2.624902795082451]
ベイズ最適実験設計(BOED)のための勾配のないフレームワークを逐次設定で導入する。提案手法は,設計最適化のためのEnsemble Kalman Inversion (EKI) と,効率的な後方サンプリングのためのAffine-Invariant Langevin Dynamics (ALDI) サンプリング器を組み合わせたものである。変分ガウスおよびパラメタライズされたラプラス近似は、期待される情報ゲインの上と下の境界を抽出できる。
論文参考訳（メタデータ） (2025-04-17T20:16:15Z)
Diffusion Model for Data-Driven Black-Box Optimization [54.25693582870226]
我々は、強力な生成AI技術である拡散モデルに注目し、ブラックボックス最適化の可能性について検討する。本研究では,1)実数値報酬関数のノイズ測定と,2)対比較に基づく人間の嗜好の2種類のラベルについて検討する。提案手法は,設計最適化問題を条件付きサンプリング問題に再構成し,拡散モデルのパワーを有効活用する。
論文参考訳（メタデータ） (2024-03-20T00:41:12Z)
Improving Diffusion Models for Inverse Problems Using Optimal Posterior Covariance [52.093434664236014]
近年の拡散モデルは、特定の逆問題に対して再訓練することなく、ノイズの多い線形逆問題に対する有望なゼロショット解を提供する。この発見に触発されて、我々は、最大推定値から決定されるより原理化された共分散を用いて、最近の手法を改善することを提案する。
論文参考訳（メタデータ） (2024-02-03T13:35:39Z)
Scalable method for Bayesian experimental design without integrating over posterior distribution [0.0]
実験問題のA-最適ベイズ設計における計算効率について検討する。 A-最適性はベイズの実験設計に広く用いられ、容易に解釈できる基準である。本研究は, A-Optimal 実験設計における新しい可能性のないアプローチを提案する。
論文参考訳（メタデータ） (2023-06-30T12:40:43Z)
Protein Design with Guided Discrete Diffusion [67.06148688398677]
タンパク質設計における一般的なアプローチは、生成モデルと条件付きサンプリングのための識別モデルを組み合わせることである。離散拡散モデルのためのガイダンス手法であるdiffusioN Optimized Smpling (NOS)を提案する。 NOSは、構造に基づく手法の重要な制限を回避し、シーケンス空間で直接設計を行うことができる。
論文参考訳（メタデータ） (2023-05-31T16:31:24Z)
Statistically Efficient Bayesian Sequential Experiment Design via Reinforcement Learning with Cross-Entropy Estimators [15.461927416747582]
強化学習は、実験のシーケンスを設計するための改善された設計ポリシーを学ぶことができる。本稿では,関節モデル分布のクロスエントロピーとフレキシブルな提案分布に基づく代替推定器を提案する。提案手法は,従来の手法の指数サンプルの複雑さを克服し,高いEIG値のより正確な推定値を提供する。
論文参考訳（メタデータ） (2023-05-29T00:35:52Z)
Online simulator-based experimental design for cognitive model selection [74.76661199843284]
本稿では,抽出可能な確率を伴わない計算モデルを選択する実験設計手法BOSMOSを提案する。シミュレーション実験では,提案手法により,既存のLFI手法に比べて最大2桁の精度でモデルを選択することができることを示した。
論文参考訳（メタデータ） (2023-03-03T21:41:01Z)
Design Amortization for Bayesian Optimal Experimental Design [70.13948372218849]
予測情報ゲイン(EIG)のバウンダリに関してパラメータ化された変分モデルを最適化する。実験者が1つの変分モデルを最適化し、潜在的に無限に多くの設計に対してEIGを推定できる新しいニューラルアーキテクチャを提案する。
論文参考訳（メタデータ） (2022-10-07T02:12:34Z)
Sparse high-dimensional linear regression with a partitioned empirical Bayes ECM algorithm [62.997667081978825]
疎高次元線形回帰に対する計算効率が高く強力なベイズ的手法を提案する。パラメータに関する最小の事前仮定は、プラグイン経験的ベイズ推定(英語版)を用いて用いられる。提案手法はRパッケージプローブに実装されている。
論文参考訳（メタデータ） (2022-09-16T19:15:50Z)
Bayesian Sequential Optimal Experimental Design for Nonlinear Models Using Policy Gradient Reinforcement Learning [0.0]
この逐次最適設計(sOED)問題を有限水平部分観測可能なマルコフ決定過程(POMDP)として定式化する。連続確率変数、一般のガウス的非ガウス的後部モデル、高価な非線形フォワードモデルに対応するために構築されている。我々は、強化学習から政策勾配(PG)法を用いてsOEDポリシーを数値的に解き、sOEDのPG式を導出し、証明する。 PG-sOED法全体を線形ガウスベンチマークで検証し, 汚染源逆転問題により, バッチおよびグレディ設計よりも優れていることを示す。
論文参考訳（メタデータ） (2021-10-28T17:47:31Z)
Gradient-based Bayesian Experimental Design for Implicit Models using Mutual Information Lower Bounds [20.393359858407162]
ベイズ実験設計のためのフレームワーク(BED)を暗黙のモデルで導入する。データ生成分布は難解だが、そこからのサンプリングは可能である。このようなモデルに最適な実験設計を見つけるために、ニューラルネットワークがパラメータとする相互情報の低い境界を最大化します。ニューラルネットワークをサンプルデータ上でトレーニングすることで,勾配アセンシングを用いたネットワークパラメータと設計を同時に更新する。
論文参考訳（メタデータ） (2021-05-10T13:59:25Z)
An AI-Assisted Design Method for Topology Optimization Without Pre-Optimized Training Data [68.8204255655161]
トポロジ最適化に基づくAI支援設計手法を提示し、最適化された設計を直接的に得ることができる。設計は、境界条件と入力データとしての充填度に基づいて、人工ニューラルネットワーク、予測器によって提供される。
論文参考訳（メタデータ） (2020-12-11T14:33:27Z)
Quantized Variational Inference [6.09170287691728]
ELBO最適化のために、量子変分推論が分散自由勾配をいかに生み出すかを示す。量子化変分推論フレームワークを用いることで、スコア関数と再パラメータ化勾配の両方に高速収束がもたらされることを示す。
論文参考訳（メタデータ） (2020-11-04T13:22:50Z)
Optimal Bayesian experimental design for subsurface flow problems [77.34726150561087]
本稿では,設計ユーティリティ機能のためのカオス拡張サロゲートモデル(PCE)の開発のための新しいアプローチを提案する。この手法により,対象関数に対する適切な品質応答面の導出が可能となり,計算予算は複数の単点評価に匹敵する。
論文参考訳（メタデータ） (2020-08-10T09:42:59Z)
Efficient Ensemble Model Generation for Uncertainty Estimation with Bayesian Approximation in Segmentation [74.06904875527556]
アンサンブルセグメンテーションモデルを構築するための汎用的で効率的なセグメンテーションフレームワークを提案する。提案手法では,層選択法を用いて効率よくアンサンブルモデルを生成することができる。また,新たな画素単位の不確実性損失を考案し,予測性能を向上する。
論文参考訳（メタデータ） (2020-05-21T16:08:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。