論文の概要: Variational Sequential Optimal Experimental Design using Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2306.10430v2
- Date: Mon, 23 Dec 2024 17:56:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-24 15:54:55.537329
- Title: Variational Sequential Optimal Experimental Design using Reinforcement Learning
- Title(参考訳): 強化学習を用いた変分順序最適実験設計
- Authors: Wanggang Shen, Jiayuan Dong, Xun Huan,
- Abstract要約: 対OEDは、変分後部近似を用いた一点報酬の定式化を採用し、期待される情報ゲインに対する証明可能な低いバウンドを提供する。
我々は,既存の逐次実験設計アルゴリズムと比較して,サンプル効率が優れていることを示しながら,様々な工学・科学応用における vsOED の実証を行った。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: We present variational sequential optimal experimental design (vsOED), a novel method for optimally designing a finite sequence of experiments within a Bayesian framework with information-theoretic criteria. vsOED employs a one-point reward formulation with variational posterior approximations, providing a provable lower bound to the expected information gain. Numerical methods are developed following an actor-critic reinforcement learning approach, including derivation and estimation of variational and policy gradients to optimize the design policy, and posterior approximation using Gaussian mixture models and normalizing flows. vsOED accommodates nuisance parameters, implicit likelihoods, and multiple candidate models, while supporting flexible design criteria that can target designs for model discrimination, parameter inference, goal-oriented prediction, and their weighted combinations. We demonstrate vsOED across various engineering and science applications, illustrating its superior sample efficiency compared to existing sequential experimental design algorithms.
- Abstract(参考訳): 本稿では,ベイズフレームワーク内の有限列実験を情報理論基準で最適に設計する新しい手法である変分逐次最適実験設計法(vsOED)を提案する。
対OEDは、変分後部近似を用いた一点報酬の定式化を採用し、期待される情報ゲインに対する証明可能な低いバウンドを提供する。
設計方針を最適化するための変分・方針勾配の導出・推定や,ガウス混合モデルと正規化フローを用いた後部近似を含む,アクター・クリティカルな強化学習手法に従って,数値解析手法を開発した。
モデル識別、パラメータ推論、目標指向予測、およびそれらの重み付けの組み合わせの設計を対象とするフレキシブルな設計基準をサポートしながら、VSOEDはニュアンスパラメータ、暗黙的可能性、および複数の候補モデルに対応している。
我々は,既存の逐次実験設計アルゴリズムと比較して,サンプル効率が優れていることを示しながら,様々な工学・科学応用における vsOED の実証を行った。
関連論文リスト
- Variational Search Distributions [16.609027794680213]
そこで我々は, 離散的, 希少なクラスの設計を逐次的に発見・生成するために, 変分探索 (VSD) を開発した。
種々の生体系における実数列設計問題に対して,VSDが既存のベースライン法より優れていることを実証的に実証した。
論文 参考訳(メタデータ) (2024-09-10T01:33:31Z) - Diffusion Model for Data-Driven Black-Box Optimization [54.25693582870226]
我々は、強力な生成AI技術である拡散モデルに注目し、ブラックボックス最適化の可能性について検討する。
本研究では,1)実数値報酬関数のノイズ測定と,2)対比較に基づく人間の嗜好の2種類のラベルについて検討する。
提案手法は,設計最適化問題を条件付きサンプリング問題に再構成し,拡散モデルのパワーを有効活用する。
論文 参考訳(メタデータ) (2024-03-20T00:41:12Z) - Protein Design with Guided Discrete Diffusion [67.06148688398677]
タンパク質設計における一般的なアプローチは、生成モデルと条件付きサンプリングのための識別モデルを組み合わせることである。
離散拡散モデルのためのガイダンス手法であるdiffusioN Optimized Smpling (NOS)を提案する。
NOSは、構造に基づく手法の重要な制限を回避し、シーケンス空間で直接設計を行うことができる。
論文 参考訳(メタデータ) (2023-05-31T16:31:24Z) - Statistically Efficient Bayesian Sequential Experiment Design via
Reinforcement Learning with Cross-Entropy Estimators [15.461927416747582]
強化学習は、実験のシーケンスを設計するための改善された設計ポリシーを学ぶことができる。
本稿では,関節モデル分布のクロスエントロピーとフレキシブルな提案分布に基づく代替推定器を提案する。
提案手法は,従来の手法の指数サンプルの複雑さを克服し,高いEIG値のより正確な推定値を提供する。
論文 参考訳(メタデータ) (2023-05-29T00:35:52Z) - Online simulator-based experimental design for cognitive model selection [74.76661199843284]
本稿では,抽出可能な確率を伴わない計算モデルを選択する実験設計手法BOSMOSを提案する。
シミュレーション実験では,提案手法により,既存のLFI手法に比べて最大2桁の精度でモデルを選択することができることを示した。
論文 参考訳(メタデータ) (2023-03-03T21:41:01Z) - Design Amortization for Bayesian Optimal Experimental Design [70.13948372218849]
予測情報ゲイン(EIG)のバウンダリに関してパラメータ化された変分モデルを最適化する。
実験者が1つの変分モデルを最適化し、潜在的に無限に多くの設計に対してEIGを推定できる新しいニューラルアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-10-07T02:12:34Z) - Bayesian Sequential Optimal Experimental Design for Nonlinear Models
Using Policy Gradient Reinforcement Learning [0.0]
この逐次最適設計(sOED)問題を有限水平部分観測可能なマルコフ決定過程(POMDP)として定式化する。
連続確率変数、一般のガウス的非ガウス的後部モデル、高価な非線形フォワードモデルに対応するために構築されている。
我々は、強化学習から政策勾配(PG)法を用いてsOEDポリシーを数値的に解き、sOEDのPG式を導出し、証明する。
PG-sOED法全体を線形ガウスベンチマークで検証し, 汚染源逆転問題により, バッチおよびグレディ設計よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-10-28T17:47:31Z) - Gradient-based Bayesian Experimental Design for Implicit Models using
Mutual Information Lower Bounds [20.393359858407162]
ベイズ実験設計のためのフレームワーク(BED)を暗黙のモデルで導入する。データ生成分布は難解だが、そこからのサンプリングは可能である。
このようなモデルに最適な実験設計を見つけるために、ニューラルネットワークがパラメータとする相互情報の低い境界を最大化します。
ニューラルネットワークをサンプルデータ上でトレーニングすることで,勾配アセンシングを用いたネットワークパラメータと設計を同時に更新する。
論文 参考訳(メタデータ) (2021-05-10T13:59:25Z) - An AI-Assisted Design Method for Topology Optimization Without
Pre-Optimized Training Data [68.8204255655161]
トポロジ最適化に基づくAI支援設計手法を提示し、最適化された設計を直接的に得ることができる。
設計は、境界条件と入力データとしての充填度に基づいて、人工ニューラルネットワーク、予測器によって提供される。
論文 参考訳(メタデータ) (2020-12-11T14:33:27Z) - Optimal Bayesian experimental design for subsurface flow problems [77.34726150561087]
本稿では,設計ユーティリティ機能のためのカオス拡張サロゲートモデル(PCE)の開発のための新しいアプローチを提案する。
この手法により,対象関数に対する適切な品質応答面の導出が可能となり,計算予算は複数の単点評価に匹敵する。
論文 参考訳(メタデータ) (2020-08-10T09:42:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。