論文の概要: Statistically Efficient Bayesian Sequential Experiment Design via
Reinforcement Learning with Cross-Entropy Estimators
- arxiv url: http://arxiv.org/abs/2305.18435v2
- Date: Mon, 5 Feb 2024 01:20:34 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-07 06:31:27.435596
- Title: Statistically Efficient Bayesian Sequential Experiment Design via
Reinforcement Learning with Cross-Entropy Estimators
- Title(参考訳): クロスエントロピー推定器を用いた強化学習によるベイズ逐次実験設計
- Authors: Tom Blau, Iadine Chades, Amir Dezfouli, Daniel Steinberg, Edwin V.
Bonilla
- Abstract要約: 強化学習は、実験のシーケンスを設計するための改善された設計ポリシーを学ぶことができる。
本稿では,関節モデル分布のクロスエントロピーとフレキシブルな提案分布に基づく代替推定器を提案する。
提案手法は,従来の手法の指数サンプルの複雑さを克服し,高いEIG値のより正確な推定値を提供する。
- 参考スコア(独自算出の注目度): 15.461927416747582
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Reinforcement learning can learn amortised design policies for designing
sequences of experiments. However, current amortised methods rely on estimators
of expected information gain (EIG) that require an exponential number of
samples on the magnitude of the EIG to achieve an unbiased estimation. We
propose the use of an alternative estimator based on the cross-entropy of the
joint model distribution and a flexible proposal distribution. This proposal
distribution approximates the true posterior of the model parameters given the
experimental history and the design policy. Our method overcomes the
exponential-sample complexity of previous approaches and provide more accurate
estimates of high EIG values. More importantly, it allows learning of superior
design policies, and is compatible with continuous and discrete design spaces,
non-differentiable likelihoods and even implicit probabilistic models.
- Abstract(参考訳): 強化学習は、実験のシーケンスを設計するための償却された設計方針を学ぶことができる。
しかし、現在の補正手法は、予測情報ゲイン(EIG)の推定に頼っており、偏りのない推定を達成するには、EIGの大きさの指数的なサンプル数を必要とする。
本稿では,ジョイントモデル分布のクロスエントロピーとフレキシブルな提案分布に基づく代替推定器の利用を提案する。
この提案分布は、実験履歴と設計方針から得られたモデルパラメータの真の後部を近似する。
提案手法は,従来の手法の指数サンプルの複雑さを克服し,高いEIG値のより正確な推定を行う。
より重要なことは、優れた設計方針の学習を可能にし、連続的で離散的な設計空間、非微分可能性、さらには暗黙の確率モデルとも互換性がある。
関連論文リスト
- Influence Functions for Scalable Data Attribution in Diffusion Models [52.92223039302037]
拡散モデルは、生成的モデリングに大きな進歩をもたらした。
しかし、彼らの普及はデータ属性と解釈可能性に関する課題を引き起こす。
本稿では,テキスト・インフルエンス・ファンクション・フレームワークを開発することにより,このような課題に対処することを目的とする。
論文 参考訳(メタデータ) (2024-10-17T17:59:02Z) - A Likelihood Based Approach to Distribution Regression Using Conditional Deep Generative Models [6.647819824559201]
本研究では,条件付き深部生成モデルの推定のための可能性に基づくアプローチの大規模サンプル特性について検討する。
その結果,条件分布を推定するための最大極大推定器の収束率を導いた。
論文 参考訳(メタデータ) (2024-10-02T20:46:21Z) - Unveiling the Statistical Foundations of Chain-of-Thought Prompting Methods [59.779795063072655]
CoT(Chain-of-Thought)の促進とその変種は、多段階推論問題を解決する効果的な方法として人気を集めている。
統計的推定の観点からCoTのプロンプトを解析し,その複雑さを包括的に評価する。
論文 参考訳(メタデータ) (2024-08-25T04:07:18Z) - Scalable method for Bayesian experimental design without integrating
over posterior distribution [0.0]
実験問題のA-最適ベイズ設計における計算効率について検討する。
A-最適性はベイズの実験設計に広く用いられ、容易に解釈できる基準である。
本研究は, A-Optimal 実験設計における新しい可能性のないアプローチを提案する。
論文 参考訳(メタデータ) (2023-06-30T12:40:43Z) - Variational Sequential Optimal Experimental Design using Reinforcement
Learning [0.0]
ベイジアン・フレームワークと情報ゲイン・ユーティリティを用いた有限列実験を最適に設計する新しい手法である変分逐次最適実験設計(vsOED)を導入する。
以上の結果から,従来の逐次設計アルゴリズムと比較して,サンプル効率が大幅に向上し,前方モデルシミュレーションの数が減少したことが示唆された。
論文 参考訳(メタデータ) (2023-06-17T21:47:19Z) - Metrics for Bayesian Optimal Experiment Design under Model
Misspecification [3.04585143845864]
ユーティリティ関数は、共通ユーティリティ関数が情報ゲインである実験の目的を定義する。
この記事では、従来の期待情報獲得基準を超えて、このプロセスのための拡張されたフレームワークを紹介します。
フレームワークの機能は、線形化スプリングマッサーダンパーシステムとF-16モデルを含むシナリオに適用することで紹介される。
論文 参考訳(メタデータ) (2023-04-17T02:13:20Z) - Design Amortization for Bayesian Optimal Experimental Design [70.13948372218849]
予測情報ゲイン(EIG)のバウンダリに関してパラメータ化された変分モデルを最適化する。
実験者が1つの変分モデルを最適化し、潜在的に無限に多くの設計に対してEIGを推定できる新しいニューラルアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-10-07T02:12:34Z) - Planning with Diffusion for Flexible Behavior Synthesis [125.24438991142573]
我々は、できるだけ多くの軌道最適化パイプラインをモデリング問題に折り畳むことがどう見えるか検討する。
我々の技術的アプローチの核心は、軌道を反復的にデノベーションすることで計画する拡散確率モデルにある。
論文 参考訳(メタデータ) (2022-05-20T07:02:03Z) - Gradient-based Bayesian Experimental Design for Implicit Models using
Mutual Information Lower Bounds [20.393359858407162]
ベイズ実験設計のためのフレームワーク(BED)を暗黙のモデルで導入する。データ生成分布は難解だが、そこからのサンプリングは可能である。
このようなモデルに最適な実験設計を見つけるために、ニューラルネットワークがパラメータとする相互情報の低い境界を最大化します。
ニューラルネットワークをサンプルデータ上でトレーニングすることで,勾配アセンシングを用いたネットワークパラメータと設計を同時に更新する。
論文 参考訳(メタデータ) (2021-05-10T13:59:25Z) - Optimal Bayesian experimental design for subsurface flow problems [77.34726150561087]
本稿では,設計ユーティリティ機能のためのカオス拡張サロゲートモデル(PCE)の開発のための新しいアプローチを提案する。
この手法により,対象関数に対する適切な品質応答面の導出が可能となり,計算予算は複数の単点評価に匹敵する。
論文 参考訳(メタデータ) (2020-08-10T09:42:59Z) - Machine learning for causal inference: on the use of cross-fit
estimators [77.34726150561087]
より優れた統計特性を得るために、二重ローバストなクロスフィット推定器が提案されている。
平均因果効果(ACE)に対する複数の推定器の性能評価のためのシミュレーション研究を行った。
機械学習で使用する場合、二重確率のクロスフィット推定器は、バイアス、分散、信頼区間のカバレッジで他のすべての推定器よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-04-21T23:09:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。