論文の概要: Cross-Entropy Estimators for Sequential Experiment Design with
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2305.18435v1
- Date: Mon, 29 May 2023 00:35:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-31 21:03:19.686229
- Title: Cross-Entropy Estimators for Sequential Experiment Design with
Reinforcement Learning
- Title(参考訳): 強化学習を用いた逐次実験設計のためのクロスエントロピー推定器
- Authors: Tom Blau, Edwin Bonilla, Iadine Chades, Amir Dezfouli
- Abstract要約: 強化学習は、実験のシーケンスを設計するための改善された設計ポリシーを学ぶことができる。
現在の手法は、期待される情報ゲインのコントラスト推定器に依存している。
本稿では,関節モデル分布のクロスエントロピーに基づく下界推定器を提案する。
- 参考スコア(独自算出の注目度): 7.5893635970860815
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Reinforcement learning can effectively learn amortised design policies for
designing sequences of experiments. However, current methods rely on
contrastive estimators of expected information gain, which require an
exponential number of contrastive samples to achieve an unbiased estimation. We
propose an alternative lower bound estimator, based on the cross-entropy of the
joint model distribution and a flexible proposal distribution. This proposal
distribution approximates the true posterior of the model parameters given the
experimental history and the design policy. Our estimator requires no
contrastive samples, can achieve more accurate estimates of high information
gains, allows learning of superior design policies, and is compatible with
implicit probabilistic models. We assess our algorithm's performance in various
tasks, including continuous and discrete designs and explicit and implicit
likelihoods.
- Abstract(参考訳): 強化学習は、実験のシーケンスを設計するための償却設計ポリシーを効果的に学習することができる。
しかし、現在の方法は、予測された情報ゲインの対比推定子に依存しており、偏りのない推定を達成するために指数関数的なコントラストサンプルを必要とする。
本稿では,ジョイントモデル分布のクロスエントロピーとフレキシブルな提案分布に基づく,代替の下限推定器を提案する。
この提案分布は、実験履歴と設計方針から得られたモデルパラメータの真の後部を近似する。
我々の推定器は、対照的なサンプルを必要とせず、高い情報ゲインのより正確な推定を達成でき、優れた設計方針の学習を可能にし、暗黙の確率モデルと互換性がある。
我々は、連続的および離散的設計や明示的かつ暗黙的な可能性を含む、様々なタスクにおけるアルゴリズムの性能を評価する。
関連論文リスト
- Model-free Methods for Event History Analysis and Efficient Adjustment (PhD Thesis) [55.2480439325792]
この論文は、モデルフリーの観点から統一された統計学への独立した貢献のシリーズである。
第1章では、機械学習から予測技術を活用する柔軟なメソッドを定式化するために、モデルフリーの視点をどのように利用できるか、詳しく説明している。
第2章では、あるプロセスの進化が他のプロセスに直接影響されるかどうかを記述した地域独立の概念を研究している。
論文 参考訳(メタデータ) (2025-02-11T19:24:09Z) - A Likelihood Based Approach to Distribution Regression Using Conditional Deep Generative Models [6.647819824559201]
本研究では,条件付き深部生成モデルの推定のための可能性に基づくアプローチの大規模サンプル特性について検討する。
その結果,条件分布を推定するための最大極大推定器の収束率を導いた。
論文 参考訳(メタデータ) (2024-10-02T20:46:21Z) - Unveiling the Statistical Foundations of Chain-of-Thought Prompting Methods [59.779795063072655]
CoT(Chain-of-Thought)の促進とその変種は、多段階推論問題を解決する効果的な方法として人気を集めている。
統計的推定の観点からCoTのプロンプトを解析し,その複雑さを包括的に評価する。
論文 参考訳(メタデータ) (2024-08-25T04:07:18Z) - Scalable method for Bayesian experimental design without integrating
over posterior distribution [0.0]
実験問題のA-最適ベイズ設計における計算効率について検討する。
A-最適性はベイズの実験設計に広く用いられ、容易に解釈できる基準である。
本研究は, A-Optimal 実験設計における新しい可能性のないアプローチを提案する。
論文 参考訳(メタデータ) (2023-06-30T12:40:43Z) - Variational Sequential Optimal Experimental Design using Reinforcement Learning [0.0]
対OEDは、変分後部近似を用いた一点報酬の定式化を採用し、期待される情報ゲインに対する証明可能な低いバウンドを提供する。
我々は,既存の逐次実験設計アルゴリズムと比較して,サンプル効率が優れていることを示しながら,様々な工学・科学応用における vsOED の実証を行った。
論文 参考訳(メタデータ) (2023-06-17T21:47:19Z) - Metrics for Bayesian Optimal Experiment Design under Model
Misspecification [3.04585143845864]
ユーティリティ関数は、共通ユーティリティ関数が情報ゲインである実験の目的を定義する。
この記事では、従来の期待情報獲得基準を超えて、このプロセスのための拡張されたフレームワークを紹介します。
フレームワークの機能は、線形化スプリングマッサーダンパーシステムとF-16モデルを含むシナリオに適用することで紹介される。
論文 参考訳(メタデータ) (2023-04-17T02:13:20Z) - Design Amortization for Bayesian Optimal Experimental Design [70.13948372218849]
予測情報ゲイン(EIG)のバウンダリに関してパラメータ化された変分モデルを最適化する。
実験者が1つの変分モデルを最適化し、潜在的に無限に多くの設計に対してEIGを推定できる新しいニューラルアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-10-07T02:12:34Z) - Planning with Diffusion for Flexible Behavior Synthesis [125.24438991142573]
我々は、できるだけ多くの軌道最適化パイプラインをモデリング問題に折り畳むことがどう見えるか検討する。
我々の技術的アプローチの核心は、軌道を反復的にデノベーションすることで計画する拡散確率モデルにある。
論文 参考訳(メタデータ) (2022-05-20T07:02:03Z) - Gradient-based Bayesian Experimental Design for Implicit Models using
Mutual Information Lower Bounds [20.393359858407162]
ベイズ実験設計のためのフレームワーク(BED)を暗黙のモデルで導入する。データ生成分布は難解だが、そこからのサンプリングは可能である。
このようなモデルに最適な実験設計を見つけるために、ニューラルネットワークがパラメータとする相互情報の低い境界を最大化します。
ニューラルネットワークをサンプルデータ上でトレーニングすることで,勾配アセンシングを用いたネットワークパラメータと設計を同時に更新する。
論文 参考訳(メタデータ) (2021-05-10T13:59:25Z) - Optimal Bayesian experimental design for subsurface flow problems [77.34726150561087]
本稿では,設計ユーティリティ機能のためのカオス拡張サロゲートモデル(PCE)の開発のための新しいアプローチを提案する。
この手法により,対象関数に対する適切な品質応答面の導出が可能となり,計算予算は複数の単点評価に匹敵する。
論文 参考訳(メタデータ) (2020-08-10T09:42:59Z) - Machine learning for causal inference: on the use of cross-fit
estimators [77.34726150561087]
より優れた統計特性を得るために、二重ローバストなクロスフィット推定器が提案されている。
平均因果効果(ACE)に対する複数の推定器の性能評価のためのシミュレーション研究を行った。
機械学習で使用する場合、二重確率のクロスフィット推定器は、バイアス、分散、信頼区間のカバレッジで他のすべての推定器よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-04-21T23:09:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。