論文の概要: Design of experiments for the calibration of history-dependent models
via deep reinforcement learning and an enhanced Kalman filter
- arxiv url: http://arxiv.org/abs/2209.13126v1
- Date: Tue, 27 Sep 2022 02:56:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 16:01:44.647788
- Title: Design of experiments for the calibration of history-dependent models
via deep reinforcement learning and an enhanced Kalman filter
- Title(参考訳): 深層強化学習と拡張カルマンフィルタを用いた歴史依存モデルの校正実験の設計
- Authors: Ruben Villarreal, Nikolaos N. Vlassis, Nhon N. Phan, Tommie A.
Catanach, Reese E. Jones, Nathaniel A. Trask, Sharlotte L.B. Kramer, WaiChing
Sun
- Abstract要約: 本稿では,Kalmanフィルタ(KF)を用いて得られたKulback-Leibler分散による情報ゲインを最大化する実験設計のための深層強化学習アルゴリズムを提案する。
決定木とマルコフ決定プロセス (MDP) として実験の可能な構成を定式化し、各段階ごとに有限な行動選択が可能である。
前方予測のための仮説をテストするために追加サンプリングを必要とするナッシュ・サトクリフ効率(NSE)指数とは対照的に、KFは追加アクションによって得られた新しいデータの値を直接推定することで、実験のコストを下げることができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Experimental data is costly to obtain, which makes it difficult to calibrate
complex models. For many models an experimental design that produces the best
calibration given a limited experimental budget is not obvious. This paper
introduces a deep reinforcement learning (RL) algorithm for design of
experiments that maximizes the information gain measured by Kullback-Leibler
(KL) divergence obtained via the Kalman filter (KF). This combination enables
experimental design for rapid online experiments where traditional methods are
too costly. We formulate possible configurations of experiments as a decision
tree and a Markov decision process (MDP), where a finite choice of actions is
available at each incremental step. Once an action is taken, a variety of
measurements are used to update the state of the experiment. This new data
leads to a Bayesian update of the parameters by the KF, which is used to
enhance the state representation. In contrast to the Nash-Sutcliffe efficiency
(NSE) index, which requires additional sampling to test hypotheses for forward
predictions, the KF can lower the cost of experiments by directly estimating
the values of new data acquired through additional actions. In this work our
applications focus on mechanical testing of materials. Numerical experiments
with complex, history-dependent models are used to verify the implementation
and benchmark the performance of the RL-designed experiments.
- Abstract(参考訳): 実験データを得るにはコストがかかるため、複雑なモデルのキャリブレーションが難しい。
多くのモデルでは、限られた実験予算で最適なキャリブレーションを生成する実験的な設計は明らかではない。
本稿では,Kalmanフィルタ(KF)を用いて得られたKulback-Leibler(KL)分散度を最大化する実験設計のための深部強化学習(RL)アルゴリズムを提案する。
この組み合わせは、従来の手法が高価すぎる高速オンライン実験のための実験的な設計を可能にする。
実験の可能な構成を決定木とマルコフ決定プロセス(mdp)として定式化し、各段階ごとに有限個のアクションの選択が可能となる。
アクションが実行されると、実験の状態を更新するためにさまざまな測定値が使用される。
この新たなデータは、状態表現を強化するために使用されるKFによるパラメータのベイズ的更新につながる。
前方予測のための仮説をテストするために追加サンプリングを必要とするナッシュ・サトクリフ効率(NSE)指数とは対照的に、KFは追加アクションによって得られた新しいデータの値を直接推定することで、実験のコストを下げることができる。
本研究では, 材料の機械的試験に着目する。
複雑で履歴に依存したモデルを用いた数値実験は、rlで設計された実験の実装とベンチマークに使用される。
関連論文リスト
- Learning Coupled Subspaces for Multi-Condition Spike Data [8.114880112033644]
神経科学では、研究者は複数の条件下で実験を行い、高次元スパイクトレインデータセットの形で神経応答を得る。
実験条件空間上でスムーズなチューニング関数を学習するための非パラメトリックベイズ手法を提案する。
論文 参考訳(メタデータ) (2024-10-24T20:44:28Z) - Adaptive Instrument Design for Indirect Experiments [48.815194906471405]
RCTとは異なり、間接的な実験は条件付き機器変数を利用して治療効果を推定する。
本稿では,データ収集ポリシーを適応的に設計することで,間接実験におけるサンプル効率の向上に向けた最初のステップについて述べる。
我々の主な貢献は、影響関数を利用して最適なデータ収集ポリシーを探索する実用的な計算手順である。
論文 参考訳(メタデータ) (2023-12-05T02:38:04Z) - Value function estimation using conditional diffusion models for control [62.27184818047923]
拡散値関数(DVF)と呼ばれる単純なアルゴリズムを提案する。
拡散モデルを用いて環境-ロボット相互作用の連成多段階モデルを学ぶ。
本稿では,DVFを用いて複数のコントローラの状態を効率よく把握する方法を示す。
論文 参考訳(メタデータ) (2023-06-09T18:40:55Z) - Machine learning enabled experimental design and parameter estimation
for ultrafast spin dynamics [54.172707311728885]
機械学習とベイズ最適実験設計(BOED)を組み合わせた方法論を提案する。
本手法は,大規模スピンダイナミクスシミュレーションのためのニューラルネットワークモデルを用いて,BOEDの正確な分布と実用計算を行う。
数値ベンチマークでは,XPFS実験の誘導,モデルパラメータの予測,実験時間内でのより情報的な測定を行う上で,本手法の優れた性能を示す。
論文 参考訳(メタデータ) (2023-06-03T06:19:20Z) - Sequential Experimental Design for Spectral Measurement: Active Learning
Using a Parametric Model [1.9377646956063705]
分光測定では, 試料の脆性や高エネルギーコストのため, 測定時間を短縮する必要がある。
本研究では,パラメトリックモデルを用いた能動学習によるスペクトル測定の逐次的実験設計について述べる。
論文 参考訳(メタデータ) (2023-05-11T13:21:26Z) - Online simulator-based experimental design for cognitive model selection [74.76661199843284]
本稿では,抽出可能な確率を伴わない計算モデルを選択する実験設計手法BOSMOSを提案する。
シミュレーション実験では,提案手法により,既存のLFI手法に比べて最大2桁の精度でモデルを選択することができることを示した。
論文 参考訳(メタデータ) (2023-03-03T21:41:01Z) - Optimised Bayesian system identification in quantum devices [3.72081359624651]
本研究では,未知パラメータを動的モデルで推定する閉ループベイズ学習アルゴリズムを提案する。
シミュレーションキャリブレーションタスクと実験用シングルキュービットイオントラップシステムの両方でアルゴリズムの性能を実証する。
論文 参考訳(メタデータ) (2022-11-16T18:12:46Z) - Design Amortization for Bayesian Optimal Experimental Design [70.13948372218849]
予測情報ゲイン(EIG)のバウンダリに関してパラメータ化された変分モデルを最適化する。
実験者が1つの変分モデルを最適化し、潜在的に無限に多くの設計に対してEIGを推定できる新しいニューラルアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-10-07T02:12:34Z) - Cognitive simulation models for inertial confinement fusion: Combining
simulation and experimental data [0.0]
研究者は、高性能な爆発を求めて設計空間を探索するためにコンピュータシミュレーションに大きく依存しています。
より効果的な設計と調査のために、シミュレーションは過去の実験データからの入力を必要とする。
本稿では,シミュレーションと実験データを共通の予測モデルに組み合わせた認知シミュレーション手法について述べる。
論文 参考訳(メタデータ) (2021-03-19T02:00:14Z) - Predicting Performance for Natural Language Processing Tasks [128.34208911925424]
実験条件を入力として,NLP実験の評価スコアを予測する回帰モデルを構築した。
9つの異なるNLPタスクを実験した結果、予測器は目に見えない言語や異なるモデリングアーキテクチャに対して有意義な予測を生成できることがわかった。
論文 参考訳(メタデータ) (2020-05-02T16:02:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。