論文の概要: The Value of Mechanistic Priors in Sequential Decision Making
- arxiv url: http://arxiv.org/abs/2605.10018v1
- Date: Mon, 11 May 2026 05:43:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.552289
- Title: The Value of Mechanistic Priors in Sequential Decision Making
- Title(参考訳): シークエンシャル意思決定におけるメカニスティックプライオリティの価値
- Authors: Itai Shufaro, Gal Benor, Shie Mannor,
- Abstract要約: ハイブリッド・メカニスティック・モデル、学習された残差を持つ物理的先行性は、良い決定に必要なデータを減らすことを約束するが、これをテストするための計算可能な基準は存在しない。
両体制とも, 逐次意思決定におけるメカニスティックな先駆的価値を特徴づける。
- 参考スコア(独自算出の注目度): 41.418304743101174
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Hybrid mechanistic models, physical priors with learned residuals, promise to reduce the data required for good decisions, but have no computable criterion to test this. We characterize the value of mechanistic priors in sequential decision-making within both asymptotic and burn-in regimes. To formalize this, we introduce the mechanistic information of a model -- the mutual information between the model's recommended policy $\hatπ$ and the true optimal policy $π^*$ -- quantified via an occupancy-weighted bias $B_μ$. In the asymptotic regime (large $N$), matched bounds reveal that Bayesian regret scales with the residual entropy $H_{\mathrm{mech}}$, delivering a theoretical sample complexity reduction of $H(μ)/H_{\mathrm{mech}}$ compared to an uninformed baseline. Furthermore, we provide a model certificate to determine empirical sample efficiency. Complementarily, in the clinically relevant burn-in regime (small $N$), we establish a lower bound on the penalty incurred by confidently wrong priors. We demonstrate both the asymptotic and burn-in bounds across 5-fluorouracil (5-FU) dosing simulations motivated by published FOLFOX pharmacokinetic data, where a hybrid prior yields large sample-efficiency gains in the burn-in regime. Finally, we contrast these grounded models with LLM priors, demonstrating that LLMs can suffer severe losses in mechanistic information, thereby motivating the exclusive use of physically-grounded priors for safety-critical applications.
- Abstract(参考訳): ハイブリッド・メカニスティック・モデル、学習された残差を持つ物理的先行性は、良い決定に必要なデータを減らすことを約束するが、これをテストするための計算可能な基準は存在しない。
我々は、漸近的およびバーンイン的体制の双方において、逐次的な意思決定におけるメカニスティックな先駆的価値を特徴づける。
これを形式化するために、モデルの力学情報(モデル推奨ポリシー$\hatπ$と真の最適ポリシー$π^*$の相互情報)を、占有重み付きバイアス$B_μ$で定量化する。
漸近的状態 (大きな$N$) において、一致した境界は、ベイズ的後悔は残エントロピー$H_{\mathrm{mech}}$とスケールし、非インフォームベースラインと比較して、理論的なサンプル複雑性を$H(μ)/H_{\mathrm{mech}}$に還元することを示した。
さらに、実験サンプル効率を決定するためのモデル証明書を提供する。
臨床的に関係のあるバーンイン体制(小額のN$)では、確実な誤りにより生じるペナルティの限界を低く設定する。
本研究では, 5-フルオロウラシル (5-FU) ドスリングシミュレーションを併用して, 5-フルオロウラシル (5-FU) ドスティング法における漸近的およびバーンインバウンドの双方について実験を行った。
最後に,これらの基礎モデルとLLM先行モデルとの対比を行い,LLMが機械的情報に深刻な損失を被ることを示した。
関連論文リスト
- $V_{0.5}$: Generalist Value Model as a Prior for Sparse RL Rollouts [81.48669089692189]
一般値モデル(例えば$V_0.5$)は、コンテキスト内のモデル機能を明示的にエンコードすることで、事前訓練された値推定を実現する。
本稿では,このような値モデルにより予測されるベースラインと,スパースロールアウトから導出される経験的平均とを適応的に融合する$V_0.5$を提案する。
V_0.5$はGRPOとDAPOを大きく上回り、より高速な収束と約10%のパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2026-03-11T14:57:41Z) - On the Asymptotic Mean Square Error Optimality of Diffusion Models [10.72484143420088]
生成前駆体としての拡散モデル(DM)は近年,タスクを認知する大きな可能性を示している。
本稿では, MSE-Optimal Conditional mean (CME) の構造から着想を得た新しい認知戦略を提案する。
結果のDMベースのデノイザは、トレーニング済みのDMを用いて便利に使用することができ、特に逆拡散ステップをトラッピングすることで高速である。
論文 参考訳(メタデータ) (2024-03-05T13:25:44Z) - Self-Supervised Dataset Distillation for Transfer Learning [77.4714995131992]
ラベルなしデータセットを、効率的な自己教師付き学習(SSL)のための小さな合成サンプル群に蒸留する新しい問題を提案する。
両レベル最適化におけるSSL目標に対する合成サンプルの勾配は、データ拡張やマスキングから生じるランダム性から、テキストバイアスを受けていることを最初に証明する。
転送学習を含む様々な応用における本手法の有効性を実証的に検証する。
論文 参考訳(メタデータ) (2023-10-10T10:48:52Z) - Maximum Likelihood Learning of Unnormalized Models for Simulation-Based
Inference [44.281860162298564]
シミュレーションベース推論のための2つの合成確率法を提案する。
本研究では,シミュレータによって生成された合成データを用いて,条件付きエネルギーベースモデル(EBM)を学習する。
本研究は, カニの神経科学ネットワークのモデルに適用し, 各種合成データセット上での両手法の特性を実証する。
論文 参考訳(メタデータ) (2022-10-26T14:38:24Z) - Inverting brain grey matter models with likelihood-free inference: a
tool for trustable cytoarchitecture measurements [62.997667081978825]
脳の灰白質細胞構造の特徴は、体密度と体積に定量的に敏感であり、dMRIでは未解決の課題である。
我々は新しいフォワードモデル、特に新しい方程式系を提案し、比較的スパースなb殻を必要とする。
次に,提案手法を逆転させるため,確率自由推論 (LFI) として知られるベイズ解析から最新のツールを適用した。
論文 参考訳(メタデータ) (2021-11-15T09:08:27Z) - Machine Learning Product State Distributions from Initial Reactant
States for a Reactive Atom-Diatom Collision System [2.678461526933908]
特定の初期状態から製品状態の分布を予測する機械学習(ML)モデルを示す。
根平均二乗差によって定量化される予測精度は、テストセットおよびオフグリッド状態特定初期条件に対して高い。
STDモデルは非平衡高速流れのシミュレーションに適している。
論文 参考訳(メタデータ) (2021-11-05T15:36:27Z) - Variational Inference with NoFAS: Normalizing Flow with Adaptive
Surrogate for Computationally Expensive Models [7.217783736464403]
マルコフ連鎖モンテカルロのようなサンプリングに基づくアプローチの使用は、それぞれの可能性評価が計算的に高価であるときに難解になる可能性がある。
変分推論と正規化フローを組み合わせた新しいアプローチは、潜在変数空間の次元と線形にしか成長しない計算コストによって特徴づけられる。
本稿では,ニューラルネットワークサロゲートモデルの正規化フローパラメータと重みを代わりに更新する最適化戦略である,適応サロゲートを用いた正規化フロー(NoFAS)を提案する。
論文 参考訳(メタデータ) (2021-08-28T14:31:45Z) - Amortized Conditional Normalized Maximum Likelihood: Reliable Out of
Distribution Uncertainty Estimation [99.92568326314667]
本研究では,不確実性推定のための拡張性のある汎用的アプローチとして,償却条件正規化最大値(ACNML)法を提案する。
提案アルゴリズムは条件付き正規化最大度(CNML)符号化方式に基づいており、最小記述長の原理に従って最小値の最適特性を持つ。
我々は、ACNMLが、分布外入力のキャリブレーションの観点から、不確実性推定のための多くの手法と好意的に比較することを示した。
論文 参考訳(メタデータ) (2020-11-05T08:04:34Z) - On a computationally-scalable sparse formulation of the multidimensional
and non-stationary maximum entropy principle [0.0]
我々は、MaxEnt-principleの非定常定式化を導出し、その解が正規化によるスパース制約最適化問題の数値最大化によって近似可能であることを示す。
主要な7つのベンチマーク時系列は、条件付きメモリレスMaxEntモデルによりよりよく記述されていることを示す。
この分析は、異なる市場における正および負の潜伏変化に対する統計的に重要な時間的関係のスパースネットワークを明らかにしている。
論文 参考訳(メタデータ) (2020-05-07T05:22:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。