論文の概要: AutoStan: Autonomous Bayesian Model Improvement via Predictive Feedback
- arxiv url: http://arxiv.org/abs/2603.27766v1
- Date: Sun, 29 Mar 2026 16:58:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.107099
- Title: AutoStan: Autonomous Bayesian Model Improvement via Predictive Feedback
- Title(参考訳): AutoStan:予測フィードバックによる自動ベイズモデルの改善
- Authors: Oliver Dürr,
- Abstract要約: AutoStanは、コマンドラインインターフェイス(CLI)コーディングエージェントが自律的に構築し、Stanで書かれたベイズモデルを反復的に改善するフレームワークである。
多様なモデリング構造を持つ5つのデータセット上でAutoStanを評価する。
- 参考スコア(独自算出の注目度): 0.38073142980733005
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present AutoStan, a framework in which a command-line interface (CLI) coding agent autonomously builds and iteratively improves Bayesian models written in Stan. The agent operates in a loop, writing a Stan model file, executing MCMC sampling, then deciding whether to keep or revert each change based on two complementary feedback signals: the negative log predictive density (NLPD) on held-out data and the sampler's own diagnostics (divergences, R-hat, effective sample size). We evaluate AutoStan on five datasets with diverse modeling structures. On a synthetic regression dataset with outliers, the agent progresses from naive linear regression to a model with Student-t robustness, nonlinear heteroscedastic structure, and an explicit contamination mixture, matching or outperforming TabPFN, a state-of-the-art black-box method, while remaining fully interpretable. Across four additional experiments, the same mechanism discovers hierarchical partial pooling, varying-slope models with correlated random effects, and a Poisson attack/defense model for soccer. No search algorithm, critic module, or domain-specific instructions are needed. This is, to our knowledge, the first demonstration that a CLI coding agent can autonomously write and iteratively improve Stan code for diverse Bayesian modeling problems.
- Abstract(参考訳): 本稿では,コマンドラインインタフェース(CLI)コーディングエージェントが,Stanで記述されたベイズモデルを自動構築し,反復的に改善するフレームワークであるAutoStanを提案する。
エージェントはループ内で動作し、Stanモデルファイルを書き、MCMCサンプリングを実行し、2つの相補的なフィードバック信号、すなわちホールドアウトデータ上の負の対数予測密度(NLPD)とサンプリング者自身の診断(分割、R-hat、有効サンプルサイズ)に基づいて各変更を維持または反転するかを決定する。
多様なモデリング構造を持つ5つのデータセット上でAutoStanを評価する。
外接点を持つ合成回帰データセットにおいて, エージェントは, 単純線形回帰から, 学生tの頑健性, 非線形異性体構造, 明示的な汚染混合モデルへと進展する。
その他の4つの実験で、同じメカニズムが階層的な部分プール、相関するランダム効果を持つ様々な斜面モデル、サッカーに対するポアソン攻撃/防御モデルを発見する。
検索アルゴリズム、批評家モジュール、ドメイン固有の命令は必要ない。
これは、我々の知る限り、CLIコーディングエージェントが様々なベイズモデリング問題に対してStanコードを自律的に書き、反復的に改善できる最初のデモンストレーションである。
関連論文リスト
- Every Step Counts: Decoding Trajectories as Authorship Fingerprints of dLLMs [63.82840470917859]
本稿では,dLLMの復号化機構をモデル属性の強力なツールとして利用できることを示す。
本稿では、デコードステップ間の構造的関係を捉え、モデル固有の振る舞いをよりよく明らかにする、DDM(Directed Decoding Map)と呼ばれる新しい情報抽出手法を提案する。
論文 参考訳(メタデータ) (2025-10-02T06:25:10Z) - Datarus-R1: An Adaptive Multi-Step Reasoning LLM for Automated Data Analysis [0.0]
本稿では,Qwen 2.5-14B-Instructの言語モデルであるDatarus-R1-14Bを提案する。
Datarusは、独立した問合せペアではなく、推論ステップ、コード実行、エラートレース、自己補正、最終的な結論を含む完全な分析トラジェクトリに基づいて訓練されている。
論文 参考訳(メタデータ) (2025-08-18T21:58:18Z) - Generalization is not a universal guarantee: Estimating similarity to training data with an ensemble out-of-distribution metric [0.09363323206192666]
機械学習モデルの新しいデータへの一般化の失敗は、AIシステムの信頼性を制限する中核的な問題である。
本稿では、一般化可能性推定(SAGE)のための教師付きオートエンコーダを構築することにより、データの類似性を評価するための標準化されたアプローチを提案する。
モデル自体のトレーニングやテストデータセットのデータに適用しても,SAGEスコアのフィルタリング後にアウト・オブ・ボックスモデルの性能が向上することを示す。
論文 参考訳(メタデータ) (2025-02-22T19:21:50Z) - Revisiting the Evaluation of Image Synthesis with GANs [55.72247435112475]
本研究では, 合成性能の評価に関する実証的研究を行い, 生成モデルの代表としてGAN(Generative Adversarial Network)を用いた。
特に、表現空間におけるデータポイントの表現方法、選択したサンプルを用いた公平距離の計算方法、各集合から使用可能なインスタンス数など、さまざまな要素の詳細な分析を行う。
論文 参考訳(メタデータ) (2023-04-04T17:54:32Z) - CARMS: Categorical-Antithetic-REINFORCE Multi-Sample Gradient Estimator [60.799183326613395]
本稿では, 相互に負に相関した複数のサンプルに基づく分類的確率変数の非バイアス推定器を提案する。
CARMSは、ReINFORCEとコプラベースのサンプリングを組み合わせることで、重複サンプルを回避し、その分散を低減し、重要サンプリングを使用して推定器を偏りなく維持する。
我々は、生成的モデリングタスクと構造化された出力予測タスクに基づいて、いくつかのベンチマークデータセット上でCARMSを評価し、強力な自己制御ベースラインを含む競合する手法より優れていることを示す。
論文 参考訳(メタデータ) (2021-10-26T20:14:30Z) - Validation and Inference of Agent Based Models [0.0]
Agent Based Modelling (ABM) は自律エージェントの動作と相互作用をシミュレーションするための計算フレームワークである。
ABCの最近の研究は、近似確率を計算するためのアルゴリズムをますます効率的にしている。
これらをハミルトンCBDの歩行者モデルを用いて検討・比較した。
論文 参考訳(メタデータ) (2021-07-08T05:53:37Z) - Anomaly Detection of Time Series with Smoothness-Inducing Sequential
Variational Auto-Encoder [59.69303945834122]
Smoothness-Inducing Sequential Variational Auto-Encoder (SISVAE) モデルを提案する。
我々のモデルは、フレキシブルニューラルネットワークを用いて各タイムスタンプの平均と分散をパラメータ化する。
合成データセットと公開実世界のベンチマークの両方において,本モデルの有効性を示す。
論文 参考訳(メタデータ) (2021-02-02T06:15:15Z) - Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。
我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。
その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文 参考訳(メタデータ) (2020-10-12T03:27:07Z) - On the Discrepancy between Density Estimation and Sequence Generation [92.70116082182076]
log-likelihoodは、同じファミリー内のモデルを考えるとき、BLEUと非常に相関している。
異なる家族間でのモデルランキングの相関はみられない。
論文 参考訳(メタデータ) (2020-02-17T20:13:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。