論文の概要: AI4BayesCode: From Natural Language Descriptions to Validated Modular Stateful Bayesian Samplers
- arxiv url: http://arxiv.org/abs/2605.18476v1
- Date: Mon, 18 May 2026 14:31:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:49.792619
- Title: AI4BayesCode: From Natural Language Descriptions to Validated Modular Stateful Bayesian Samplers
- Title(参考訳): AI4BayesCode: 自然言語記述からモジュール化されたステートフルなベイズサンプリングへ
- Authors: Jungang Zou, Alex Ziyu Jiang, Qixuan Chen,
- Abstract要約: 我々は、自然言語モデル記述を実行可能で検証可能なMCMCサンプルに翻訳するシステムであるAI4BayesCodeを紹介する。
信頼性を向上させるため、AI4BayesCodeでは、モデルをモジュール化されたサンプリングブロックに分解し、各ブロックを組み込みのサンプリングコンポーネントにマップするモジュール設計を採用している。
我々は、AI4BayesCodeが自然言語記述のみから幅広いベイズモデルを実装することができることを示す。
- 参考スコア(独自算出の注目度): 0.28675177318965045
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Coding and computation remain major bottlenecks in Markov chain Monte Carlo (MCMC) workflows, especially as modern sampling algorithms have become increasingly complex and existing probabilistic programming systems remain limited in model support, extensibility, and composability. We introduce \textbf{AI4BayesCode}, an extensible LLM-driven system that translates natural-language Bayesian model descriptions into runnable, validated MCMC samplers. To improve reliability, AI4BayesCode adopts a modular design that decomposes models into modular sampling blocks and maps each block to a built-in sampling component, reducing the need to implement complex sampling algorithms from scratch. Reliability is further improved through pre-generation validation of model specifications and post-generation validation of generated sampler code. AI4BayesCode also introduces a novel recursively stateful coding paradigm for MCMC, allowing modular sampling components, potentially developed by different contributors, to be composed coherently within larger MCMC procedures. We develop a benchmark suite to evaluate AI4BayesCode for sampler-generation. Experiments show that AI4BayesCode can implement a wide range of Bayesian models from natural-language descriptions alone. As an open-ended system, its capability can continue to expand with improvements in the underlying AI agent and the addition of new built-in blocks.
- Abstract(参考訳): 符号化と計算はマルコフ連鎖モンテカルロ(MCMC)のワークフローの主要なボトルネックであり、特に現代のサンプリングアルゴリズムは複雑化しており、既存の確率的プログラミングシステムはモデルサポート、拡張性、コンポーザビリティに限られている。
我々は、自然言語ベイズモデル記述を実行可能で検証可能なMCMCサンプルに変換する拡張可能なLLM駆動システムである「textbf{AI4BayesCode}」を紹介した。
信頼性を向上させるため、AI4BayesCodeでは、モデルをモジュラーサンプリングブロックに分解し、各ブロックを組み込みサンプリングコンポーネントにマップするモジュール設計を採用しており、複雑なサンプリングアルゴリズムをスクラッチから実装する必要がない。
モデル仕様のプレジェネレーション検証と生成したサンプルコードのポストジェネレーション検証により、信頼性をさらに向上する。
AI4BayesCodeはまた、MCMCの新たな再帰的ステートフルコーディングパラダイムを導入し、異なるコントリビュータによって開発される可能性のあるモジュラーサンプリングコンポーネントを、より大きなMCMCプロシージャ内でコヒーレントに構成できるようにする。
サンプル生成のためのAI4BayesCodeを評価するベンチマークスイートを開発した。
実験によると、AI4BayesCodeは自然言語記述だけで幅広いベイズモデルを実装することができる。
オープンエンドシステムとして、基盤となるAIエージェントの改善と、新たな組み込みブロックの追加により、その能力は拡大を続けることができる。
関連論文リスト
- Steerable Instruction Following Coding Data Synthesis with Actor-Parametric Schema Co-Evolution [30.919665619254]
IFCodeEvolveは,大規模命令ペアプログラミングデータを合成するフレームワークである。
IFCodeEvolveはベースモデルの性能を大幅に向上させ,我々の32BモデルはプロプライエタリなSOTAモデルと同等であることを示す。
我々はまた、ソリューションと堅牢なASTベースの検証を備えた総合的人間認証ベンチマークIFCodeBenchにも貢献する。
論文 参考訳(メタデータ) (2026-02-27T21:31:41Z) - ComplexVCoder: An LLM-Driven Framework for Systematic Generation of Complex Verilog Code [11.498491832975299]
本稿では,複雑なVerilogコードの生成品質と効率を向上させるオープンソースフレームワークであるComplexVCoderを提案する。
具体的には、中間表現を利用した2段階生成機構を導入し、より構造化された自然言語記述から複雑なVerilog設計への遷移を可能にする。
さらに、ルールベースのアライメント手法とドメイン固有検索拡張生成(RAG)を導入し、合成コードの正確性をさらに向上する。
論文 参考訳(メタデータ) (2025-04-29T11:22:06Z) - Syntactic and Semantic Control of Large Language Models via Sequential Monte Carlo [90.78001821963008]
広い範囲のLMアプリケーションは、構文的制約や意味論的制約に適合するテキストを生成する必要がある。
我々は、連続モンテカルロ(SMC)に基づく制御LM生成のためのアーキテクチャを開発する。
我々のシステムはLew et al. (2023) のフレームワーク上に構築されており、言語モデル確率型プログラミング言語と統合されている。
論文 参考訳(メタデータ) (2025-04-17T17:49:40Z) - Optimizing Case-Based Reasoning System for Functional Test Script Generation with Large Language Models [18.24326624696047]
テスト意図記述とそれに対応するテストスクリプトのケースバンクを保守し活用するケースベース推論(CBR)システムを提案する。
ユーザエクスペリエンスをさらに向上するために,再ランクベースの検索微調整と再利用微調整を併用したCBRシステムの最適化手法であるRe4を導入する。
論文 参考訳(メタデータ) (2025-03-26T14:23:59Z) - CodeChain: Towards Modular Code Generation Through Chain of Self-revisions with Representative Sub-modules [51.82044734879657]
我々は,自己修正の連鎖を通じてモジュール化されたコード生成を誘発する,新しい推論フレームワークであるCodeChainを提案する。
CodeChainは、生成したソリューションのモジュール性と正確性の両方を大幅に向上させ、APPSで35%、CodeContestsで76%の相対パス@1の改善を実現しています。
論文 参考訳(メタデータ) (2023-10-13T10:17:48Z) - Sequential Monte Carlo Steering of Large Language Models using
Probabilistic Programs [46.721838623748816]
本研究では,大規模言語モデルの出力に対する構文的制約と意味的制約を強制する新しい推論時手法を提案する。
主要なアイデアは、言語生成タスクを離散確率列モデルのクラスにおける後部推論問題として指定することである。
ビームサーチと同様の計算コストのために、SMCは多様なタスクを解決するためにLSMを操ることができる。
論文 参考訳(メタデータ) (2023-06-05T17:55:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。