論文の概要: On the performance of machine-learning assisted Monte Carlo in sampling from simple statistical physics models
- arxiv url: http://arxiv.org/abs/2505.22598v1
- Date: Wed, 28 May 2025 17:13:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-29 17:35:50.755413
- Title: On the performance of machine-learning assisted Monte Carlo in sampling from simple statistical physics models
- Title(参考訳): 単純な統計物理モデルからのサンプリングにおける機械学習支援モンテカルロの性能について
- Authors: Luca Maria Del Bono, Federico Ricci-Tersenghi, Francesco Zamponi,
- Abstract要約: キュリー・ワイスモデルに対する浅いMADEアーキテクチャに適用した広範に使われている逐次テンパリング手法について検討する。
この研究は、モンテカルロのサンプリングと最適化に機械学習技術を統合するための明確な理論的基盤を確立する。
- 参考スコア(独自算出の注目度): 0.8192907805418583
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent years have seen a rise in the application of machine learning techniques to aid the simulation of hard-to-sample systems that cannot be studied using traditional methods. Despite the introduction of many different architectures and procedures, a wide theoretical understanding is still lacking, with the risk of suboptimal implementations. As a first step to address this gap, we provide here a complete analytic study of the widely-used Sequential Tempering procedure applied to a shallow MADE architecture for the Curie-Weiss model. The contribution of this work is twofold: firstly, we give a description of the optimal weights and of the training under Gradient Descent optimization. Secondly, we compare what happens in Sequential Tempering with and without the addition of local Metropolis Monte Carlo steps. We are thus able to give theoretical predictions on the best procedure to apply in this case. This work establishes a clear theoretical basis for the integration of machine learning techniques into Monte Carlo sampling and optimization.
- Abstract(参考訳): 近年,従来の手法では研究できないハード・トゥ・サンプルシステムのシミュレーションを支援するため,機械学習技術の応用が増加している。
多くの異なるアーキテクチャや手順が導入されたにも拘わらず、幅広い理論的理解はいまだに欠けており、準最適実装のリスクがある。
このギャップを解決するための第一歩として、キュリー・ワイスモデルのための浅いMADEアーキテクチャに適用された広く使われている逐次テンパリング手順について、完全な解析研究を行う。
この研究の貢献は2つある: まず、最適重みとグラディエント・ディクセント最適化の下でのトレーニングについて記述する。
次に、シークエンシャル・テンパリングで起きていることと、地元のモンテカルロのステップを追加せずに比較する。
したがって、この場合に適用する最善の手順に関する理論的予測をすることができる。
この研究は、モンテカルロのサンプリングと最適化に機械学習技術を統合するための明確な理論的基盤を確立する。
関連論文リスト
- Will Pre-Training Ever End? A First Step Toward Next-Generation Foundation MLLMs via Self-Improving Systematic Cognition [86.21199607040147]
自己改善認知(Self-Improving cognition、SIcog)は、次世代基礎言語モデルを構築するための自己学習フレームワークである。
ステップバイステップの視覚的理解手法であるChain-of-Descriptionを導入し、構造化連鎖推論(CoT)を統合し、深いマルチモーダル推論をサポートする。
広範囲にわたる実験により、SIcogはマルチモーダル認知を著しく改善した次世代基盤MLLMを生産することが示された。
論文 参考訳(メタデータ) (2025-03-16T00:25:13Z) - Inference-Time Alignment in Diffusion Models with Reward-Guided Generation: Tutorial and Review [59.856222854472605]
このチュートリアルは、拡散モデルにおける下流の報酬関数を最適化するための推論時ガイダンスとアライメント方法に関する詳細なガイドを提供する。
生物学のような分野における実践的な応用は、しばしば特定の指標を最大化するサンプル生成を必要とする。
本稿では,(1)推論時と組み合わせた微調整手法,(2)モンテカルロ木探索などの探索アルゴリズムに基づく推論時アルゴリズム,(3)言語モデルと拡散モデルにおける推論時アルゴリズムの接続について論じる。
論文 参考訳(メタデータ) (2025-01-16T17:37:35Z) - A Survey on Inference Optimization Techniques for Mixture of Experts Models [50.40325411764262]
大規模Mixture of Experts(MoE)モデルは、条件計算によるモデル容量と計算効率の向上を提供する。
これらのモデル上で推論をデプロイし実行することは、計算資源、レイテンシ、エネルギー効率において大きな課題を示す。
本調査では,システムスタック全体にわたるMoEモデルの最適化手法について分析する。
論文 参考訳(メタデータ) (2024-12-18T14:11:15Z) - SPO: Sequential Monte Carlo Policy Optimisation [41.52684912140086]
SPO:Sequential Monte Carlo Policy optimizationを紹介する。
我々は,SPOがロバストな政策改善と効率的なスケーリング特性を提供することを示した。
モデルフリーおよびモデルベースラインと比較して,統計的に有意な性能向上を示す。
論文 参考訳(メタデータ) (2024-02-12T10:32:47Z) - Variational Monte Carlo on a Budget -- Fine-tuning pre-trained Neural
Wavefunctions [5.145741425164946]
深層学習に基づく変分モンテカルロ(DL-VMC)は、最近、精度の点で従来の手法よりも優れているが、計算コストが大きい。
本稿では,大規模かつ化学的に多様な分子集合上での自己教師付き波動関数最適化を用いたDL-VMCモデルを提案する。
このモデルを最適化せずに新しい分子に適用すると、波動関数や絶対エネルギーが得られ、CCSD(T)-2Zのような確立された手法よりも優れる。
論文 参考訳(メタデータ) (2023-07-15T09:56:22Z) - Towards Constituting Mathematical Structures for Learning to Optimize [101.80359461134087]
近年,機械学習を利用してデータから最適化アルゴリズムを自動学習する技術が注目されている。
ジェネリックL2Oアプローチは反復更新ルールをパラメータ化し、ブラックボックスネットワークとして更新方向を学ぶ。
一般的なアプローチは広く適用できるが、学習されたモデルは過度に適合し、配布外テストセットにうまく一般化できない。
本稿では, 分布外問題に対して広く適用でき, 一般化された, 数学に着想を得た構造を持つ新しいL2Oモデルを提案する。
論文 参考訳(メタデータ) (2023-05-29T19:37:28Z) - Learning Lattice Quantum Field Theories with Equivariant Continuous
Flows [10.124564216461858]
格子場理論の高次元確率分布から抽出する機械学習手法を提案する。
提案手法を$phi4$理論で検証し,提案したフローベース手法のサンプリング効率を体系的に上回っていることを示す。
論文 参考訳(メタデータ) (2022-07-01T09:20:05Z) - Macroscopic Traffic Flow Modeling with Physics Regularized Gaussian
Process: Generalized Formulations [5.827236278192557]
本研究では,物理正規化ガウス過程(PRGP)という新しいモデリングフレームワークを提案する。
この新しいアプローチは、物理モデル、すなわち古典的なトラフィックフローモデルをガウスのプロセスアーキテクチャにエンコードし、機械学習のトレーニングプロセスを規則化する。
提案手法の有効性を証明するため,ユタ州I-15高速道路から収集した実世界のデータセットについて実験的検討を行った。
論文 参考訳(メタデータ) (2020-07-14T17:27:23Z) - Guided Learning of Nonconvex Models through Successive Functional
Gradient Optimization [22.603803397940133]
本稿では,ニューラルネットワークのような非機能モデルに対する勾配最適化のためのフレームワークを提案する。
この枠組みから導出した理論的解析手法を提案する。
論文 参考訳(メタデータ) (2020-06-30T14:31:24Z) - A Dynamical Systems Approach for Convergence of the Bayesian EM
Algorithm [59.99439951055238]
我々は、(離散時間)リアプノフ安定性理論が、必ずしも勾配ベースではない最適化アルゴリズムの分析(および潜在的な設計)において、いかに強力なツールとして役立つかを示す。
本稿では,不完全データベイズフレームワークにおけるパラメータ推定を,MAP-EM (maximum a reari expectation-maximization) と呼ばれる一般的な最適化アルゴリズムを用いて行うことに着目したML問題について述べる。
高速収束(線形あるいは二次的)が達成され,S&Cアプローチを使わずに発表することが困難であった可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-23T01:34:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。