論文の概要: How many simulations do we need for simulation-based inference in cosmology?
- arxiv url: http://arxiv.org/abs/2503.13755v1
- Date: Mon, 17 Mar 2025 22:21:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-19 14:15:20.966319
- Title: How many simulations do we need for simulation-based inference in cosmology?
- Title(参考訳): 宇宙論におけるシミュレーションに基づく推論には、いくつのシミュレーションが必要か?
- Authors: Anirban Bairagi, Benjamin Wandelt, Francisco Villaescusa-Navarro,
- Abstract要約: 現在利用可能な2000のシミュレーションを備えたQuijote Latin Hypercube(LH)のようなシミュレーションスイートは、汎用ニューラルネットワークが最適な状態に達するための十分なトレーニングデータを提供していないことを示す。
我々は、宇宙論における最大の公開シミュレーションデータセットであるBig Sobol Sequence(BSQ)を作成し、32,768ドルのLambda$CDM n-bodyシミュレーションにより、$Lambda$CDMパラメータ空間を均一にカバーしている。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: How many simulations do we need to train machine learning methods to extract information available from summary statistics of the cosmological density field? Neural methods have shown the potential to extract non-linear information available from cosmological data. Success depends critically on having sufficient simulations for training the networks and appropriate network architectures. In the first detailed convergence study of neural network training for cosmological inference, we show that currently available simulation suites, such as the Quijote Latin Hypercube(LH) with 2000 simulations, do not provide sufficient training data for a generic neural network to reach the optimal regime, even for the dark matter power spectrum, and in an idealized case. We discover an empirical neural scaling law that predicts how much information a neural network can extract from a highly informative summary statistic, the dark matter power spectrum, as a function of the number of simulations used to train the network, for a wide range of architectures and hyperparameters. We combine this result with the Cramer-Rao information bound to forecast the number of training simulations needed for near-optimal information extraction. To verify our method we created the largest publicly released simulation data set in cosmology, the Big Sobol Sequence(BSQ), consisting of 32,768 $\Lambda$CDM n-body simulations uniformly covering the $\Lambda$CDM parameter space. Our method enables efficient planning of simulation campaigns for machine learning applications in cosmology, while the BSQ dataset provides an unprecedented resource for studying the convergence behavior of neural networks in cosmological parameter inference. Our results suggest that new large simulation suites or new training approaches will be necessary to achieve information-optimal parameter inference from non-linear simulations.
- Abstract(参考訳): 宇宙密度場の要約統計から利用可能な情報を抽出するために、機械学習手法を訓練するには、いくつのシミュレーションが必要か?
ニューラルネットワークは、宇宙データから利用可能な非線形情報を抽出する可能性を示している。
成功は、ネットワークと適切なネットワークアーキテクチャをトレーニングするための十分なシミュレーションを持つことに大きく依存する。
宇宙論的推論のためのニューラルネットワークトレーニングに関する最初の詳細なコンバージェンス研究において、2000のシミュレーションで利用可能なQuijote Latin Hypercube(LH)のようなシミュレーションスイートは、ダークマターパワースペクトルや理想化された場合であっても、汎用ニューラルネットワークが最適状態に達するのに十分なトレーニングデータを提供していないことを示した。
我々は,ニューラルネットワークが高情報な要約統計量,ダークマターパワースペクトルからどれだけの情報を抽出できるかを,広範囲のアーキテクチャやハイパーパラメータに対して,ネットワークをトレーニングするために使用するシミュレーションの数を関数として予測する経験的ニューラルネットワークスケーリング法を発見した。
この結果と、クレーマー・ラオ情報とを組み合わせて、準最適情報抽出に必要なトレーニングシミュレーション数の予測を行う。
提案手法を検証するため, 宇宙論における最大の公開シミュレーションデータセットであるBig Sobol Sequence(BSQ)を作成し, 32,768$\Lambda$CDM n-body シミュレーションを行った。
BSQデータセットは、宇宙論パラメータ推論におけるニューラルネットワークの収束挙動を研究するための前例のない資源を提供する一方、宇宙論における機械学習応用のためのシミュレーションキャンペーンの効率的な計画を可能にする。
この結果から,非線形シミュレーションから情報最適パラメータ推定を実現するためには,新たな大規模シミュレーションスイートや新たなトレーニングアプローチが必要であることが示唆された。
関連論文リスト
- GausSim: Foreseeing Reality by Gaussian Simulator for Elastic Objects [55.02281855589641]
GausSimは、ガウスカーネルを通して表現される現実の弾性物体の動的挙動をキャプチャするために設計された、ニューラルネットワークベースの新しいシミュレータである。
我々は連続体力学を活用し、各カーネルを連続体を表すCenter of Mass System (CMS)として扱う。
さらに、ガウスシムは質量や運動量保存のような明示的な物理制約を取り入れ、解釈可能な結果と堅牢で物理的に妥当なシミュレーションを確実にする。
論文 参考訳(メタデータ) (2024-12-23T18:58:17Z) - Parallel simulation for sampling under isoperimetry and score-based diffusion models [56.39904484784127]
データサイズが大きくなるにつれて、イテレーションコストの削減が重要な目標になります。
科学計算における初期値問題の並列シミュレーションの成功に触発されて,タスクをサンプリングするための並列Picard法を提案する。
本研究は,動力学に基づくサンプリング・拡散モデルの科学的計算におけるシミュレーション手法の潜在的利点を強調した。
論文 参考訳(メタデータ) (2024-12-10T11:50:46Z) - Compositional simulation-based inference for time series [21.9975782468709]
シミュレーションデータに基づいてニューラルネットワークをトレーニングし、ベイズ推論を実行する方法。
シミュレータは、時間とともに何千もの単一状態遷移を通して現実世界のダイナミクスをエミュレートする。
本研究では,個々の状態遷移に整合したパラメータを局所的に同定することで,マルコフシミュレータを活用できるSBI手法を提案する。
論文 参考訳(メタデータ) (2024-11-05T01:55:07Z) - Domain Adaptive Graph Neural Networks for Constraining Cosmological Parameters Across Multiple Data Sets [40.19690479537335]
DA-GNNは,データセット間のタスクにおいて高い精度とロバスト性を実現する。
このことは、DA-GNNがドメインに依存しない宇宙情報を抽出するための有望な方法であることを示している。
論文 参考訳(メタデータ) (2023-11-02T20:40:21Z) - Continual learning autoencoder training for a particle-in-cell
simulation via streaming [52.77024349608834]
今後のエクサスケール時代は 次世代の物理シミュレーションを 高解像度で提供します
これらのシミュレーションは高解像度であり、ディスク上に大量のシミュレーションデータを格納することはほぼ不可能であるため、機械学習モデルのトレーニングに影響を与える。
この研究は、ディスク上のデータなしで、実行中のシミュレーションにニューラルネットワークを同時にトレーニングするアプローチを示す。
論文 参考訳(メタデータ) (2022-11-09T09:55:14Z) - Neural Posterior Estimation with Differentiable Simulators [58.720142291102135]
微分可能シミュレータを用いてニューラル・ポストミラー推定(NPE)を行う新しい手法を提案する。
勾配情報が後部形状の制約にどのように役立ち、試料効率を向上させるかを示す。
論文 参考訳(メタデータ) (2022-07-12T16:08:04Z) - Field Level Neural Network Emulator for Cosmological N-body Simulations [7.051595217991437]
非線形状態において高精度な宇宙構造形成のためのフィールドレベルエミュレータを構築した。
我々は、2つの畳み込みニューラルネットワークを用いて、N体シミュレーション粒子の非線形変位と速度を出力する。
論文 参考訳(メタデータ) (2022-06-09T16:21:57Z) - An advanced spatio-temporal convolutional recurrent neural network for
storm surge predictions [73.4962254843935]
本研究では, 人工ニューラルネットワークモデルを用いて, 嵐の軌跡/規模/強度履歴に基づいて, 強風をエミュレートする能力について検討する。
本研究では, 人工嵐シミュレーションのデータベースを用いて, 強風を予測できるニューラルネットワークモデルを提案する。
論文 参考訳(メタデータ) (2022-04-18T23:42:18Z) - Constraining cosmological parameters from N-body simulations with
Bayesian Neural Networks [0.0]
我々は、ベイジアンニューラルネットワークを通して宇宙パラメータを抽出するために、The Quijoteシミュレーションを使用する。
この種のモデルには、関連する不確実性を推定する顕著な能力があり、これは精密宇宙論の時代における最終的な目標の1つである。
論文 参考訳(メタデータ) (2021-12-22T13:22:30Z) - Deep Bayesian Active Learning for Accelerating Stochastic Simulation [74.58219903138301]
Interactive Neural Process(INP)は、シミュレーションとアクティブな学習アプローチのためのディープラーニングフレームワークである。
能動的学習のために,NPベースモデルの潜時空間で計算された新しい取得関数Latent Information Gain (LIG)を提案する。
その結果,STNPは学習環境のベースラインを上回り,LIGは能動学習の最先端を達成していることがわかった。
論文 参考訳(メタデータ) (2021-06-05T01:31:51Z) - Learning the Evolution of the Universe in N-body Simulations [27.935462625522575]
非線型状態の予測を得るために、大規模なN体シミュレーションが構築されている。
n体シミュレーションは計算コストが高く、大量のデータを生成し、ストレージに負担をかける。
非線形n体シミュレーションを中間時間ステップで予測するために,ディープニューラルネットワークモデルを用いる。
論文 参考訳(メタデータ) (2020-12-10T06:27:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。