論文の概要: AI forecasting of higher-order wave modes of spinning binary black hole mergers
- arxiv url: http://arxiv.org/abs/2409.03833v1
- Date: Thu, 5 Sep 2024 18:00:11 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-09 17:40:07.738877
- Title: AI forecasting of higher-order wave modes of spinning binary black hole mergers
- Title(参考訳): スピン二元ブラックホール融合の高次波モードのAI予測
- Authors: Victoria Tiki, Kiet Pham, Eliu Huerta,
- Abstract要約: モデルは、リングダウンを通じて、合併前のフェーズから波形の進化を予測する。
14,440,761個の波形でモデルをトレーニングし、Deltaスーパーコンピュータで16個のNVIDIA A100 GPUを使用して15時間でトレーニングを完了した。
本研究では,変換器モデルを用いて正確な予測を行うため,波形特性の解明のための解釈可能性の検討を行った。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a physics-inspired transformer model that predicts the non-linear dynamics of higher-order wave modes emitted by quasi-circular, spinning, non-precessing binary black hole mergers. The model forecasts the waveform evolution from the pre-merger phase through the ringdown, starting with an input time-series spanning $ t \in [-5000\textrm{M}, -100\textrm{M}) $. The merger event, defined as the peak amplitude of waveforms that include the $l = |m| = 2$ modes, occurs at $ t = 0\textrm{M} $. The transformer then generates predictions over the time range $ t \in [-100\textrm{M}, 130\textrm{M}] $. We produced training, evaluation and test sets using the NRHybSur3dq8 model, considering a signal manifold defined by mass ratios $ q \in [1, 8] $; spin components $ s^z_{\{1,2\}} \in [-0.8, 0.8] $; modes up to $l \leq 4$, including the $(5,5)$ mode but excluding the $(4,0)$ and $(4,1)$ modes; and inclination angles $\theta \in [0, \pi]$. We trained the model on 14,440,761 waveforms, completing the training in 15 hours using 16 NVIDIA A100 GPUs in the Delta supercomputer. We used 4 H100 GPUs in the DeltaAI supercomputer to compute, within 7 hours, the overlap between ground truth and predicted waveforms using a test set of 840,000 waveforms, finding that the mean and median overlaps over the test set are 0.996 and 0.997, respectively. Additionally, we conducted interpretability studies to elucidate the waveform features utilized by our transformer model to produce accurate predictions. The scientific software used for this work is released with this manuscript.
- Abstract(参考訳): 準円、回転、非必要二元ブラックホール融合により放出される高次波動モードの非線形ダイナミクスを予測する物理インスピレーション型変圧器モデルを提案する。
このモデルは、合併前のフェーズからリングダウンまでの波形の進化を予測し、$ t \in [-5000\textrm{M}, -100\textrm{M})$の入力時系列から始まる。
合併イベントは、$l = |m| = 2$モードを含む波形のピーク振幅として定義され、$ t = 0\textrm{M} $で発生する。
変換器は、時間範囲$ t \in [-100\textrm{M}, 130\textrm{M}] $で予測を生成する。
我々は, NRHybSur3dq8モデルを用いて, 質量比$ q \in [1, 8] $, spin component $ s^z_{\{1,2\}} \in [-0.8, 0.8] $, modes to $l \leq 4$, including the $(5,5)$ mode, including the $(4,0)$ and $(4,1)$ modes, and inclination angles $\theta \in [0, \pi]$という信号多様体を考慮し, トレーニング, 評価, テストセットを作成した。
14,440,761個の波形でトレーニングを行い、Deltaスーパーコンピュータで16個のNVIDIA A100 GPUを使用して15時間でトレーニングを完了した。
我々はDeltaAIスーパーコンピュータで4つのH100 GPUを用いて、7時間以内に、地上の真理と予測波形の重なりを840,000の波形を用いて計算し、それぞれ平均重なりが0.996と0.997であることを確認した。
さらに,変換器モデルを用いて正確な予測を行うために,波形特性の解明のための解釈可能性の検討を行った。
この研究に使用される科学ソフトウェアは、この原稿とともにリリースされている。
関連論文リスト
- IT$^3$: Idempotent Test-Time Training [95.78053599609044]
本稿では,分散シフトの課題に対処する新しいアプローチであるIdempotent Test-Time Training (IT$3$)を紹介する。
IT$3$は、イデオロジェンスの普遍性に基づいている。
画像分類の劣化など,様々なタスクにまたがるアプローチの汎用性を実証する。
論文 参考訳(メタデータ) (2024-10-05T15:39:51Z) - Transformer In-Context Learning for Categorical Data [51.23121284812406]
我々は、分類結果、非線形基礎モデル、非線形注意を考慮し、文脈内学習のレンズを通してトランスフォーマーを理解する研究を機能データで拡張する。
我々は、ImageNetデータセットを用いて、この数発の学習方法論の最初の実世界の実演であると考えられるものを提示する。
論文 参考訳(メタデータ) (2024-05-27T15:03:21Z) - Efficient Sampling of Stochastic Differential Equations with Positive
Semi-Definite Models [91.22420505636006]
本稿では, ドリフト関数と拡散行列を考慮し, 微分方程式からの効率的なサンプリング問題を扱う。
1/varepsilonは$m2d log (1/varepsilon)$である。
以上の結果から,真の解がより滑らかになるにつれて,どのような凸性も必要とせず,次元の呪いを回避できることが示唆された。
論文 参考訳(メタデータ) (2023-03-30T02:50:49Z) - Neural Inference of Gaussian Processes for Time Series Data of Quasars [72.79083473275742]
クエーサースペクトルを完全に記述できる新しいモデルを提案する。
また、$textitNeural Inference$というガウス的プロセスパラメータの推論の新しいメソッドも導入しています。
CDRWモデルとNeural Inferenceの組み合わせはベースラインのDRWとMLEを大きく上回っている。
論文 参考訳(メタデータ) (2022-11-17T13:01:26Z) - Mean Estimation in High-Dimensional Binary Markov Gaussian Mixture
Models [12.746888269949407]
2進隠れマルコフモデルに対する高次元平均推定問題を考える。
ほぼ最小限の誤差率(対数係数まで)を $|theta_*|,delta,d,n$ の関数として確立する。
論文 参考訳(メタデータ) (2022-06-06T09:34:04Z) - Approximate Function Evaluation via Multi-Armed Bandits [51.146684847667125]
既知の滑らかな関数 $f$ の値を未知の点 $boldsymbolmu in mathbbRn$ で推定する問題について検討する。
我々は、各座標の重要性に応じてサンプルを学習するインスタンス適応アルゴリズムを設計し、少なくとも1-delta$の確率で$epsilon$の正確な推定値である$f(boldsymbolmu)$を返す。
論文 参考訳(メタデータ) (2022-03-18T18:50:52Z) - AI and extreme scale computing to learn and infer the physics of higher
order gravitational wave modes of quasi-circular, spinning, non-precessing
binary black hole mergers [1.7056768055368385]
準円、回転、不要な二元ブラックホール融合の高次重力波モードの物理学を学習し、推理する。
我々は、代理モデルNRHybSur3dq8で生成された1400万の波形を用いてAIモデルを訓練する。
数値相対性波形の質量比, 個々のスピン, 有効スピン, 傾斜角の決定論的および確率的推定値を得る。
論文 参考訳(メタデータ) (2021-12-13T19:00:00Z) - Interpretable AI forecasting for numerical relativity waveforms of
quasi-circular, spinning, non-precessing binary black hole mergers [1.4438155481047366]
本稿では, 数値相対性理論の遅延的, 合併, リングダウンを学習し, 予測できるディープラーニング人工知能モデルを提案する。
私たちはArgonne Leadership Computing FacilityのThetaスーパーコンピュータを使って、150万の波形のトレーニングセットを使用してAIモデルをトレーニングしました。
その結果,人工知能は数値相対性理論波形の動的進化を正確に予測できることがわかった。
論文 参考訳(メタデータ) (2021-10-13T18:14:52Z) - Denoising modulo samples: k-NN regression and tightness of SDP
relaxation [5.025654873456756]
サンプルの値が$f(x_i)$で一様誤差率$O(fraclog nn)frac1d+2)$を高い確率で保持する2段階のアルゴリズムを導出する。
サンプル $f(x_i)$ の見積もりは、その後、関数 $f$ の見積もりを構築するために使われる。
論文 参考訳(メタデータ) (2020-09-10T13:32:46Z) - Optimal Robust Linear Regression in Nearly Linear Time [97.11565882347772]
学習者が生成モデル$Y = langle X,w* rangle + epsilon$から$n$のサンプルにアクセスできるような高次元頑健な線形回帰問題について検討する。
i) $X$ is L4-L2 hypercontractive, $mathbbE [XXtop]$ has bounded condition number and $epsilon$ has bounded variance, (ii) $X$ is sub-Gaussian with identity second moment and $epsilon$ is
論文 参考訳(メタデータ) (2020-07-16T06:44:44Z) - Ballistic propagation of a local impact in the one-dimensional $XY$
model [0.0]
光円錐状の情報伝播は、積分可能なスピン系の非平衡力学の普遍的な現象である。
パラメータ領域$0leqgammaleq1$および$0leq2$において,光円錐状の伝搬を数値的に観察する。
論文 参考訳(メタデータ) (2020-07-03T04:07:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。