論文の概要: Multimodal Transformer Based Generic Mixture Density Network for Scattering Timescale Estimation of Fast Radio Bursts
- arxiv url: http://arxiv.org/abs/2606.03596v1
- Date: Tue, 02 Jun 2026 13:01:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 10:57:21.744493
- Title: Multimodal Transformer Based Generic Mixture Density Network for Scattering Timescale Estimation of Fast Radio Bursts
- Title(参考訳): マルチモーダル変圧器を用いた高速電波バーストの散乱時間推定のためのジェネリック混合密度ネットワーク
- Authors: Bikash Kharel, Emmanuel Fonseca, Srinjoy Das, Mason Ng, Paul Scholz, Mawson W. Simmons, Lordrick Kahinga, Afrokk Khan,
- Abstract要約: 本稿では,MT-GMDN (Multimodal Transformer Based Generic Mixture Density Network) という深層学習手法を提案する。
MT-GMDN は CHIME/FRB cattwo から$sim3500$ FRB のトレーニングを行い,トレーニング中の検証やトレーニング完了後のテストのために一部の FRB を保有した。
モデルは、測定可能な散乱を伴う事象に対する期待値の$$$$に対して94%$の判定係数(R2$)を、テストにおいて90%$の優れたリコール値で達成する。
- 参考スコア(独自算出の注目度): 0.7632410926487435
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The discovery rate of fast radio bursts (FRBs) continues to increase with the advent of new radio facilities and yet extracting their astrophysical parameters such as scattering timescale ($τ$) remains a significant bottleneck. Current $τ$ measurement approaches like fitting analytic template models and scattering aware de-convolution are accurate but slow, sensitive to initialization, limited by low signal to noise and often require manual supervision. These limitations inspired us to explore fast, robust and scalable machine learning methods to estimate the astrophysical parameter value. We present a deep learning approach named Multimodal Transformer Based Generic Mixture Density Network (MT-GMDN) which ingests FRB dynamic spectrum and its corresponding timeseries profile through parallel transformer encoders, fuses their latent representations and predicts the distribution of $τ$ with probabilistic output derived from generic mixture-density formulation. This formulation not only estimates the value of $τ$ but also captures the (zero inflated) nature of FRB populations where a significant fraction of bursts exhibit unresolvable scattering. We trained MT-GMDN on $\sim3500$ FRBs from CHIME/FRB \cattwo while holding out some fraction of FRBs for validation during training and for testing after the training completes. The model achieves a coefficient of determination ($R^2$) value of $94\%$ on the expected value of $τ$ for the events with measurable scattering with an excellent recall value of $90\%$ on the test data set. The model was also able to incorporate heteroskedastic errors enabling us the construction of a confidence interval for the predictions.
- Abstract(参考訳): 高速電波バースト(FRB)の発見率は、新しい無線設備の出現とともに増加し続けているが、散乱時間スケール(τ$)のような天体物理学的なパラメータを抽出することは、依然として大きなボトルネックとなっている。
現在の$τ$の計測アプローチでは、分析テンプレートモデルへの適合や、非畳み込みを意識する散乱は正確だが遅く、初期化に敏感であり、低信号からノイズに制限され、手動による監督を必要とすることが多い。
これらの制限は、天体物理パラメータ値を推定する高速で堅牢でスケーラブルな機械学習手法を探究するきっかけとなった。
本稿では,FRBの動的スペクトルとそれに対応する時間プロファイルを並列トランスフォーマーエンコーダを通じて取り込み,それらの潜在表現を融合させ,汎用混合密度の定式化から得られる確率的出力によるτ$の分布を予測する,MT-GMDNというディープラーニング手法を提案する。
この定式化は、$τ$の値を推定するだけでなく、かなりの数のバーストが解けない散乱を示すFRBの(ゼロの膨らませた)性質を捉える。
MT-GMDNをCHIME/FRB \cattwoから$\sim3500$ FRBでトレーニングし、トレーニング中の検証とトレーニング完了後のテストのために一部のFRBを保持した。
このモデルは、測定可能な散乱を伴う事象に対して、期待値の$τ$に対して9,4\%$の判定係数(R^2$)を、テストデータセット上で90\%$の優れたリコール値で達成する。
モデルはまた、予測のための信頼区間の構築を可能にするヘテロスケダスティックエラーを組み込むことができた。
関連論文リスト
- Low-Dimensional Adaptation of Rectified Flow: A New Perspective through the Lens of Diffusion and Stochastic Localization [59.04314685837778]
整流流(RF)は、その生成効率と最先端の性能からかなりの人気を得ている。
本稿では,RFがターゲット分布の支持の内在的低次元性に自動的に適応し,サンプリングを高速化する程度について検討する。
時間分割方式を慎重に設計し,十分な正確なドリフト推定を行うことで,RFサンプリング器はオーダーO(k/varepsilon)$の複雑さを享受できることを示す。
論文 参考訳(メタデータ) (2026-01-21T22:09:27Z) - Regularized Random Fourier Features and Finite Element Reconstruction for Operator Learning in Sobolev Space [0.7734726150561088]
カーネルベースの演算子学習は、標準的な方法よりも少ないトレーニングを必要とする正確で理論上正当化された近似を提供することができる。
有限要素再構成マップ(RRFF-FEM)と組み合わせた正規化ランダムフーリエ特徴量(RRFF)手法を提案する。
RRFF と RRFF-FEM は雑音に対して頑健であり,非正規化ランダム特徴モデルと比較してトレーニング時間を短縮し,性能の向上を図っている。
論文 参考訳(メタデータ) (2025-12-19T18:36:24Z) - Generative Modeling with Continuous Flows: Sample Complexity of Flow Matching [60.37045080890305]
本稿では,フローマッチングに基づく生成モデルにおいて,サンプルの複雑さを初めて解析する。
速度場推定誤差をニューラルネットワーク近似誤差、有限標本サイズによる統計的誤差、速度場推定のための有限個の最適化ステップによる最適化誤差に分解する。
論文 参考訳(メタデータ) (2025-12-01T05:14:25Z) - O(d/T) Convergence Theory for Diffusion Probabilistic Models under Minimal Assumptions [6.76974373198208]
最小の仮定の下で,拡散確率モデル(DDPM)の高速収束理論を確立する。
収束率は$O(k/T)$に改善され、$k$は対象データ分布の内在次元であることを示す。
これはDDPMが未知の低次元構造に自動的に適応する能力を強調している。
論文 参考訳(メタデータ) (2024-09-27T17:59:10Z) - Informed Correctors for Discrete Diffusion Models [27.295990499157814]
離散拡散モデルに対する予測・相関型サンプリング手法を提案する。
情報補正器は,誤差が少なく,FIDスコアが向上した優れたサンプルを連続的に生成することを示す。
本結果は,離散拡散を用いた高速かつ高忠実な生成のための情報補正器の可能性を明らかにするものである。
論文 参考訳(メタデータ) (2024-07-30T23:29:29Z) - Towards Faster Non-Asymptotic Convergence for Diffusion-Based Generative
Models [49.81937966106691]
我々は拡散モデルのデータ生成過程を理解するための非漸近理論のスイートを開発する。
従来の研究とは対照的に,本理論は基本的だが多目的な非漸近的アプローチに基づいて開発されている。
論文 参考訳(メタデータ) (2023-06-15T16:30:08Z) - Uncertainty Estimation Using a Single Deep Deterministic Neural Network [66.26231423824089]
本稿では,1回のフォワードパスで,テスト時に分布データポイントの発見と拒否が可能な決定論的ディープモデルを訓練する手法を提案する。
我々は,新しい損失関数とセントロイド更新方式を用いて,これらをスケールトレーニングし,ソフトマックスモデルの精度に適合させる。
論文 参考訳(メタデータ) (2020-03-04T12:27:36Z) - Gravitational-wave parameter estimation with autoregressive neural
network flows [0.0]
深部ニューラルネットワークを用いた重力波データから二元ブラックホール系のパラメータを高速に推定するための自己回帰正規化フローを導入する。
正規化フロー(英: normalizing flow)は、単純な確率分布からより複雑なものへの変換を誘導するために用いられるサンプル空間上の可逆写像である。
可変オートエンコーダフレームワークに自己回帰フローを組み込むことにより,より強力な潜在変数モデルを構築する。
論文 参考訳(メタデータ) (2020-02-18T15:44:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。