論文の概要: Astroconformer: The Prospects of Analyzing Stellar Light Curves with
Transformer-Based Deep Learning Models
- arxiv url: http://arxiv.org/abs/2309.16316v1
- Date: Thu, 28 Sep 2023 10:13:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-29 15:10:42.216527
- Title: Astroconformer: The Prospects of Analyzing Stellar Light Curves with
Transformer-Based Deep Learning Models
- Title(参考訳): astroconformer: トランスフォーマー型深層学習モデルによる恒星光曲線解析の展望
- Authors: Jia-Shu Pan, Yuan-Sen Ting, Jie Yu
- Abstract要約: 恒星光曲線の長距離依存性を捉えるために, Transformer ベースのディープラーニングフレームワークである $textitAstroconformer$ を提示する。
我々の結果は、トレーニングデータが豊富である状態では、$textitAstroconformer$は、$log g approx 3 $の0.017 dexのroot-mean-square-error(RMSE)を得る。
K-nearestの隣人モデル(textitThe SWAN$)だけでなく、最先端のCNNよりも優れています。
- 参考スコア(独自算出の注目度): 2.9203802343391057
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Light curves of stars encapsulate a wealth of information about stellar
oscillations and granulation, thereby offering key insights into the internal
structure and evolutionary state of stars. Conventional asteroseismic
techniques have been largely confined to power spectral analysis, neglecting
the valuable phase information contained within light curves. While recent
machine learning applications in asteroseismology utilizing Convolutional
Neural Networks (CNNs) have successfully inferred stellar attributes from light
curves, they are often limited by the local feature extraction inherent in
convolutional operations. To circumvent these constraints, we present
$\textit{Astroconformer}$, a Transformer-based deep learning framework designed
to capture long-range dependencies in stellar light curves. Our empirical
analysis, which focuses on estimating surface gravity ($\log g$), is grounded
in a carefully curated dataset derived from $\textit{Kepler}$ light curves.
These light curves feature asteroseismic $\log g$ values spanning from 0.2 to
4.4. Our results underscore that, in the regime where the training data is
abundant, $\textit{Astroconformer}$ attains a root-mean-square-error (RMSE) of
0.017 dex around $\log g \approx 3 $. Even in regions where training data are
sparse, the RMSE can reach 0.1 dex. It outperforms not only the K-nearest
neighbor-based model ($\textit{The SWAN}$) but also state-of-the-art CNNs.
Ablation studies confirm that the efficacy of the models in this particular
task is strongly influenced by the size of their receptive fields, with larger
receptive fields correlating with enhanced performance. Moreover, we find that
the attention mechanisms within $\textit{Astroconformer}$ are well-aligned with
the inherent characteristics of stellar oscillations and granulation present in
the light curves.
- Abstract(参考訳): 恒星の光度曲線は恒星の振動と粒状化に関する豊富な情報を包含し、恒星の内部構造と進化状態に関する重要な洞察を与える。
従来の強誘電的手法は、光曲線に含まれる貴重な位相情報を無視し、主にパワースペクトル分析に制限されている。
畳み込みニューラルネットワーク(CNN)を利用した最近の機械学習応用は、光曲線から星の属性を推測することに成功したが、畳み込み演算に固有の局所的特徴抽出によって制限されることが多い。
この制約を回避するために、星の光度曲線の長距離依存性をキャプチャするトランスフォーマティブベースのディープラーニングフレームワークである$\textit{astroconformer}$を提案する。
表面重力(\log g$)の推定に焦点を当てた実験分析は、$\textit{kepler}$光曲線から導かれた注意深くキュレートされたデータセットに基礎を置いている。
これらの光度曲線は、0.2から4.4までのアステロジスティックな$\log g$値を持つ。
我々の結果は、トレーニングデータが豊富である状況において、$\textit{Astroconformer}$は、$\log g \approx 3 $ 0.017 dexの root-mean-square-error (RMSE) を達成する。
トレーニングデータが不足している地域であっても、rmseは0.1 dexに達する。
K-nearestの近隣モデル(\textit{The SWAN}$)だけでなく、最先端のCNNよりも優れています。
アブレーション研究により、この特定のタスクにおけるモデルの有効性は、その受容野の大きさに大きく影響しており、より大きな受容野は性能の向上に関係していることが確認された。
さらに、$\textit{Astroconformer}$内の注意機構は、光曲線に存在する恒星振動や顆粒の固有特性とよく一致していることがわかった。
関連論文リスト
- The Scaling Law in Stellar Light Curves [3.090476527764192]
本稿では,天文時系列データから学習する際の法則のスケーリングについて,自己監督的手法を用いて検討する。
自己教師付きトランスフォーマーモデルは,最先端の教師付き学習モデルと比較して,サンプル効率を3~10倍に向上させる。
本研究は,大規模自己回帰生成モデルを用いて恒星の光度曲線を解析するための基礎研究である。
論文 参考訳(メタデータ) (2024-05-27T13:31:03Z) - Bayesian Inference with Deep Weakly Nonlinear Networks [57.95116787699412]
我々は,完全連結ニューラルネットワークによるベイズ推定が解けることを示す物理レベルの厳密さを示す。
我々はモデルエビデンスを計算し、任意の温度で1/N$で任意の順序に後続する手法を提供する。
論文 参考訳(メタデータ) (2024-05-26T17:08:04Z) - Learning Galaxy Intrinsic Alignment Correlations [16.805775045014578]
銀河の内在的なアライメント(IA)は、重力潮流相互作用と銀河形成過程による銀河の形状の相関を表す。
本研究では,銀河の位置,位置配向,方向配向相関関数の測定と不確かさをエミュレートする深層学習手法を提案する。
論文 参考訳(メタデータ) (2024-04-21T16:16:56Z) - One-dimensional Convolutional Neural Networks for Detecting Transiting
Exoplanets [39.58317527488534]
我々は、異なる望遠鏡とサーベイから得られる光曲線のトランジットを検出することができる人工ニューラルネットワークモデルを開発した。
我々は1次元畳み込みニューラルネットワークモデルを訓練し、検証するために、ケプラー望遠鏡(K2)の延長ミッションに期待されるものを模した人工光曲線を作成しました。
論文 参考訳(メタデータ) (2023-12-12T10:56:27Z) - Local primordial non-Gaussianity from the large-scale clustering of photometric DESI luminous red galaxies [5.534428269834764]
我々は、Dark Energy Spectroscopic Instruments(DESI)による局所原始非ガウス性パラメータ$fnl$を制約するために、光赤銀河の角度クラスタリングを用いる。
このサンプルは1200万以上の目標からなり、空の14,000平方度をカバーし、赤方偏移は0.2 z 1.35$である。
我々は, 銀河の絶滅, 調査深度, 天体観測を系統的誤りの主な原因とみなし, 大規模での非宇宙的余剰クラスタリングを緩和するために線形回帰と人工ニューラルネットワークを用いる。
論文 参考訳(メタデータ) (2023-07-04T14:49:23Z) - Neural Inference of Gaussian Processes for Time Series Data of Quasars [72.79083473275742]
クエーサースペクトルを完全に記述できる新しいモデルを提案する。
また、$textitNeural Inference$というガウス的プロセスパラメータの推論の新しいメソッドも導入しています。
CDRWモデルとNeural Inferenceの組み合わせはベースラインのDRWとMLEを大きく上回っている。
論文 参考訳(メタデータ) (2022-11-17T13:01:26Z) - Light curve completion and forecasting using fast and scalable Gaussian
processes (MuyGPs) [0.0]
商用オフザシェルフ(COTS)カメラによる地上観測は、高精度の機器に比べて安価である。
ノイズの多い観測と組み合わされたセンサの可用性は、ギャップの多い時系列データを生成することができる。
ディープニューラルネットワーク(DNN)は、複雑な非線形埋め込みを学習する経験的成功によって、選択のツールとなっている。
論文 参考訳(メタデータ) (2022-08-31T01:52:00Z) - Supernova Light Curves Approximation based on Neural Network Models [53.180678723280145]
光度データによる超新星の分類は、天文学におけるビッグデータのリアルタイム処理の出現によって課題となる。
近年の研究では、様々な機械学習モデルに基づく解の優れた品質が実証されている。
我々は,多層パーセプトロン(MLP),ベイジアンニューラルネットワーク(BNN),正規化フロー(NF)の単一光曲線観測への応用について検討した。
論文 参考訳(メタデータ) (2022-06-27T13:46:51Z) - Towards an Understanding of Benign Overfitting in Neural Networks [104.2956323934544]
現代の機械学習モデルは、しばしば膨大な数のパラメータを使用し、通常、トレーニング損失がゼロになるように最適化されている。
ニューラルネットワークの2層構成において、これらの良質な過適合現象がどのように起こるかを検討する。
本稿では,2層型ReLUネットワーク補間器を極小最適学習率で実現可能であることを示す。
論文 参考訳(メタデータ) (2021-06-06T19:08:53Z) - A Random Matrix Analysis of Random Fourier Features: Beyond the Gaussian
Kernel, a Precise Phase Transition, and the Corresponding Double Descent [85.77233010209368]
本稿では、データサンプルの数が$n$である現実的な環境で、ランダムフーリエ(RFF)回帰の正確さを特徴付けます。
この分析はまた、大きな$n,p,N$のトレーニングとテスト回帰エラーの正確な推定も提供する。
論文 参考訳(メタデータ) (2020-06-09T02:05:40Z) - Improved guarantees and a multiple-descent curve for Column Subset
Selection and the Nystr\"om method [76.73096213472897]
我々は,データ行列のスペクトル特性を利用して近似保証を改良する手法を開発した。
我々のアプローチは、特異値減衰の既知の速度を持つデータセットのバウンダリが大幅に向上する。
RBFパラメータを変更すれば,改良された境界線と多重発振曲線の両方を実データセット上で観測できることが示される。
論文 参考訳(メタデータ) (2020-02-21T00:43:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。