論文の概要: Spectra as Language: Large Language Models for Scalable Stellar Parameter and Abundance Inference
- arxiv url: http://arxiv.org/abs/2605.22162v3
- Date: Tue, 26 May 2026 08:15:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:40.884026
- Title: Spectra as Language: Large Language Models for Scalable Stellar Parameter and Abundance Inference
- Title(参考訳): 言語としてのスペクトル: 拡張性ステラーパラメータと分散推論のための大規模言語モデル
- Authors: Hai-Ling Lu, Yu-Yang Li, Yin-Bi Li, Cun-Shi Wang, A-Li Luo, Jun-Chao Liang, Shuo Li,
- Abstract要約: 大規模な分光調査は前例のない分光データを蓄積している。
大規模言語モデルの最近の進歩は、自然言語処理のようなタスクにおける強力な一般化と特徴学習を示している。
そこで本研究では, 有効温度, 表面重力, 金属量, および20種類の化学元素の存在量を正確に推定できる, 恒星パラメータ推定のための2段階の大規模言語モデルフレームワークを提案する。
- 参考スコア(独自算出の注目度): 5.801559495813243
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Stellar spectra encode key information on the physical properties and chemical compositions of stars. Accurate stellar parameter determination is essential for addressing major questions such as galaxy and stellar evolution. Large-scale spectroscopic surveys have accumulated unprecedented spectral data. Traditional feature extraction or model-fitting approaches struggle with high-dimensional, massive datasets, limited generalization, and computational inefficiency. Recent advances in large language models demonstrate strong generalization and feature-learning in tasks like natural language processing, DNA/RNA sequence analysis, and protein/chemical parsing. Stellar spectra are continuous sequential signals, enabling the transfer of language models to stellar spectroscopy. Here, we propose a two-stage large language model framework for stellar parameter inference, achieving accurate estimation of effective temperature, surface gravity, metallicity, and abundances of ~20 chemical elements. Scaling-law analyses show systematic performance improvements with increasing data, providing a scalable framework for forthcoming large-scale surveys.
- Abstract(参考訳): 恒星スペクトルは、恒星の物理的性質と化学組成に関する重要な情報を符号化している。
正確な恒星パラメータの決定は、銀河や恒星の進化のような主要な問題に対処するために不可欠である。
大規模な分光調査は前例のない分光データを蓄積している。
伝統的な特徴抽出やモデル適合アプローチは、高次元、大規模なデータセット、限定的な一般化、計算の非効率に苦しむ。
大規模言語モデルの最近の進歩は、自然言語処理、DNA/RNA配列解析、タンパク質/化学解析といったタスクにおいて、強力な一般化と特徴学習を示している。
ステラースペクトルは連続的な逐次信号であり、言語モデルの恒星分光への転送を可能にする。
そこで本研究では, 有効温度, 表面重力, 金属量, および20の化学元素の存在量を正確に推定できる, 恒星パラメータ推定のための2段階の大規模言語モデルフレームワークを提案する。
スケールロー分析は、データの増加に伴う体系的なパフォーマンス向上を示し、今後の大規模調査のためのスケーラブルなフレームワークを提供する。
関連論文リスト
- Universal Spectral Tokenization via Self-Supervised Panchromatic Representation Learning [39.14992490784682]
連続した科学的データは、多くの解像度と領域にまたがり、それらを共通の表現に統一することは、科学の基礎モデルを開発するための重要なステップである。
ヘテロジニアススペクトルを自己監督的に学習する深層学習モデルを提案する。
初めて、単一のモデルが、解像度と領域をまたいだスペクトルデータを統一できることを実証した。
論文 参考訳(メタデータ) (2025-10-20T18:00:00Z) - DiffSpectra: Molecular Structure Elucidation from Spectra using Diffusion Models [68.19129717255053]
本稿では、分子構造解明を条件生成プロセスとして定式化する生成フレームワークであるDiffSpectraについて述べる。
我々の実験では、DiffSpectraが分子構造を正確に解明し、40.76%のトップ-1と99.49%のトップ10を達成している。
論文 参考訳(メタデータ) (2025-07-09T13:57:20Z) - SpecCLIP: Aligning and Translating Spectroscopic Measurements for Stars [6.314253302704276]
我々は、LLMにインスパイアされた方法論を恒星スペクトル分析に拡張する基盤モデルフレームワークであるSpecCLIPを提案する。
大規模データセットの基盤モデルをトレーニングすることで、さまざまな下流アプリケーションをサポートする堅牢で情報に富んだ埋め込みを学ぶことが私たちのゴールです。
これらのモデルを中規模ラベル付きデータセットに微調整することで、恒星パラメータ推定や化学特性決定といったタスクへの適応性が向上することを示した。
論文 参考訳(メタデータ) (2025-07-02T17:49:52Z) - CARL: Camera-Agnostic Representation Learning for Spectral Image Analysis [69.02751635551724]
スペクトルイメージングは、医療や都市景観の理解など、様々な領域で有望な応用を提供する。
スペクトルカメラのチャネル次元と捕獲波長のばらつきは、AI駆動方式の開発を妨げる。
本稿では,RGB,マルチスペクトル,ハイパースペクトル画像を用いたカメラ非依存表現学習モデルCARLを紹介する。
論文 参考訳(メタデータ) (2025-04-27T13:06:40Z) - GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - Unsupervised Machine Learning for Exploratory Data Analysis of Exoplanet
Transmission Spectra [68.8204255655161]
我々は、通過する太陽系外惑星のスペクトルデータを解析するための教師なし手法に焦点をあてる。
スペクトルデータには、適切な低次元表現を要求する高い相関関係があることが示される。
主成分に基づく興味深い構造、すなわち、異なる化学状態に対応する明確に定義された分岐を明らかにする。
論文 参考訳(メタデータ) (2022-01-07T22:26:33Z) - Analytical Modelling of Exoplanet Transit Specroscopy with Dimensional
Analysis and Symbolic Regression [68.8204255655161]
ディープラーニング革命は、そのような分析結果を直接、データに適合するコンピュータアルゴリズムで導き出すための扉を開いた。
我々は、一般的なホットジュピター系外惑星の遷移半径の合成データにおける記号回帰の利用をうまく実証した。
前処理のステップとして,変数の無次元な組み合わせを特定するために次元解析を用いる。
論文 参考訳(メタデータ) (2021-12-22T00:52:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。