論文の概要: SolarGPT-QA: A Domain-Adaptive Large Language Model for Educational Question Answering in Space Weather and Heliophysics
- arxiv url: http://arxiv.org/abs/2601.12131v1
- Date: Sat, 17 Jan 2026 18:18:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:22.474458
- Title: SolarGPT-QA: A Domain-Adaptive Large Language Model for Educational Question Answering in Space Weather and Heliophysics
- Title(参考訳): SolarGPT-QA:宇宙気象と生物物理学における教育質問応答のためのドメイン適応型大規模言語モデル
- Authors: Santosh Chapagain, MohammadReza EskandariNasab, Onur Vural, Shah Muhammad Hamdi, Soukaina Filali Boubrahimi,
- Abstract要約: 太陽フレア、コロナ質量放出(CME)、地磁気嵐などの太陽活動は、衛星、航空、電力網、データセンター、宇宙ミッションに大きな影響を及ぼす可能性がある。
LLaMA-3ベースモデルに基づくドメイン適応型大規模言語モデルに基づく質問応答システムであるSolarGPT-QAを紹介する。
人対評価は、SolarGPT-QAがゼロショット設定で汎用モデルより優れていることを示している。
- 参考スコア(独自算出の注目度): 0.2770822269241973
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Solar activity, including solar flares, coronal mass ejections (CMEs), and geomagnetic storms, can significantly impact satellites, aviation, power grids, data centers, and space missions. Extreme solar events can cause substantial economic damage if not predicted in advance, highlighting the importance of accurate forecasting and effective education in space science. Although large language models (LLMs) perform well on general tasks, they often lack domain-specific knowledge and pedagogical capability to clearly explain complex space science concepts. We introduce SolarGPT-QA, a question answering system based on a domain-adapted large language model built on the LLaMA-3 base model. The model is trained using scientific literature and large-scale question-answer data generated with GPT-4 and refined using Grok-3 in a student-friendly storytelling style. Human pairwise evaluations show that SolarGPT-QA outperforms general-purpose models in zero-shot settings and achieves competitive performance compared to instruction-tuned models for educational explanations in space weather and heliophysics. A small pilot student comprehension study further suggests improved clarity and accessibility of the generated explanations. Ablation experiments indicate that combining domain-adaptive pretraining with pedagogical fine-tuning is important for balancing scientific accuracy and educational effectiveness. This work represents an initial step toward a broader SolarGPT framework for space science education and forecasting.
- Abstract(参考訳): 太陽フレア、コロナ質量放出(CME)、地磁気嵐などの太陽活動は、衛星、航空、電力網、データセンター、宇宙ミッションに大きな影響を及ぼす可能性がある。
極度の太陽現象は、事前の予測がなければ重大な経済被害を引き起こす可能性があり、宇宙科学における正確な予測と効果的な教育の重要性を強調している。
大きな言語モデル(LLM)は一般的なタスクではうまく機能するが、複雑な宇宙科学の概念を明確に説明するためのドメイン固有の知識や教育能力は欠如していることが多い。
LLaMA-3ベースモデルに基づくドメイン適応型大規模言語モデルに基づく質問応答システムであるSolarGPT-QAを紹介する。
GPT-4で生成された科学文献と大規模質問応答データを用いて学習し、Grok-3を学生向けのストーリーテリングスタイルで洗練する。
ヒトのペアワイズ評価では、SolarGPT-QAはゼロショット設定で汎用モデルよりも優れており、宇宙気象学やヘリオフィジックの教育説明のための教育訓練モデルと比較して競争性能が優れている。
小規模なパイロット学生の理解研究は、さらに、生成された説明の明瞭さとアクセシビリティの向上を示唆している。
アブレーション実験により, 領域適応型プレトレーニングと教育用微調整を組み合わせることは, 科学的精度と教育効果のバランスをとる上で重要であることが示唆された。
この研究は、宇宙科学教育と予測のためのより広範なSolarGPTフレームワークに向けた最初のステップである。
関連論文リスト
- CORONA-Fields: Leveraging Foundation Models for Classification of Solar Wind Phenomena [0.0]
主な宇宙気象要因は太陽風とコロナ質量放出である。
我々は、太陽物理学の基礎モデルを適用し、太陽風構造解析に適した埋め込みを作成する。
最初の概念実証として、より信頼性の高い宇宙天気予報に向けた将来の改善の土台を築いている。
論文 参考訳(メタデータ) (2025-11-13T00:56:00Z) - Ultra-short-term solar power forecasting by deep learning and data reconstruction [60.200987006598524]
深層学習に基づく超短周期太陽エネルギー予測とデータ再構成を提案する。
我々は、ターゲット予測期間に対する長期的および短期的依存関係をキャプチャするために、ディープラーニングモデルを用いる。
論文 参考訳(メタデータ) (2025-09-21T14:22:35Z) - Surya: Foundation Model for Heliophysics [3.573991705302358]
汎用的な太陽表象を学習するために設計されたヘリオフィジカルのための366Mパラメータ基礎モデルであるSuryaを紹介する。
パラメータ効率の低い低時間適応Rank (LoRA) を用いた下流微調整は高い性能を示す一方で, 太陽のダイナミクスやフレア現象を予測する能力を示す。
その新しいアーキテクチャと性能は、このモデルが太陽の進化の背後にある物理学を学ぶことができることを示唆している。
論文 参考訳(メタデータ) (2025-08-18T05:44:25Z) - Magnetogram-to-Magnetogram: Generative Forecasting of Solar Evolution [0.0]
DDPM(Denoising Diffusion Probabilistic Models)を用いた画像と画像の変換による視線(LoS)磁気グラムの進化予測手法を提案する。
提案手法は,画像品質の「計算機科学メトリクス」と物理精度の「物理メトリクス」を組み合わせて,モデル性能の評価を行う。
その結果, DDPMは, 太陽磁場の動的範囲, 磁束, 活動領域の大きさなどの物理的特徴の維持に有効であることが示唆された。
論文 参考訳(メタデータ) (2024-07-16T12:28:10Z) - SpaRC and SpaRP: Spatial Reasoning Characterization and Path Generation for Understanding Spatial Reasoning Capability of Large Language Models [70.01883340129204]
空間推論は 生物学的と人工知能の両方において 重要な要素です
本稿では,現在最先端の大規模言語モデル (LLM) の空間的推論能力について包括的に検討する。
論文 参考訳(メタデータ) (2024-06-07T01:06:34Z) - A Foundation Model for the Earth System [82.73624748093333]
我々は、100万時間以上の多様なデータに基づいてトレーニングされた地球システムのための大規模な基盤モデルであるAuroraを紹介します。
オーロラは、大気の質、海波、熱帯のサイクロンの軌道、および専用システムよりも計算コストの桁違いの高解像度の天気予報において、運用上の予測を上回っている。
論文 参考訳(メタデータ) (2024-05-20T14:45:18Z) - Harnessing the Power of Adversarial Prompting and Large Language Models
for Robust Hypothesis Generation in Astronomy [0.0]
我々は、NASAの天体物理学データシステムから1000以上の論文を供給し、インコンテキストプロンプトを用いている。
本研究は,文脈内プロンプトを用いた仮説生成の大幅な向上を示唆するものである。
本研究は, GPT-4による知識ベースから重要な詳細を抽出し, 意味のある仮説を導出する能力について述べる。
論文 参考訳(メタデータ) (2023-06-20T16:16:56Z) - Improving day-ahead Solar Irradiance Time Series Forecasting by
Leveraging Spatio-Temporal Context [46.72071291175356]
太陽発電は二酸化炭素の排出量を大幅に削減することで気候変動を緩和する大きな可能性を秘めている。
しかし、太陽光の固有の変動は、電力網に太陽エネルギーをシームレスに統合する上で大きな課題となる。
本稿では,衛星データを用いた時間的文脈の活用を目的としたディープラーニングアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-06-01T19:54:39Z) - A Comparative Study on Generative Models for High Resolution Solar
Observation Imaging [59.372588316558826]
本研究は、観測された太陽活動状態の背後にあるデータ分布を正確に捉えるために、現在の最先端生成モデルの能力について検討する。
スーパーコンピュータ上での分散トレーニングを用いて、人間の専門家が区別できない高品質なサンプルを生成する、最大1024x1024解像度の生成モデルを訓練することができる。
論文 参考訳(メタデータ) (2023-04-14T14:40:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。