論文の概要: Exoplanet Detection Using Machine Learning Models Trained on Synthetic Light Curves
- arxiv url: http://arxiv.org/abs/2507.19520v1
- Date: Fri, 18 Jul 2025 17:25:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-03 20:19:02.841727
- Title: Exoplanet Detection Using Machine Learning Models Trained on Synthetic Light Curves
- Title(参考訳): 合成光曲線を用いた機械学習モデルを用いた外惑星検出
- Authors: Ethan Lo, Dan C. Lo,
- Abstract要約: 現在では1900年代後半から約5,000個の太陽系外惑星が確認されている。
最近の機械学習(ML)は、様々な分野で非常に価値があり、効率的であることが証明されている。
我々は、太陽系外惑星の発見と検証において、よく知られたMLモデルの結果と潜在的な利点を報告する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With manual searching processes, the rate at which scientists and astronomers discover exoplanets is slow because of inefficiencies that require an extensive time of laborious inspections. In fact, as of now there have been about only 5,000 confirmed exoplanets since the late 1900s. Recently, machine learning (ML) has proven to be extremely valuable and efficient in various fields, capable of processing massive amounts of data in addition to increasing its accuracy by learning. Though ML models for discovering exoplanets owned by large corporations (e.g. NASA) exist already, they largely depend on complex algorithms and supercomputers. In an effort to reduce such complexities, in this paper, we report the results and potential benefits of various, well-known ML models in the discovery and validation of extrasolar planets. The ML models that are examined in this study include logistic regression, k-nearest neighbors, and random forest. The dataset on which the models train and predict is acquired from NASA's Kepler space telescope. The initial results show promising scores for each model. However, potential biases and dataset imbalances necessitate the use of data augmentation techniques to further ensure fairer predictions and improved generalization. This study concludes that, in the context of searching for exoplanets, data augmentation techniques significantly improve the recall and precision, while the accuracy varies for each model.
- Abstract(参考訳): 手動による探索では、科学者や天文学者が太陽系外惑星を発見する速度は遅い。
実際、1900年代後半以降、確認された太陽系外惑星は5000ほどしか存在していない。
近年、機械学習(ML)は様々な分野において極めて有用で効率的であることが証明され、大量のデータを処理でき、学習による精度の向上も図られている。
大企業(例えばNASA)が所有する太陽系外惑星を発見するためのMLモデルは、すでに存在するが、それらは主に複雑なアルゴリズムとスーパーコンピュータに依存している。
このような複雑さを減らすため,本稿では,太陽系外惑星の発見と検証において,よく知られたMLモデルの結果と潜在的な利点を報告する。
本研究で検討されたMLモデルには,ロジスティック回帰,k-アネレスト近傍,ランダム森林などがある。
モデルが訓練し、予測するデータセットは、NASAのケプラー宇宙望遠鏡から取得される。
最初の結果は、各モデルに対して有望なスコアを示します。
しかし、潜在的なバイアスとデータセットの不均衡は、より公平な予測を確実にし、一般化を改善するためにデータ拡張技術を使用する必要がある。
本研究は, 太陽系外惑星探索の文脈において, 精度がモデル毎に異なるのに対して, データの増大によりリコールと精度が著しく向上することを示した。
関連論文リスト
- Predictable Scale: Part II, Farseer: A Refined Scaling Law in Large Language Models [62.3458061002951]
本稿では,新たなスケール法であるFarseerを紹介した。
モデル損失曲面 $L(N,D)$ を体系的に構築することにより、Farseer は以前の法則よりも経験的データに非常によく適合する。
我々の手法は正確で頑健で、非常に一般化可能な予測をもたらし、優れた外挿能力を示す。
論文 参考訳(メタデータ) (2025-06-12T17:59:23Z) - Towards LLM Agents for Earth Observation [49.92444022073444]
これは、NASAの地球観測所の記事から13のトピックと17の衛星センサーに関する140のイエス/ノーの質問のベンチマークである。
Google Earth Engine APIをツールとして使用すると、LLMエージェントは58%以上のコードを実行できないため、33%の精度しか達成できない。
我々は、合成データを微調整することで、オープンモデルの失敗率を改善し、より小さなモデルの方が、はるかに大きなモデルに匹敵する精度が得られるようにした。
論文 参考訳(メタデータ) (2025-04-16T14:19:25Z) - Reward Finetuning for Faster and More Accurate Unsupervised Object
Discovery [64.41455104593304]
Reinforcement Learning from Human Feedback (RLHF)は、機械学習モデルを改善し、それを人間の好みに合わせる。
本稿では,RL法と類似した手法を非教師対象発見に適用することを提案する。
私たちは、我々のアプローチがより正確であるだけでなく、訓練よりも桁違いに高速であることを示した。
論文 参考訳(メタデータ) (2023-10-29T17:03:12Z) - A Comparative Study on Generative Models for High Resolution Solar
Observation Imaging [59.372588316558826]
本研究は、観測された太陽活動状態の背後にあるデータ分布を正確に捉えるために、現在の最先端生成モデルの能力について検討する。
スーパーコンピュータ上での分散トレーニングを用いて、人間の専門家が区別できない高品質なサンプルを生成する、最大1024x1024解像度の生成モデルを訓練することができる。
論文 参考訳(メタデータ) (2023-04-14T14:40:32Z) - Predictive World Models from Real-World Partial Observations [66.80340484148931]
本研究では,現実の道路環境に対する確率論的予測世界モデル学習のためのフレームワークを提案する。
従来の手法では、学習のための基礎的真理として完全状態を必要とするが、HVAEが部分的に観察された状態のみから完全状態を予測することを学べる新しい逐次訓練法を提案する。
論文 参考訳(メタデータ) (2023-01-12T02:07:26Z) - Exoplanet Detection by Machine Learning with Data Augmentation [0.0]
ディープラーニングは、外惑星検出パイプラインの一部を自動化する可能性がある。
利用可能なデータセットの少なさは、強力なネットワークアーキテクチャから期待されるパフォーマンスレベルを実現するのを難しくする。
本研究では,データ拡張によって外惑星検出問題に対するモデル性能が向上する可能性を実証する。
論文 参考訳(メタデータ) (2022-11-28T17:35:16Z) - Constructing Effective Machine Learning Models for the Sciences: A
Multidisciplinary Perspective [77.53142165205281]
線形回帰モデルに変数間の変換や相互作用を手動で追加することで、非線形解が必ずしも改善されないことを示す。
データ駆動モデルを構築する前にこれを認識する方法や、そのような分析が本質的に解釈可能な回帰モデルへの移行にどのように役立つかについて議論する。
論文 参考訳(メタデータ) (2022-11-21T17:48:44Z) - ExoSGAN and ExoACGAN: Exoplanet Detection using Adversarial Training
Algorithms [0.0]
我々は、K2データ中の移動系外惑星を検出するために、2種類の生成逆数ネットワークを使用する。
本手法では,テストデータに基づいて光曲線をリコール精度1.00の精度で分類することができる。
論文 参考訳(メタデータ) (2022-07-20T05:45:36Z) - Exoplanet atmosphere evolution: emulation with random forests [0.0]
大気の質量損失は、小さな、密接な太陽系外惑星の人口動態を彫刻する上で重要な役割を果たしている。
我々は、ある惑星の最終半径と大気の質量を予測するために、大気の進化モデルに基づいて訓練されたランダムな森林を実装する。
我々の新しいアプローチは、人口統計学で使われている高度に洗練された大気進化モデルへの扉を開く。
論文 参考訳(メタデータ) (2021-10-28T14:39:19Z) - Automated identification of transiting exoplanet candidates in NASA
Transiting Exoplanets Survey Satellite (TESS) data with machine learning
methods [1.9491825010518622]
AI/ML ThetaRayシステムは当初ケプラー太陽系外惑星のデータで訓練され、確認された太陽系外惑星で検証される。
TESSミッションで発生したしきい値交差イベント(TCE)の10,803光曲線へのThetaRayの適用により、39の新たな惑星候補が発見された。
論文 参考訳(メタデータ) (2021-02-20T12:28:39Z) - Exoplanet Detection using Machine Learning [0.0]
トランジット法を用いて外惑星を検出する機械学習に基づく新しい手法を提案する。
ケプラーのデータでは、AUCが0.948である惑星を予測できるため、真の惑星信号の94.8%が非惑星信号よりも高い位置にある。
トランジット系外惑星探査衛星(TESS)のデータでは、我々の方法では光曲線を0.98の精度で分類することができ、0.82のリコールで惑星を0.63の精度で識別できることがわかった。
論文 参考訳(メタデータ) (2020-11-28T14:06:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。