論文の概要: Hunting for "Oddballs" with Machine Learning: Detecting Anomalous Exoplanets Using a Deep-Learned Low-Dimensional Representation of Transit Spectra with Autoencoders
- arxiv url: http://arxiv.org/abs/2601.02324v1
- Date: Mon, 05 Jan 2026 18:15:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 16:25:23.352925
- Title: Hunting for "Oddballs" with Machine Learning: Detecting Anomalous Exoplanets Using a Deep-Learned Low-Dimensional Representation of Transit Spectra with Autoencoders
- Title(参考訳): 機械学習による「オッドボール」の探索:オートエンコーダを用いた交通スペクトルの深層学習低次元表現を用いた異常な外惑星の検出
- Authors: Alexander Roman, Emilie Panek, Roy T. Forestano, Eyup B. Unlu, Katia Matcheva, Konstantin T. Matchev,
- Abstract要約: 本研究では, 異常検出のためのオートエンコーダを用いた機械学習手法の適用について検討した。
我々は,大気大挑戦 (ABC) データベースを用いて,CO2の豊富な大気を異常として,CO2の少ない大気を正常なクラスとして定義し,異常検出シナリオを構築する。
我々は、オートエンコーダ再構成損失、ワンクラスサポートベクトルマシン(1クラスSVM)、K平均クラスタリング、ローカルアウトリーファクタ(LOF)の4つの異なる異常検出戦略をベンチマークした。
- 参考スコア(独自算出の注目度): 35.61099185492068
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This study explores the application of autoencoder-based machine learning techniques for anomaly detection to identify exoplanet atmospheres with unconventional chemical signatures using a low-dimensional data representation. We use the Atmospheric Big Challenge (ABC) database, a publicly available dataset with over 100,000 simulated exoplanet spectra, to construct an anomaly detection scenario by defining CO2-rich atmospheres as anomalies and CO2-poor atmospheres as the normal class. We benchmarked four different anomaly detection strategies: Autoencoder Reconstruction Loss, One-Class Support Vector Machine (1 class-SVM), K-means Clustering, and Local Outlier Factor (LOF). Each method was evaluated in both the original spectral space and the autoencoder's latent space using Receiver Operating Characteristic (ROC) curves and Area Under the Curve (AUC) metrics. To test the performance of the different methods under realistic conditions, we introduced Gaussian noise levels ranging from 10 to 50 ppm. Our results indicate that anomaly detection is consistently more effective when performed within the latent space across all noise levels. Specifically, K-means clustering in the latent space emerged as a stable and high-performing method. We demonstrate that this anomaly detection approach is robust to noise levels up to 30 ppm (consistent with realistic space-based observations) and remains viable even at 50 ppm when leveraging latent space representations. On the other hand, the performance of the anomaly detection methods applied directly in the raw spectral space degrades significantly with increasing the level of noise. This suggests that autoencoder-driven dimensionality reduction offers a robust methodology for flagging chemically anomalous targets in large-scale surveys where exhaustive retrievals are computationally prohibitive.
- Abstract(参考訳): 本研究では, オートエンコーダをベースとした機械学習技術を用いて, 低次元データ表現を用いて, 従来と異なる化学的シグネチャを持つ外惑星大気を同定する手法について検討した。
我々は,10万以上の模擬外惑星スペクトルを持つ公開データセットであるABCデータベースを用いて,CO2リッチ大気を異常として,CO2ポーア大気を正常なクラスとして定義することにより,異常検出シナリオを構築する。
我々は,オートエンコーダ再構成損失,ワンクラスサポートベクトルマシン(1クラスSVM),K-means Clustering,Local Outlier Factor(LOF)の4種類の異常検出戦略をベンチマークした。
各手法は、受信器動作特性曲線(ROC)とエリアアンダー・ザ・カーブ(AUC)測定値を用いて、元のスペクトル空間とオートエンコーダの潜時空間の両方で評価した。
現実的な条件下での異なる手法の性能をテストするために,10ppmから50ppmまでのガウスノイズレベルを導入した。
以上の結果から,全てのノイズレベルにわたって潜在空間内で異常検出を行う場合,異常検出が常に有効であることが示唆された。
特に、潜在空間におけるK平均クラスタリングは安定かつ高い性能の方法として現れた。
この異常検出手法は、30ppmまでの騒音レベル(現実的な空間に基づく観測と矛盾)に対して頑健であり、潜時空間表現を利用する場合、50ppmでも有効であることを示す。
一方, スペクトル空間に直接適用した異常検出法の性能は, ノイズのレベルを増大させるとともに著しく低下する。
このことは、オートエンコーダ駆動の次元減少は、徹底的な検索が計算的に禁止される大規模調査において、化学的に異常なターゲットをフラグ付けするための堅牢な方法論を提供することを示している。
関連論文リスト
- Hyperspectral Variational Autoencoders for Joint Data Compression and Component Extraction [5.157309015481045]
我々は、NASAのTEMPO衛星ハイパースペクトル観測(1028チャンネル、290-490nm)のx514圧縮を実現する変分オートエンコーダ(VAE)アプローチを提案する。
この劇的なデータボリューム削減は、スペクトルの忠実さを維持しながら、効率的なアーカイブと衛星観測の共有を可能にする。
論文 参考訳(メタデータ) (2025-11-23T16:26:09Z) - Isolation-based Spherical Ensemble Representations for Anomaly Detection [60.989157958972356]
不正検出、ネットワークセキュリティ、ログ監視を対象とするアプリケーションによるデータマイニングと管理において、異常検出は重要なタスクである。
既存の教師なし異常検出手法は、分散仮定の矛盾、計算の非効率性、異なる異常型を扱う難しさなど、基本的な課題に直面している。
Isolation-based Spherical Ensemble Representations (ISER) は, 局所密度特性のプロキシとしてハイパースフィアラジイを用いて, 線形時間と定数空間の複雑さを保ちながら, 既存の分離法を拡張したものである。
論文 参考訳(メタデータ) (2025-10-15T09:00:05Z) - CLIP Meets Diffusion: A Synergistic Approach to Anomaly Detection [49.11819337853632]
異常検出は、異常の定義の曖昧さ、異常型の多様性、トレーニングデータの不足による複雑な問題である。
識別的基盤モデルと生成的基礎モデルの両方を活用するCLIPfusionを提案する。
本手法は, 異常検出の多面的課題に対処する上で, マルチモーダル・マルチモデル融合の有効性を裏付けるものである。
論文 参考訳(メタデータ) (2025-06-13T13:30:15Z) - Enhancing anomaly detection with topology-aware autoencoders [0.0]
オートエンコーダは信号に依存しないアプローチを提供するが、その潜在空間の位相によって制限される。
球面(Sn$)、積(S2 otimes S2$)、射影(mathbbRP2$)潜在空間を持つオートエンコーダを構築する。
提案手法をハドロン上クォーク崩壊シミュレーションに適用することにより, 適切な位相制約を持つ潜在空間が異常事象の検出における感度と頑健性を高めることを示す。
論文 参考訳(メタデータ) (2025-02-14T13:50:46Z) - Adaptive Signal Analysis for Automated Subsurface Defect Detection Using Impact Echo in Concrete Slabs [0.0]
本研究は,コンクリートスラブの地下欠陥発生領域を検出するための,新しい,自動化された,スケーラブルな手法を提案する。
このアプローチは、高度な信号処理、クラスタリング、および視覚分析を統合して、地下の異常を識別する。
結果は方法論の堅牢性を示し、最小限の偽陽性とほとんど欠陥のない欠陥発生領域を一貫して同定した。
論文 参考訳(メタデータ) (2024-12-23T20:05:53Z) - A Classifier-Based Approach to Multi-Class Anomaly Detection Applied to Astronomical Time-Series [0.0]
異常検出は多くの科学分野において 未解決の問題です
天文時系列のほとんどの異常検出アルゴリズムは、手作りの特徴か、教師なし表現学習によって生成された特徴に依存している。
本稿では,ニューラルネットワーク分類器の潜時空間を利用した異常検出手法を提案する。
論文 参考訳(メタデータ) (2024-08-05T18:00:00Z) - A Classifier-Based Approach to Multi-Class Anomaly Detection for Astronomical Transients [0.0]
希少な過渡性の同定に必須なリアルタイム異常検出
現代のサーベイ望遠鏡は毎晩何万もの警報を発生させる。
ヴェラ・C・ルービン天文台のような将来の望遠鏡はこの数を劇的に増やすことを計画した。
論文 参考訳(メタデータ) (2024-03-21T18:00:00Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。