論文の概要: GalaxiesML: a dataset of galaxy images, photometry, redshifts, and structural parameters for machine learning
- arxiv url: http://arxiv.org/abs/2410.00271v1
- Date: Mon, 30 Sep 2024 22:46:44 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-05 06:35:59.520089
- Title: GalaxiesML: a dataset of galaxy images, photometry, redshifts, and structural parameters for machine learning
- Title(参考訳): GalaxiesML: 機械学習のための銀河画像、測光、赤方偏移、構造パラメータのデータセット
- Authors: Tuan Do, Bernie Boscoe, Evan Jones, Yun Qi Li, Kevin Alfaro,
- Abstract要約: 本稿では、銀河測光、画像、分光赤方偏移、構造特性からなる機械学習応用のためのデータセットを提案する。
このデータセットは、ハイパー・サプライム・カム・サーベイPDR2からの286,401個の銀河画像と測光を5つの画像フィルターで構成している。
このデータセットを公開して、EuclidやLSSTといった次世代のサーベイのための機械学習手法の開発を促進するのに役立てる。
- 参考スコア(独自算出の注目度): 1.0279580671257864
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a dataset built for machine learning applications consisting of galaxy photometry, images, spectroscopic redshifts, and structural properties. This dataset comprises 286,401 galaxy images and photometry from the Hyper-Suprime-Cam Survey PDR2 in five imaging filters ($g,r,i,z,y$) with spectroscopically confirmed redshifts as ground truth. Such a dataset is important for machine learning applications because it is uniform, consistent, and has minimal outliers but still contains a realistic range of signal-to-noise ratios. We make this dataset public to help spur development of machine learning methods for the next generation of surveys such as Euclid and LSST. The aim of GalaxiesML is to provide a robust dataset that can be used not only for astrophysics but also for machine learning, where image properties cannot be validated by the human eye and are instead governed by physical laws. We describe the challenges associated with putting together a dataset from publicly available archives, including outlier rejection, duplication, establishing ground truths, and sample selection. This is one of the largest public machine learning-ready training sets of its kind with redshifts ranging from 0.01 to 4. The redshift distribution of this sample peaks at redshift of 1.5 and falls off rapidly beyond redshift 2.5. We also include an example application of this dataset for redshift estimation, demonstrating that using images for redshift estimation produces more accurate results compared to using photometry alone. For example, the bias in redshift estimate is a factor of 10 lower when using images between redshift of 0.1 to 1.25 compared to photometry alone. Results from dataset such as this will help inform us on how to best make use of data from the next generation of galaxy surveys.
- Abstract(参考訳): 本稿では、銀河測光、画像、分光赤方偏移、構造特性からなる機械学習応用のためのデータセットを提案する。
このデータセットは、ハイパー・サプライム・カム・サーベイPDR2からの286,401個の銀河の画像と光度を、5つの画像フィルター(g,r,i,z,y$)で分析し、分光学的に確認された赤方偏移を基底真理とする。
このようなデータセットは、均一で一貫性があり、最小限の外れ値を持つが、依然として現実的な信号対雑音比を含んでいるため、機械学習アプリケーションにとって重要である。
このデータセットを公開して、EuclidやLSSTといった次世代のサーベイのための機械学習手法の開発を促進するのに役立てる。
GalaxiesMLの目的は、天体物理学だけでなく機械学習にも使用できる堅牢なデータセットを提供することである。
本稿では,公開アーカイブからデータセットを作成する際の課題について述べる。
これは、0.01から4.4までのレッドシフトを備えた、このタイプのパブリック機械学習対応トレーニングセットの中で、最大のもののひとつだ。
この試料の赤方偏移分布は1.5の赤方偏移でピークに達し、赤方偏移2.5を超えている。
また、このデータセットを赤方偏移推定に応用し、赤方偏移推定に画像を用いることで、光度測定だけでより正確な結果が得られることを示した。
例えば、赤方偏移推定のバイアスは、光度のみと比較して0.1から1.25の赤方偏移の画像を使用する場合の10以下の係数である。
このようなデータセットの結果は、次世代の銀河調査のデータをどのように活用するかを教えてくれる。
関連論文リスト
- XAMI -- A Benchmark Dataset for Artefact Detection in XMM-Newton Optical Images [0.0]
我々は,XMM-Newton宇宙望遠鏡の光学モニタリングカメラから,異なる種類の人工物を示す画像のデータセットを提示する。
自動ML手法のトレーニングに使用するアーティファクトで,1000枚の画像のサンプルを手書きした。
我々は、畳み込みニューラルネットワーク(CNN)とトランスフォーマーベースのモデルの両方からの知識を組み合わせたハイブリッドアプローチを採用する。
論文 参考訳(メタデータ) (2024-06-25T07:14:15Z) - SIRST-5K: Exploring Massive Negatives Synthesis with Self-supervised
Learning for Robust Infrared Small Target Detection [53.19618419772467]
単一フレーム赤外線小ターゲット検出(SIRST)は、乱雑な背景から小さなターゲットを認識することを目的としている。
Transformerの開発に伴い、SIRSTモデルのスケールは常に増大している。
赤外線小ターゲットデータの多彩な多様性により,本アルゴリズムはモデル性能と収束速度を大幅に改善する。
論文 参考訳(メタデータ) (2024-03-08T16:14:54Z) - Preliminary Report on Mantis Shrimp: a Multi-Survey Computer Vision
Photometric Redshift Model [0.431625343223275]
光度赤偏移推定は天文学の確立されたサブフィールドである。
Mantis Shrimpは、超紫外(GALEX)、光学(PanSTARRS)、赤外線(UnWISE)画像を融合する、測光赤方偏移推定のためのコンピュータビジョンモデルである。
論文 参考訳(メタデータ) (2024-02-05T21:44:19Z) - AstroCLIP: A Cross-Modal Foundation Model for Galaxies [40.43521617393482]
AstroCLIPは、銀河の画像とスペクトルを個別に埋め込むため、トランスフォーマーベースの画像とスペクトルエンコーダを自己監督設定で事前訓練する。
教師付きベースラインと比較しても、下流のタスクで顕著なパフォーマンスが得られます。
提案手法は、銀河の画像とスペクトルの自己教師型変換器に基づく最初のアーキテクチャである。
論文 参考訳(メタデータ) (2023-10-04T17:59:38Z) - Photo-zSNthesis: Converting Type Ia Supernova Lightcurves to Redshift
Estimates via Deep Learning [0.0]
光-zSNthesisは、完全な赤方偏移確率分布を予測する畳み込みニューラルネットワークに基づく手法である。
PLAsTiCCシミュレーションでは予測バイアスデルタz>が61倍改善し,SDSSデータでは5倍改善した。
論文 参考訳(メタデータ) (2023-05-19T17:59:00Z) - Cosmology from Galaxy Redshift Surveys with PointNet [65.89809800010927]
宇宙論において、銀河赤方偏移サーベイは、宇宙における位置の置換不変な集まりに類似している。
我々は、ポイントクラウドデータから直接、宇宙パラメータの値を回帰するために、textitPointNetのようなニューラルネットワークを使用します。
我々のPointNetsの実装は、$mathcalO(104) - MathcalO(105)$銀河の入力を一度に分析できるので、この応用の初期の作業は、およそ2桁の精度で改善される。
論文 参考訳(メタデータ) (2022-11-22T15:35:05Z) - NoiSER: Noise is All You Need for Enhancing Low-Light Images Without
Task-Related Data [103.04999391668753]
タスク関連のトレーニングデータなしで、低照度画像を拡張できることが示される。
技術的には、アンダーラインノイズと呼ばれる新しい、魔法的で、効果的で効率的な方法を提案する。
我々のNoiSERは、量的および視覚的な結果の観点から、現在のタスク関連データに基づくLLIEモデルと非常に競合しています。
論文 参考訳(メタデータ) (2022-11-09T06:18:18Z) - CroCo: Cross-Modal Contrastive learning for localization of Earth
Observation data [62.96337162094726]
地上のLiDAR点雲をリモートセンシング画像上にローカライズすることに興味がある。
本稿では,DEMと高分解能光学画像に基づいて学習を行うコントラスト学習手法を提案する。
ベストシナリオは、トップ1スコア0.71、トップ5スコア0.81を得る。
論文 参考訳(メタデータ) (2022-04-14T15:55:00Z) - RGB-D Saliency Detection via Cascaded Mutual Information Minimization [122.8879596830581]
既存のRGB-Dサリエンシ検出モデルは、RGBと深さを効果的にマルチモーダル学習を実現するために明示的に奨励するものではない。
本稿では,RGB画像と深度データ間のマルチモーダル情報を「明示的」にモデル化するために,相互情報最小化による新しい多段階学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-15T12:31:27Z) - DeepShadows: Separating Low Surface Brightness Galaxies from Artifacts
using Deep Learning [70.80563014913676]
本研究では,低地光度銀河と人工物とを分離する問題に対する畳み込みニューラルネットワーク(CNN)の利用について検討する。
我々は、CNNが低地光度宇宙の研究に非常に有望な道を提供することを示した。
論文 参考訳(メタデータ) (2020-11-24T22:51:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。