論文の概要: MiraBest: A Dataset of Morphologically Classified Radio Galaxies for
Machine Learning
- arxiv url: http://arxiv.org/abs/2305.11108v1
- Date: Thu, 18 May 2023 16:52:43 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-19 14:00:52.756614
- Title: MiraBest: A Dataset of Morphologically Classified Radio Galaxies for
Machine Learning
- Title(参考訳): MiraBest: 機械学習のための形態的に分類されたラジオギャラクシーのデータセット
- Authors: Fiona A. M. Porter and Anna M. M. Scaife
- Abstract要約: NVSSとFIRSTの1256個の無線ルードAGNのバッチデータセットであるMiraBestデータセットについて述べる。
我々は、データセットの構築、サンプルの選択、および前処理の基礎となる原則の概要と、文献で使用される他のデータセットとの比較について概説する。
MiraBestデータセットを利用する既存のアプリケーションはレビューされ、2100ソースの拡張データセットは、MiraBestと他の無線ルードAGNカタログとの交差マッチングによって作成される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The volume of data from current and future observatories has motivated the
increased development and application of automated machine learning
methodologies for astronomy. However, less attention has been given to the
production of standardised datasets for assessing the performance of different
machine learning algorithms within astronomy and astrophysics. Here we describe
in detail the MiraBest dataset, a publicly available batched dataset of 1256
radio-loud AGN from NVSS and FIRST, filtered to $0.03 < z < 0.1$, manually
labelled by Miraghaei and Best (2017) according to the Fanaroff-Riley
morphological classification, created for machine learning applications and
compatible for use with standard deep learning libraries. We outline the
principles underlying the construction of the dataset, the sample selection and
pre-processing methodology, dataset structure and composition, as well as a
comparison of MiraBest to other datasets used in the literature. Existing
applications that utilise the MiraBest dataset are reviewed, and an extended
dataset of 2100 sources is created by cross-matching MiraBest with other
catalogues of radio-loud AGN that have been used more widely in the literature
for machine learning applications.
- Abstract(参考訳): 現在および将来の観測所からのデータ量の増加は、天文学のための自動機械学習方法論の開発と応用の促進を促した。
しかし、天文学や天体物理学における異なる機械学習アルゴリズムのパフォーマンスを評価するための標準化データセットの作成には、あまり注意が払われていない。
ここでは、NVSSとFIRSTから1256個の無線ルードAGNの公開バッチデータセットであるMiraBestデータセットを詳細に説明し、Fanaroff-Riley形態分類に従って、MiraghaeiとBest (2017)によって手作業でラベル付けされた0.03 < z < 0.1$にフィルタリングした。
我々は、データセットの構築の基礎となる原則、サンプルの選択と事前処理の方法論、データセットの構造と構成、そして文献で使われる他のデータセットとの比較について概説する。
MiraBestデータセットを利用する既存のアプリケーションがレビューされ、2100ソースの拡張データセットがMiraBestと、機械学習応用の文献で広く使われている他の無線ルードAGNのカタログとの交差マッチングによって作成されます。
関連論文リスト
- EarthView: A Large Scale Remote Sensing Dataset for Self-Supervision [72.84868704100595]
本稿では,地球モニタリングタスクにおける深層学習アプリケーションを強化することを目的とした,リモートセンシングデータの自己監督を目的としたデータセットを提案する。
このデータセットは15テラピクセルのグローバルリモートセンシングデータにまたがっており、NEON、Sentinel、Satellogicによる1mの空間解像度データの新たなリリースなど、さまざまなソースの画像を組み合わせている。
このデータセットは、リモートセンシングデータの異なる課題に取り組むために開発されたMasked Autoencoderである。
論文 参考訳(メタデータ) (2025-01-14T13:42:22Z) - ORBIT: Cost-Effective Dataset Curation for Large Language Model Domain Adaptation with an Astronomy Case Study [26.39743358097732]
ORBITは、ノイズの多いWebソースから大量の高品質なドメイン固有データセットをキュレートするための費用効率のよい手法である。
1Bの天文学部分集合上の微調整テキストscLLaMA-3-8Bは、MMLUの天文学ベンチマークの性能を69%から76%に改善した。
このモデル (Orbit-LLaMA) はtextscLLaMA-3-8B-base より優れており, GPT-4o の評価では1000の天文学的な質問に対して 73% のケースで好んでいる。
論文 参考訳(メタデータ) (2024-12-19T01:35:47Z) - AstroM$^3$: A self-supervised multimodal model for astronomy [0.0]
本稿では,モデルが複数のモーダルから同時に学習できる自己教師型事前学習手法AstroM$3$を提案する。
具体的には、CLIP(Contrastive Language- Image Pretraining)モデルをトリモーダル設定に拡張し、時系列測光データ、スペクトル、天体物理メタデータの統合を可能にする。
以上の結果から,CLIP事前学習により時系列光度測定の分類性能が向上し,精度が84.6%から91.5%に向上した。
論文 参考訳(メタデータ) (2024-11-13T18:20:29Z) - LADDER: Revisiting the Cosmic Distance Ladder with Deep Learning Approaches and Exploring its Applications [1.4330510916280879]
LADDERはパンテオンIa型超新星の観測データに基づいて訓練されている。
宇宙論的な文脈における我々の手法の応用を実証し、一貫性チェックのためのモデルに依存しないツールとして機能する。
論文 参考訳(メタデータ) (2024-01-30T14:06:09Z) - Domain Adaptation via Minimax Entropy for Real/Bogus Classification of
Astronomical Alerts [39.58317527488534]
我々は、HiTS、DES、ATLAS、ZTFの4つの異なるデータセットを用いて、実際の天体警報の分類のためのドメイン適応(DA)を研究する。
我々はこれらのデータセット間のドメインシフトを調査し、ミニマックスエントロピー(MME)を用いた微調整手法と半教師付き深度DAを用いて、素直な深度学習分類モデルを改善する。
微調整モデルとMMEモデルの両方が、ターゲットデータセットから来るクラス毎のラベル付き項目が1つも少なく、ベースモデルを大幅に改善していることがわかったが、MMEはソースデータセットのパフォーマンスを損なわない。
論文 参考訳(メタデータ) (2023-08-15T02:40:32Z) - infoVerse: A Universal Framework for Dataset Characterization with
Multidimensional Meta-information [68.76707843019886]
infoVerseは、データセットの特徴付けのための普遍的なフレームワークである。
infoVerseは、様々なモデル駆動メタ情報を統合することで、データセットの多次元特性をキャプチャする。
実世界の3つのアプリケーション(データプルーニング、アクティブラーニング、データアノテーション)において、infoVerse空間で選択されたサンプルは、強いベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2023-05-30T18:12:48Z) - Satellite Image Time Series Analysis for Big Earth Observation Data [50.591267188664666]
本稿では,機械学習を用いた衛星画像時系列解析のためのオープンソースRパッケージである sit について述べる。
本手法は, Cerrado Biome のケーススタディにより, 土地利用と土地被覆マップの精度が高いことを示す。
論文 参考訳(メタデータ) (2022-04-24T15:23:25Z) - AstronomicAL: An interactive dashboard for visualisation, integration
and classification of data using Active Learning [0.0]
Astronomicalは、人間とループで対話的なラベリングとトレーニングのダッシュボードである。
アクティブラーニングを使用して、信頼性の高いデータセットと堅牢な分類器を作成することができる。
ユーザーは異なるソースからデータを視覚化して統合することができる。
論文 参考訳(メタデータ) (2021-09-11T07:32:26Z) - First Full-Event Reconstruction from Imaging Atmospheric Cherenkov
Telescope Real Data with Deep Learning [55.41644538483948]
チェレンコフ望遠鏡アレイは、地上のガンマ線天文学の未来である。
地上で作られた最初のプロトタイプ望遠鏡であるLarge Size Telescope 1は現在、最初の科学データを収集している。
我々は、深層畳み込みニューラルネットワークに基づくフルイベント再構築の開発とその実データへの適用を初めて提示する。
論文 参考訳(メタデータ) (2021-05-31T12:51:42Z) - ACRONYM: A Large-Scale Grasp Dataset Based on Simulation [64.37675024289857]
ACRONYMは物理シミュレーションに基づくロボットグリップ計画のためのデータセットである。
データセットには17.7Mのパラレルジャウグリップが含まれ、262の異なるカテゴリから8872のオブジェクトにまたがっている。
我々は、この大規模で多様なデータセットの価値を、2つの最先端の学習に基づく把握計画アルゴリズムの訓練に利用することで示す。
論文 参考訳(メタデータ) (2020-11-18T23:24:00Z) - Open Graph Benchmark: Datasets for Machine Learning on Graphs [86.96887552203479]
スケーラブルで堅牢で再現可能なグラフ機械学習(ML)の研究を容易にするために,Open Graph Benchmark(OGB)を提案する。
OGBデータセットは大規模で、複数の重要なグラフMLタスクを含み、さまざまなドメインをカバーする。
各データセットに対して,有意義なアプリケーション固有のデータ分割と評価指標を用いた統一評価プロトコルを提供する。
論文 参考訳(メタデータ) (2020-05-02T03:09:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。