論文の概要: MiraBest: A Dataset of Morphologically Classified Radio Galaxies for
Machine Learning
- arxiv url: http://arxiv.org/abs/2305.11108v1
- Date: Thu, 18 May 2023 16:52:43 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-19 14:00:52.756614
- Title: MiraBest: A Dataset of Morphologically Classified Radio Galaxies for
Machine Learning
- Title(参考訳): MiraBest: 機械学習のための形態的に分類されたラジオギャラクシーのデータセット
- Authors: Fiona A. M. Porter and Anna M. M. Scaife
- Abstract要約: NVSSとFIRSTの1256個の無線ルードAGNのバッチデータセットであるMiraBestデータセットについて述べる。
我々は、データセットの構築、サンプルの選択、および前処理の基礎となる原則の概要と、文献で使用される他のデータセットとの比較について概説する。
MiraBestデータセットを利用する既存のアプリケーションはレビューされ、2100ソースの拡張データセットは、MiraBestと他の無線ルードAGNカタログとの交差マッチングによって作成される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The volume of data from current and future observatories has motivated the
increased development and application of automated machine learning
methodologies for astronomy. However, less attention has been given to the
production of standardised datasets for assessing the performance of different
machine learning algorithms within astronomy and astrophysics. Here we describe
in detail the MiraBest dataset, a publicly available batched dataset of 1256
radio-loud AGN from NVSS and FIRST, filtered to $0.03 < z < 0.1$, manually
labelled by Miraghaei and Best (2017) according to the Fanaroff-Riley
morphological classification, created for machine learning applications and
compatible for use with standard deep learning libraries. We outline the
principles underlying the construction of the dataset, the sample selection and
pre-processing methodology, dataset structure and composition, as well as a
comparison of MiraBest to other datasets used in the literature. Existing
applications that utilise the MiraBest dataset are reviewed, and an extended
dataset of 2100 sources is created by cross-matching MiraBest with other
catalogues of radio-loud AGN that have been used more widely in the literature
for machine learning applications.
- Abstract(参考訳): 現在および将来の観測所からのデータ量の増加は、天文学のための自動機械学習方法論の開発と応用の促進を促した。
しかし、天文学や天体物理学における異なる機械学習アルゴリズムのパフォーマンスを評価するための標準化データセットの作成には、あまり注意が払われていない。
ここでは、NVSSとFIRSTから1256個の無線ルードAGNの公開バッチデータセットであるMiraBestデータセットを詳細に説明し、Fanaroff-Riley形態分類に従って、MiraghaeiとBest (2017)によって手作業でラベル付けされた0.03 < z < 0.1$にフィルタリングした。
我々は、データセットの構築の基礎となる原則、サンプルの選択と事前処理の方法論、データセットの構造と構成、そして文献で使われる他のデータセットとの比較について概説する。
MiraBestデータセットを利用する既存のアプリケーションがレビューされ、2100ソースの拡張データセットがMiraBestと、機械学習応用の文献で広く使われている他の無線ルードAGNのカタログとの交差マッチングによって作成されます。
関連論文リスト
- AstroM$^3$: A self-supervised multimodal model for astronomy [0.0]
本稿では,モデルが複数のモーダルから同時に学習できる自己教師型事前学習手法AstroM$3$を提案する。
具体的には、CLIP(Contrastive Language- Image Pretraining)モデルをトリモーダル設定に拡張し、時系列測光データ、スペクトル、天体物理メタデータの統合を可能にする。
以上の結果から,CLIP事前学習により時系列光度測定の分類性能が向上し,精度が84.6%から91.5%に向上した。
論文 参考訳(メタデータ) (2024-11-13T18:20:29Z) - Training Datasets Generation for Machine Learning: Application to Vision Based Navigation [0.0]
視覚ベースのナビゲーションは、画像から情報を抽出した後、GNCの精密センサーとしてカメラを利用する。
宇宙アプリケーションにおける機械学習の採用を可能にするために、利用可能なトレーニングデータセットがアルゴリズムの検証に適していることの実証が障害のひとつだ。
本研究の目的は,機械学習アルゴリズムの学習に適した画像とメタデータのデータセットを作成することである。
論文 参考訳(メタデータ) (2024-09-17T17:34:24Z) - LADDER: Revisiting the Cosmic Distance Ladder with Deep Learning Approaches and Exploring its Applications [1.4330510916280879]
LADDERはパンテオンIa型超新星の観測データに基づいて訓練されている。
宇宙論的な文脈における我々の手法の応用を実証し、一貫性チェックのためのモデルに依存しないツールとして機能する。
論文 参考訳(メタデータ) (2024-01-30T14:06:09Z) - Domain Adaptation via Minimax Entropy for Real/Bogus Classification of
Astronomical Alerts [39.58317527488534]
我々は、HiTS、DES、ATLAS、ZTFの4つの異なるデータセットを用いて、実際の天体警報の分類のためのドメイン適応(DA)を研究する。
我々はこれらのデータセット間のドメインシフトを調査し、ミニマックスエントロピー(MME)を用いた微調整手法と半教師付き深度DAを用いて、素直な深度学習分類モデルを改善する。
微調整モデルとMMEモデルの両方が、ターゲットデータセットから来るクラス毎のラベル付き項目が1つも少なく、ベースモデルを大幅に改善していることがわかったが、MMEはソースデータセットのパフォーマンスを損なわない。
論文 参考訳(メタデータ) (2023-08-15T02:40:32Z) - infoVerse: A Universal Framework for Dataset Characterization with
Multidimensional Meta-information [68.76707843019886]
infoVerseは、データセットの特徴付けのための普遍的なフレームワークである。
infoVerseは、様々なモデル駆動メタ情報を統合することで、データセットの多次元特性をキャプチャする。
実世界の3つのアプリケーション(データプルーニング、アクティブラーニング、データアノテーション)において、infoVerse空間で選択されたサンプルは、強いベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2023-05-30T18:12:48Z) - Satellite Image Time Series Analysis for Big Earth Observation Data [50.591267188664666]
本稿では,機械学習を用いた衛星画像時系列解析のためのオープンソースRパッケージである sit について述べる。
本手法は, Cerrado Biome のケーススタディにより, 土地利用と土地被覆マップの精度が高いことを示す。
論文 参考訳(メタデータ) (2022-04-24T15:23:25Z) - AstronomicAL: An interactive dashboard for visualisation, integration
and classification of data using Active Learning [0.0]
Astronomicalは、人間とループで対話的なラベリングとトレーニングのダッシュボードである。
アクティブラーニングを使用して、信頼性の高いデータセットと堅牢な分類器を作成することができる。
ユーザーは異なるソースからデータを視覚化して統合することができる。
論文 参考訳(メタデータ) (2021-09-11T07:32:26Z) - First Full-Event Reconstruction from Imaging Atmospheric Cherenkov
Telescope Real Data with Deep Learning [55.41644538483948]
チェレンコフ望遠鏡アレイは、地上のガンマ線天文学の未来である。
地上で作られた最初のプロトタイプ望遠鏡であるLarge Size Telescope 1は現在、最初の科学データを収集している。
我々は、深層畳み込みニューラルネットワークに基づくフルイベント再構築の開発とその実データへの適用を初めて提示する。
論文 参考訳(メタデータ) (2021-05-31T12:51:42Z) - Moving Object Classification with a Sub-6 GHz Massive MIMO Array using
Real Data [64.48836187884325]
無線信号を用いた屋内環境における各種活動の分類は,様々な応用の新たな技術である。
本論文では,屋内環境におけるマルチインプット・マルチアウトプット(MIMO)システムから,機械学習を用いて移動物体の分類を解析する。
論文 参考訳(メタデータ) (2021-02-09T15:48:35Z) - ACRONYM: A Large-Scale Grasp Dataset Based on Simulation [64.37675024289857]
ACRONYMは物理シミュレーションに基づくロボットグリップ計画のためのデータセットである。
データセットには17.7Mのパラレルジャウグリップが含まれ、262の異なるカテゴリから8872のオブジェクトにまたがっている。
我々は、この大規模で多様なデータセットの価値を、2つの最先端の学習に基づく把握計画アルゴリズムの訓練に利用することで示す。
論文 参考訳(メタデータ) (2020-11-18T23:24:00Z) - Open Graph Benchmark: Datasets for Machine Learning on Graphs [86.96887552203479]
スケーラブルで堅牢で再現可能なグラフ機械学習(ML)の研究を容易にするために,Open Graph Benchmark(OGB)を提案する。
OGBデータセットは大規模で、複数の重要なグラフMLタスクを含み、さまざまなドメインをカバーする。
各データセットに対して,有意義なアプリケーション固有のデータ分割と評価指標を用いた統一評価プロトコルを提供する。
論文 参考訳(メタデータ) (2020-05-02T03:09:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。