Fugu-MT 論文翻訳(概要): MiraBest: A Dataset of Morphologically Classified Radio Galaxies for Machine Learning

論文の概要: MiraBest: A Dataset of Morphologically Classified Radio Galaxies for Machine Learning

arxiv url: http://arxiv.org/abs/2305.11108v1
Date: Thu, 18 May 2023 16:52:43 GMT
ステータス: 翻訳完了
システム内更新日: 2023-05-19 14:00:52.756614
Title: MiraBest: A Dataset of Morphologically Classified Radio Galaxies for Machine Learning
Title（参考訳）: MiraBest: 機械学習のための形態的に分類されたラジオギャラクシーのデータセット
Authors: Fiona A. M. Porter and Anna M. M. Scaife
Abstract要約: NVSSとFIRSTの1256個の無線ルードAGNのバッチデータセットであるMiraBestデータセットについて述べる。我々は、データセットの構築、サンプルの選択、および前処理の基礎となる原則の概要と、文献で使用される他のデータセットとの比較について概説する。 MiraBestデータセットを利用する既存のアプリケーションはレビューされ、2100ソースの拡張データセットは、MiraBestと他の無線ルードAGNカタログとの交差マッチングによって作成される。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The volume of data from current and future observatories has motivated the increased development and application of automated machine learning methodologies for astronomy. However, less attention has been given to the production of standardised datasets for assessing the performance of different machine learning algorithms within astronomy and astrophysics. Here we describe in detail the MiraBest dataset, a publicly available batched dataset of 1256 radio-loud AGN from NVSS and FIRST, filtered to $0.03 < z < 0.1$, manually labelled by Miraghaei and Best (2017) according to the Fanaroff-Riley morphological classification, created for machine learning applications and compatible for use with standard deep learning libraries. We outline the principles underlying the construction of the dataset, the sample selection and pre-processing methodology, dataset structure and composition, as well as a comparison of MiraBest to other datasets used in the literature. Existing applications that utilise the MiraBest dataset are reviewed, and an extended dataset of 2100 sources is created by cross-matching MiraBest with other catalogues of radio-loud AGN that have been used more widely in the literature for machine learning applications.
Abstract（参考訳）: 現在および将来の観測所からのデータ量の増加は、天文学のための自動機械学習方法論の開発と応用の促進を促した。しかし、天文学や天体物理学における異なる機械学習アルゴリズムのパフォーマンスを評価するための標準化データセットの作成には、あまり注意が払われていない。ここでは、NVSSとFIRSTから1256個の無線ルードAGNの公開バッチデータセットであるMiraBestデータセットを詳細に説明し、Fanaroff-Riley形態分類に従って、MiraghaeiとBest (2017)によって手作業でラベル付けされた0.03 < z < 0.1$にフィルタリングした。我々は、データセットの構築の基礎となる原則、サンプルの選択と事前処理の方法論、データセットの構造と構成、そして文献で使われる他のデータセットとの比較について概説する。 MiraBestデータセットを利用する既存のアプリケーションがレビューされ、2100ソースの拡張データセットがMiraBestと、機械学習応用の文献で広く使われている他の無線ルードAGNのカタログとの交差マッチングによって作成されます。

関連論文リスト

RGC-Bent: A Novel Dataset for Bent Radio Galaxy Classification [0.6684911303788182]
ベント放射能銀河核(AGN)は銀河団のダイナミクス、銀河団内の相互作用、AGNのより広い物理に関する洞察を提供する。本稿では、天文学的な観測において、曲がった放射能銀河核(AGN)の分類に適した新しい機械学習データセットを提案する。
論文参考訳（メタデータ） (2025-05-25T17:57:47Z)
What Makes Good Synthetic Training Data for Zero-Shot Stereo Matching? [57.49867420132091]
標準ベンチマークを用いてゼロショットステレオマッチング性能への影響を報告する。最適な設定を収集し、大規模なデータセットを作成することで、結果を検証する。我々は,プロシージャステレオデータセットのさらなる研究を可能にするために,我々のシステムをオープンソース化した。
論文参考訳（メタデータ） (2025-04-23T17:59:33Z)
EarthView: A Large Scale Remote Sensing Dataset for Self-Supervision [72.84868704100595]
本稿では,地球モニタリングタスクにおける深層学習アプリケーションを強化することを目的とした,リモートセンシングデータの自己監督を目的としたデータセットを提案する。このデータセットは15テラピクセルのグローバルリモートセンシングデータにまたがっており、NEON、Sentinel、Satellogicによる1mの空間解像度データの新たなリリースなど、さまざまなソースの画像を組み合わせている。このデータセットは、リモートセンシングデータの異なる課題に取り組むために開発されたMasked Autoencoderである。
論文参考訳（メタデータ） (2025-01-14T13:42:22Z)
ORBIT: Cost-Effective Dataset Curation for Large Language Model Domain Adaptation with an Astronomy Case Study [26.39743358097732]
ORBITは、ノイズの多いWebソースから大量の高品質なドメイン固有データセットをキュレートするための費用効率のよい手法である。 1Bの天文学部分集合上の微調整テキストscLLaMA-3-8Bは、MMLUの天文学ベンチマークの性能を69%から76%に改善した。このモデル (Orbit-LLaMA) はtextscLLaMA-3-8B-base より優れており, GPT-4o の評価では1000の天文学的な質問に対して 73% のケースで好んでいる。
論文参考訳（メタデータ） (2024-12-19T01:35:47Z)
AstroM$^3$: A self-supervised multimodal model for astronomy [0.0]
本稿では,モデルが複数のモーダルから同時に学習できる自己教師型事前学習手法AstroM$3$を提案する。具体的には、CLIP(Contrastive Language- Image Pretraining)モデルをトリモーダル設定に拡張し、時系列測光データ、スペクトル、天体物理メタデータの統合を可能にする。以上の結果から,CLIP事前学習により時系列光度測定の分類性能が向上し,精度が84.6%から91.5%に向上した。
論文参考訳（メタデータ） (2024-11-13T18:20:29Z)
Training Datasets Generation for Machine Learning: Application to Vision Based Navigation [0.0]
視覚ベースのナビゲーションは、画像から情報を抽出した後、GNCの精密センサーとしてカメラを利用する。宇宙アプリケーションにおける機械学習の採用を可能にするために、利用可能なトレーニングデータセットがアルゴリズムの検証に適していることの実証が障害のひとつだ。本研究の目的は,機械学習アルゴリズムの学習に適した画像とメタデータのデータセットを作成することである。
論文参考訳（メタデータ） (2024-09-17T17:34:24Z)
LADDER: Revisiting the Cosmic Distance Ladder with Deep Learning Approaches and Exploring its Applications [1.4330510916280879]
LADDERはパンテオンIa型超新星の観測データに基づいて訓練されている。宇宙論的な文脈における我々の手法の応用を実証し、一貫性チェックのためのモデルに依存しないツールとして機能する。
論文参考訳（メタデータ） (2024-01-30T14:06:09Z)
Domain Adaptation via Minimax Entropy for Real/Bogus Classification of Astronomical Alerts [39.58317527488534]
我々は、HiTS、DES、ATLAS、ZTFの4つの異なるデータセットを用いて、実際の天体警報の分類のためのドメイン適応(DA)を研究する。我々はこれらのデータセット間のドメインシフトを調査し、ミニマックスエントロピー(MME)を用いた微調整手法と半教師付き深度DAを用いて、素直な深度学習分類モデルを改善する。微調整モデルとMMEモデルの両方が、ターゲットデータセットから来るクラス毎のラベル付き項目が1つも少なく、ベースモデルを大幅に改善していることがわかったが、MMEはソースデータセットのパフォーマンスを損なわない。
論文参考訳（メタデータ） (2023-08-15T02:40:32Z)
infoVerse: A Universal Framework for Dataset Characterization with Multidimensional Meta-information [68.76707843019886]
infoVerseは、データセットの特徴付けのための普遍的なフレームワークである。 infoVerseは、様々なモデル駆動メタ情報を統合することで、データセットの多次元特性をキャプチャする。実世界の3つのアプリケーション(データプルーニング、アクティブラーニング、データアノテーション)において、infoVerse空間で選択されたサンプルは、強いベースラインを一貫して上回る。
論文参考訳（メタデータ） (2023-05-30T18:12:48Z)
Satellite Image Time Series Analysis for Big Earth Observation Data [50.591267188664666]
本稿では,機械学習を用いた衛星画像時系列解析のためのオープンソースRパッケージである sit について述べる。本手法は, Cerrado Biome のケーススタディにより, 土地利用と土地被覆マップの精度が高いことを示す。
論文参考訳（メタデータ） (2022-04-24T15:23:25Z)
AstronomicAL: An interactive dashboard for visualisation, integration and classification of data using Active Learning [0.0]
Astronomicalは、人間とループで対話的なラベリングとトレーニングのダッシュボードである。アクティブラーニングを使用して、信頼性の高いデータセットと堅牢な分類器を作成することができる。ユーザーは異なるソースからデータを視覚化して統合することができる。
論文参考訳（メタデータ） (2021-09-11T07:32:26Z)
First Full-Event Reconstruction from Imaging Atmospheric Cherenkov Telescope Real Data with Deep Learning [55.41644538483948]
チェレンコフ望遠鏡アレイは、地上のガンマ線天文学の未来である。地上で作られた最初のプロトタイプ望遠鏡であるLarge Size Telescope 1は現在、最初の科学データを収集している。我々は、深層畳み込みニューラルネットワークに基づくフルイベント再構築の開発とその実データへの適用を初めて提示する。
論文参考訳（メタデータ） (2021-05-31T12:51:42Z)
Moving Object Classification with a Sub-6 GHz Massive MIMO Array using Real Data [64.48836187884325]
無線信号を用いた屋内環境における各種活動の分類は,様々な応用の新たな技術である。本論文では,屋内環境におけるマルチインプット・マルチアウトプット(MIMO)システムから,機械学習を用いて移動物体の分類を解析する。
論文参考訳（メタデータ） (2021-02-09T15:48:35Z)
ACRONYM: A Large-Scale Grasp Dataset Based on Simulation [64.37675024289857]
ACRONYMは物理シミュレーションに基づくロボットグリップ計画のためのデータセットである。データセットには17.7Mのパラレルジャウグリップが含まれ、262の異なるカテゴリから8872のオブジェクトにまたがっている。我々は、この大規模で多様なデータセットの価値を、2つの最先端の学習に基づく把握計画アルゴリズムの訓練に利用することで示す。
論文参考訳（メタデータ） (2020-11-18T23:24:00Z)
Open Graph Benchmark: Datasets for Machine Learning on Graphs [86.96887552203479]
スケーラブルで堅牢で再現可能なグラフ機械学習(ML)の研究を容易にするために,Open Graph Benchmark(OGB)を提案する。 OGBデータセットは大規模で、複数の重要なグラフMLタスクを含み、さまざまなドメインをカバーする。各データセットに対して,有意義なアプリケーション固有のデータ分割と評価指標を用いた統一評価プロトコルを提供する。
論文参考訳（メタデータ） (2020-05-02T03:09:50Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。