論文の概要: Classification of HI Galaxy Profiles Using Unsupervised Learning and Convolutional Neural Networks: A Comparative Analysis and Methodological Cases of Studies
- arxiv url: http://arxiv.org/abs/2501.11657v1
- Date: Mon, 20 Jan 2025 18:39:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-22 14:20:15.668347
- Title: Classification of HI Galaxy Profiles Using Unsupervised Learning and Convolutional Neural Networks: A Comparative Analysis and Methodological Cases of Studies
- Title(参考訳): 教師なし学習と畳み込みニューラルネットワークを用いたHI銀河プロファイルの分類:研究の比較分析と方法論的事例
- Authors: Gabriel Jaimes-Illanes, Manuel Parra-Royon, Laura Darriba-Pol, Javier Moldón, Amidou Sorgho, Susana Sánchez-Expósito, Julián Garrido-Sánchez, Lourdes Verdes-Montenegro,
- Abstract要約: 宇宙で最も豊富な元素である水素は、銀河の形成と進化を理解するために不可欠である。
新しい無線機器では、データの量と複雑さが増している。
この研究は、教師なしの手法とCNNを組み合わせた機械学習技術を統合するフレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Hydrogen, the most abundant element in the universe, is crucial for understanding galaxy formation and evolution. The 21 cm neutral atomic hydrogen - HI spectral line maps the gas kinematics within galaxies, providing key insights into interactions, galactic structure, and star formation processes. With new radio instruments, the volume and complexity of data is increasing. To analyze and classify integrated HI spectral profiles in a efficient way, this work presents a framework that integrates Machine Learning techniques, combining unsupervised methods and CNNs. To this end, we apply our framework to a selected subsample of 318 spectral HI profiles of the CIG and 30.780 profiles from the Arecibo Legacy Fast ALFA Survey catalogue. Data pre-processing involved the Busyfit package and iterative fitting with polynomial, Gaussian, and double-Lorentzian models. Clustering methods, including K-means, spectral clustering, DBSCAN, and agglomerative clustering, were used for feature extraction and to bootstrap classification we applied K-NN, SVM, and Random Forest classifiers, optimizing accuracy with CNN. Additionally, we introduced a 2D model of the profiles to enhance classification by adding dimensionality to the data. Three 2D models were generated based on transformations and normalised versions to quantify the level of asymmetry. These methods were tested in a previous analytical classification study conducted by the Analysis of the Interstellar Medium in Isolated Galaxies group. This approach enhances classification accuracy and aims to establish a methodology that could be applied to data analysis in future surveys conducted with the Square Kilometre Array (SKA), currently under construction. All materials, code, and models have been made publicly available in an open-access repository, adhering to FAIR principles.
- Abstract(参考訳): 宇宙で最も豊富な元素である水素は、銀河の形成と進化を理解するために不可欠である。
21cm中性水素 - HIスペクトル線は銀河内のガスキネマティクスをマッピングし、相互作用、銀河構造、星形成過程に関する重要な洞察を与える。
新しい無線機器では、データの量と複雑さが増している。
統合HIスペクトルプロファイルを効率的に分析・分類するために,非教師なし手法とCNNを組み合わせた機械学習技術を統合するフレームワークを提案する。
この目的のために、我々は、CIGの318個のスペクトルHIプロファイルと、Arcibo Legacy Fast ALFA Surveyカタログの30.780個のプロファイルのサブサンプルに適用した。
データ前処理にはBusyfitパッケージと多項式、ガウスモデル、ダブルローレンツモデルによる反復フィッティングが含まれていた。
K-平均、スペクトルクラスタリング、DBSCAN、凝集クラスタリングなどのクラスタリング手法を特徴抽出やブートストラップ分類に使用し、K-NN、SVM、ランダムフォレスト分類器を適用し、CNNで精度を最適化した。
さらに,データに次元を追加して分類を強化するために,プロファイルの2次元モデルを導入した。
3つの2次元モデルが変換と正規化バージョンに基づいて生成され、非対称性のレベルが定量化された。
これらの手法は、孤立銀河群における星間媒質の分析によって行われた以前の分析分類研究で試験された。
この手法は分類精度を高め、現在建設中のSquare Kilometre Array (SKA) による将来の調査でデータ分析に適用可能な方法論を確立することを目的としている。
すべての材料、コード、モデルは、FAIR原則に従って、オープンアクセスリポジトリで公開されています。
関連論文リスト
- Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - ShapeSplat: A Large-scale Dataset of Gaussian Splats and Their Self-Supervised Pretraining [104.34751911174196]
ShapeNetとModelNetを用いた大規模3DGSデータセットを構築した。
データセットのShapeSplatは、87のユニークなカテゴリから65Kのオブジェクトで構成されています。
textbftextitGaussian-MAEを導入し、ガウスパラメータからの表現学習の独特な利点を強調した。
論文 参考訳(メタデータ) (2024-08-20T14:49:14Z) - Superpixel Graph Contrastive Clustering with Semantic-Invariant
Augmentations for Hyperspectral Images [64.72242126879503]
ハイパースペクトル画像(HSI)クラスタリングは重要な課題だが難しい課題である。
まず3次元と2次元のハイブリッド畳み込みニューラルネットワークを用いてHSIの高次空間およびスペクトルの特徴を抽出する。
次に,超画素グラフの対比クラスタリングモデルを設計し,識別的超画素表現を学習する。
論文 参考訳(メタデータ) (2024-03-04T07:40:55Z) - Multiview Subspace Clustering of Hyperspectral Images based on Graph
Convolutional Networks [12.275530282665578]
本研究では、グラフ畳み込みネットワークに基づくハイスペクトル画像(HSI)のマルチビューサブスペースクラスタリングを提案する。
このモデルは、インディアンパインズ、パヴィア大学、ヒューストンを含む3つの人気のあるHSIデータセットで評価された。
合計で92.38%、93.43%、83.82%の精度を達成し、最先端のクラスタリング法を著しく上回った。
論文 参考訳(メタデータ) (2024-03-03T10:19:18Z) - Contrastive Multi-view Subspace Clustering of Hyperspectral Images based
on Graph Convolutional Networks [14.978666092012856]
サブスペースクラスタリングは、ハイパースペクトル画像のクラスタリングに有効なアプローチである。
本研究では,グラフ畳み込みネットワークに基づくHSIのマルチビューサブスペースクラスタリングを提案する。
提案手法は,HSIのクラスタリング精度を効果的に向上する。
論文 参考訳(メタデータ) (2023-12-11T02:22:10Z) - Fast conformational clustering of extensive molecular dynamics
simulation data [19.444636864515726]
本稿では,長い軌道の高速なコンフォーメーションクラスタリングを実現するために,教師なしのデータ処理ワークフローを提案する。
我々は密度に基づく空間クラスタリングアルゴリズム(HDBSCAN)と2つの次元削減アルゴリズム(cc_analysisとEncodermap)を組み合わせる。
4つのテストシステムの助けを借りて、このクラスタリングワークフローの機能とパフォーマンスを説明します。
論文 参考訳(メタデータ) (2023-01-11T14:36:43Z) - Unified Multi-View Orthonormal Non-Negative Graph Based Clustering
Framework [74.25493157757943]
我々は,非負の特徴特性を活用し,多視点情報を統合された共同学習フレームワークに組み込む,新しいクラスタリングモデルを定式化する。
また、深層機能に基づいたクラスタリングデータに対するマルチモデル非負グラフベースのアプローチを初めて検討する。
論文 参考訳(メタデータ) (2022-11-03T08:18:27Z) - Unsupervised Machine Learning for Exploratory Data Analysis of Exoplanet
Transmission Spectra [68.8204255655161]
我々は、通過する太陽系外惑星のスペクトルデータを解析するための教師なし手法に焦点をあてる。
スペクトルデータには、適切な低次元表現を要求する高い相関関係があることが示される。
主成分に基づく興味深い構造、すなわち、異なる化学状態に対応する明確に定義された分岐を明らかにする。
論文 参考訳(メタデータ) (2022-01-07T22:26:33Z) - Detection of extragalactic Ultra-Compact Dwarfs and Globular Clusters
using Explainable AI techniques [1.3764085113103222]
銀河を取り巻く超コンパクト小星(UCD)や球状星団(GC)のような小さな恒星系は、これらの銀河を形成する融合現象のトレーサーとして知られている。
ここでは、Fornax銀河団のマルチ波長イメージングデータを用いて、これらの物体を前景の星や背景銀河から6個のフィルターで分離する機械学習モデルを訓練する。
精度と93%のリコールでUDD/GCを識別でき、各特徴量%(色と角の大きさ)の重要性を反映した関連性を提供します。
論文 参考訳(メタデータ) (2022-01-05T13:37:55Z) - MSHCNet: Multi-Stream Hybridized Convolutional Networks with Mixed
Statistics in Euclidean/Non-Euclidean Spaces and Its Application to
Hyperspectral Image Classification [0.35932002706017546]
ハイパースペクトル画像(HSI)は、豊富な空間スペクトルコンテキスト情報を含む。
HSI分類のためのDNNを用いたスペクトル情報と空間情報を効果的に組み合わせることが、新しい研究ホットスポットとなっている。
本稿では,HSIをセグメント化するための多視点補完情報を学習・融合するための,新しいマルチストリームハイブリッド畳み込みネットワーク(MSHCNet)を提案する。
論文 参考訳(メタデータ) (2021-10-07T11:35:40Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。