論文の概要: GalaxAlign: Mimicking Citizen Scientists' Multimodal Guidance for Galaxy Morphology Analysis
- arxiv url: http://arxiv.org/abs/2411.19475v2
- Date: Wed, 03 Sep 2025 09:19:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:02.903353
- Title: GalaxAlign: Mimicking Citizen Scientists' Multimodal Guidance for Galaxy Morphology Analysis
- Title(参考訳): GalaxAlign: 銀河形態解析のための市民科学者のマルチモーダルガイダンス
- Authors: Ruoqi Wang, Haitao Wang, Qiong Luo,
- Abstract要約: 銀河形態解析では、銀河の形状や構造を解析する。
既存の方法は、大きな注釈付きデータセット上でドメイン固有の基礎モデルをトレーニングするか、小さなイメージセット上で微調整された視覚基盤モデルをトレーニングする。
私たちは、市民科学者が天文学的な画像の中で銀河を識別する方法に触発されたマルチモーダルアプローチであるGalaxAlignを紹介します。
- 参考スコア(独自算出の注目度): 4.557098550366064
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Galaxy morphology analysis involves studying galaxies based on their shapes and structures. For such studies, fundamental tasks include identifying and classifying galaxies in astronomical images, as well as retrieving visually or structurally similar galaxies through similarity search. Existing methods either directly train domain-specific foundation models on large, annotated datasets or fine-tune vision foundation models on a smaller set of images. The former is effective but costly, while the latter is more resource-efficient but often yields lower accuracy. To address these challenges, we introduce GalaxAlign, a multimodal approach inspired by how citizen scientists identify galaxies in astronomical images by following textual descriptions and matching schematic symbols. Specifically, GalaxAlign employs a tri-modal alignment framework to align three types of data during fine-tuning: (1) schematic symbols representing galaxy shapes and structures, (2) textual labels for these symbols, and (3) galaxy images. By incorporating multimodal instructions, GalaxAlign eliminates the need for expensive pretraining and enhances the effectiveness of fine-tuning. Experiments on galaxy classification and similarity search demonstrate that our method effectively fine-tunes general pre-trained models for astronomical tasks by incorporating domain-specific multi-modal knowledge. Code is available at https://github.com/RapidsAtHKUST/GalaxAlign.
- Abstract(参考訳): 銀河形態学解析では、銀河の形状や構造を解析する。
このような研究には、天体画像中の銀河の識別と分類、類似性探索による視覚的または構造的に類似した銀河の検索が含まれる。
既存の方法は、大きな注釈付きデータセット上でドメイン固有の基礎モデルをトレーニングするか、小さなイメージセット上で微調整された視覚基盤モデルをトレーニングする。
前者は有効だが費用がかかるが、後者はより資源効率が良いが、しばしば精度が低い。
これらの課題に対処するために、我々はGalaxAlignというマルチモーダルなアプローチを紹介した。
具体的には、GalaxAlignは、微調整中に3種類のデータを整列するために、トリモーダルアライメントフレームワークを使用している:(1)銀河の形状と構造を表す図形記号、(2)これらのシンボルのテキストラベル、(3)銀河画像。
マルチモーダル命令を組み込むことで、GalaxAlignは高価な事前トレーニングの必要性を排除し、微調整の有効性を高める。
銀河分類と類似性探索の実験により,本手法は領域固有のマルチモーダル知識を組み込むことで,天文学的タスクの訓練済みモデルを効果的に微調整できることが証明された。
コードはhttps://github.com/RapidsAtHKUST/GalaxAlignで入手できる。
関連論文リスト
- Object Affordance Recognition and Grounding via Multi-scale Cross-modal Representation Learning [64.32618490065117]
Embodied AIの中核的な問題は、人間がしているように、観察からオブジェクト操作を学ぶことだ。
本稿では,3D表現の可利用性を学習し,段階的推論戦略を採用する新しい手法を提案する。
提案手法の有効性を実証し,アベイランスグラウンドと分類の両面での性能向上を示した。
論文 参考訳(メタデータ) (2025-08-02T04:14:18Z) - Can AI Dream of Unseen Galaxies? Conditional Diffusion Model for Galaxy Morphology Augmentation [4.3933321767775135]
本研究では,機械学習データを拡張するために,現実的な銀河画像を合成するための条件拡散モデルを提案する。
本研究では,本モデルが特定の形態的特徴条件に密着した多彩な高忠実度銀河画像を生成することを示す。
このモデルにより、生成外挿により、よく注釈付けされたデータを未知の領域に投影し、希少なオブジェクト検出を進めることができる。
論文 参考訳(メタデータ) (2025-06-19T11:44:09Z) - UniPre3D: Unified Pre-training of 3D Point Cloud Models with Cross-Modal Gaussian Splatting [64.31900521467362]
既存の事前学習方法は、オブジェクトレベルとシーンレベルの両方の点群に対して等しく有効である。
UniPre3Dは,任意のスケールの点群やアーキテクチャの3Dモデルに対してシームレスに適用可能な,最初の統合事前学習手法である。
論文 参考訳(メタデータ) (2025-06-11T17:23:21Z) - Toward Efficient Visual Gyroscopes: Spherical Moments, Harmonics Filtering, and Masking Techniques for Spherical Camera Applications [83.8743080143778]
視覚ジャイロスコープは、画像を通してカメラの回転を推定する。
従来のRGBカメラに比べて視野が広い全方位カメラの統合は、より正確で堅牢な結果をもたらすことが証明されている。
本稿では,効率的なマルチマスク・フィルタ回転エステータと学習に基づく最適化を組み合わせた,新しい視覚ジャイロスコープを導入することで,これらの課題に対処する。
論文 参考訳(メタデータ) (2024-04-02T13:19:06Z) - Galaxy Classification: A machine learning approach for classifying
shapes using numerical data [0.0]
我々は,Galaxy Zooプロジェクトの数値データを用いて,銀河分類のための機械学習モデルを提案する。
我々のモデルは銀河の分類において高い精度を達成し、銀河の形成と進化の理解を著しく向上させる可能性を持っている。
論文 参考訳(メタデータ) (2023-11-30T20:47:16Z) - Spiral-Elliptical automated galaxy morphology classification from
telescope images [0.40792653193642503]
我々は、望遠鏡の銀河画像から効率的に抽出できる2つの新しい銀河形態統計、降下平均と降下分散を開発した。
我々は,Sloan Digital Sky Surveyの銀河画像データを用いて,提案した画像統計の有効性能を実証した。
論文 参考訳(メタデータ) (2023-10-10T22:36:52Z) - Semi-Supervised Domain Adaptation for Cross-Survey Galaxy Morphology
Classification and Anomaly Detection [57.85347204640585]
We developed a Universal Domain Adaptation method DeepAstroUDA。
異なるタイプのクラスオーバーラップしたデータセットに適用することができる。
初めて、我々は2つの非常に異なる観測データセットに対するドメイン適応の有効利用を実演した。
論文 参考訳(メタデータ) (2022-11-01T18:07:21Z) - Inferring Structural Parameters of Low-Surface-Brightness-Galaxies with
Uncertainty Quantification using Bayesian Neural Networks [70.80563014913676]
ベイズニューラルネットワーク (BNN) を用いて, シミュレーションした低地表面明度銀河画像から, それらのパラメータの不確かさを推測できることを示す。
従来のプロファイル適合法と比較して、BNNを用いて得られた不確実性は等しく、よく校正され、パラメータの点推定は真の値に近いことを示す。
論文 参考訳(メタデータ) (2022-07-07T17:55:26Z) - Generic Lithography Modeling with Dual-band Optics-Inspired Neural
Networks [52.200624127512874]
我々は、リソグラフィの基礎となる光学物理を考慮に入れたデュアルバンド光インスパイアされたニューラルネットワーク設計を導入する。
提案手法は, タイルサイズが1nm2/ピクセル解像度で最初に公表された金属/金属層輪郭シミュレーションである。
また,従来のリソグラフィーシミュレータよりも精度1%の精度で85倍の高速化を実現した。
論文 参考訳(メタデータ) (2022-03-12T08:08:50Z) - MonoDistill: Learning Spatial Features for Monocular 3D Object Detection [80.74622486604886]
本稿では,LiDAR信号からの空間情報を単分子3D検出器に導入するための簡易かつ効果的な手法を提案する。
得られたデータを用いて、ベースラインモデルと同じアーキテクチャで3D検出器をトレーニングする。
実験の結果,提案手法はベースラインモデルの性能を大幅に向上させることができることがわかった。
論文 参考訳(メタデータ) (2022-01-26T09:21:41Z) - Practical Galaxy Morphology Tools from Deep Supervised Representation
Learning [0.0]
深層学習モデルは、銀河の意味的な意味的表現を学習する。
我々はこれらの表現を利用して、大きな銀河のサンプルを調べるのに不可欠ないくつかの実践的なタスクにおいて、既存のアプローチを上回ります。
論文 参考訳(メタデータ) (2021-10-25T08:46:16Z) - Morphological Classification of Galaxies in S-PLUS using an Ensemble of
Convolutional Networks [0.0]
我々は,Galaxy Zooプロジェクトの正確な視覚分類とemph Deep Learning手法を組み合わせる。
ニューラルネットワークモデルは、他の4つの畳み込みモデルのアンサンブルによって作成され、どの個人でも得られるものよりも、分類の精度が高い。
論文 参考訳(メタデータ) (2021-07-05T21:51:19Z) - Morphological classification of astronomical images with limited
labelling [0.0]
本稿では, 対向オートエンコーダ(AAE)モデルの能動的学習に基づく, 銀河形態分類の効果的な半教師付き手法を提案する。
2値分類問題(Galaxy Zoo 2決定木のトップレベル問題)では、わずか0.86万のマークアップアクションで、テスト部分で93.1%の精度を達成した。
マークアップ精度が95.5%のベストモデルです。
論文 参考訳(メタデータ) (2021-04-27T19:26:27Z) - Deep Magnification-Flexible Upsampling over 3D Point Clouds [103.09504572409449]
本稿では,高密度点雲を生成するためのエンドツーエンド学習ベースのフレームワークを提案する。
まずこの問題を明示的に定式化し、重みと高次近似誤差を判定する。
そこで我々は,高次改良とともに,統一重みとソート重みを適応的に学習する軽量ニューラルネットワークを設計する。
論文 参考訳(メタデータ) (2020-11-25T14:00:18Z) - DeepShadows: Separating Low Surface Brightness Galaxies from Artifacts
using Deep Learning [70.80563014913676]
本研究では,低地光度銀河と人工物とを分離する問題に対する畳み込みニューラルネットワーク(CNN)の利用について検討する。
我々は、CNNが低地光度宇宙の研究に非常に有望な道を提供することを示した。
論文 参考訳(メタデータ) (2020-11-24T22:51:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。