論文の概要: Can AI Dream of Unseen Galaxies? Conditional Diffusion Model for Galaxy Morphology Augmentation
- arxiv url: http://arxiv.org/abs/2506.16233v1
- Date: Thu, 19 Jun 2025 11:44:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 19:00:05.045586
- Title: Can AI Dream of Unseen Galaxies? Conditional Diffusion Model for Galaxy Morphology Augmentation
- Title(参考訳): 未知の銀河のAIドリームは可能か? 銀河形態の増大のための条件付き拡散モデル
- Authors: Chenrui Ma, Zechang Sun, Tao Jing, Zheng Cai, Yuan-Sen Ting, Song Huang, Mingyu Li,
- Abstract要約: 本研究では,機械学習データを拡張するために,現実的な銀河画像を合成するための条件拡散モデルを提案する。
本研究では,本モデルが特定の形態的特徴条件に密着した多彩な高忠実度銀河画像を生成することを示す。
このモデルにより、生成外挿により、よく注釈付けされたデータを未知の領域に投影し、希少なオブジェクト検出を進めることができる。
- 参考スコア(独自算出の注目度): 4.3933321767775135
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Observational astronomy relies on visual feature identification to detect critical astrophysical phenomena. While machine learning (ML) increasingly automates this process, models often struggle with generalization in large-scale surveys due to the limited representativeness of labeled datasets -- whether from simulations or human annotation -- a challenge pronounced for rare yet scientifically valuable objects. To address this, we propose a conditional diffusion model to synthesize realistic galaxy images for augmenting ML training data. Leveraging the Galaxy Zoo 2 dataset which contains visual feature -- galaxy image pairs from volunteer annotation, we demonstrate that our model generates diverse, high-fidelity galaxy images closely adhere to the specified morphological feature conditions. Moreover, this model enables generative extrapolation to project well-annotated data into unseen domains and advancing rare object detection. Integrating synthesized images into ML pipelines improves performance in standard morphology classification, boosting completeness and purity by up to 30\% across key metrics. For rare object detection, using early-type galaxies with prominent dust lane features ( $\sim$0.1\% in GZ2 dataset) as a test case, our approach doubled the number of detected instances from 352 to 872, compared to previous studies based on visual inspection. This study highlights the power of generative models to bridge gaps between scarce labeled data and the vast, uncharted parameter space of observational astronomy and sheds insight for future astrophysical foundation model developments. Our project homepage is available at https://galaxysd-webpage.streamlit.app/.
- Abstract(参考訳): 観測天文学は、重要な天体物理学現象を検出するために視覚的特徴識別に依存している。
機械学習(ML)はこのプロセスをますます自動化するが、モデルはしばしば、ラベル付きデータセット(シミュレーションや人間のアノテーションなど)の限定的な代表性のため、大規模な調査で一般化に苦慮する。
そこで本研究では,MLトレーニングデータを拡張するために,現実的な銀河画像を合成するための条件拡散モデルを提案する。
視覚的特徴を含むGalaxy Zoo 2データセットを利用して、ボランティアアノテーションから銀河画像対を抽出し、我々のモデルが特定の形態的特徴条件に密着した多彩な高忠実な銀河画像を生成することを示した。
さらに、このモデルにより、生成外挿により、よく注釈付けされたデータを未知の領域に投影し、希少なオブジェクト検出を進めることができる。
合成画像をMLパイプラインに統合することで、標準形態素分類のパフォーマンスが向上し、キーメトリクス全体の完全性と純度が最大30%向上する。
希少な物体検出のためには,GZ2データセットの顕著なダストレーン特徴を持つ早期型銀河($\sim$0.1\%)をテストケースとして用いた。
本研究は、希少なラベル付きデータと観測天文学の広大なパラメータ空間とのギャップを埋めるための生成モデルの力を強調し、将来の天体物理学基礎モデルの発展を示唆する。
プロジェクトのホームページはhttps://galaxysd-webpage.streamlit.app/.comで公開されている。
関連論文リスト
- Category-based Galaxy Image Generation via Diffusion Models [0.39945675027960637]
拡散モデルのネットワーク設計において、銀河画像の特徴と天体物理特性の両方を活用する天文学における最初のフレームワークであるGalCatDiffを提案する。
GalCatDiffは拡張されたU-NetとAstro-RAB(Residual Attention Block)という新しいブロックを組み込んでいる。
実験により、GalCatDiffはサンプルの色と大きさの分布の整合性において既存の手法よりも優れており、生成した銀河は視覚的にも現実的にも物理的に整合性があることが示された。
論文 参考訳(メタデータ) (2025-06-19T12:14:33Z) - A Versatile Framework for Analyzing Galaxy Image Data by Implanting Human-in-the-loop on a Large Vision Model [14.609681101463334]
大型ビジョンモデル(LVM)と下流タスク(DST)に基づく銀河画像の一般解析のためのフレームワークを提案する。
銀河画像の低信号-雑音比を考えると、我々は大きな視覚モデルにHuman-in-the-loop (HITL)モジュールを組み込んだ。
1000のデータポイントでトレーニングされたオブジェクト検出では、DSTが96.7%、ResNet50とMask R-CNNが93.1%である。
論文 参考訳(メタデータ) (2024-05-17T16:29:27Z) - GenFace: A Large-Scale Fine-Grained Face Forgery Benchmark and Cross Appearance-Edge Learning [50.7702397913573]
フォトリアリスティック・ジェネレータの急速な進歩は、真の画像と操作された画像の相違がますます不明瞭になっている臨界点に達している。
公開されている顔の偽造データセットはいくつかあるが、偽造顔は主にGANベースの合成技術を用いて生成される。
我々は,大規模で多様できめ細かな高忠実度データセットであるGenFaceを提案し,ディープフェイク検出の進展を促進する。
論文 参考訳(メタデータ) (2024-02-03T03:13:50Z) - Learned representation-guided diffusion models for large-image generation [58.192263311786824]
自己教師型学習(SSL)からの埋め込みを条件とした拡散モデルを訓練する新しいアプローチを導入する。
我々の拡散モデルは、これらの特徴を高品質な病理組織学およびリモートセンシング画像に投影することに成功した。
実画像のバリエーションを生成して実データを増やすことにより、パッチレベルおよび大規模画像分類タスクの下流精度が向上する。
論文 参考訳(メタデータ) (2023-12-12T14:45:45Z) - Discovering Galaxy Features via Dataset Distillation [7.121183597915665]
多くのアプリケーションにおいて、ニューラルネット(NN)は、人間の能力以上の分類性能を持つ。
ここでは、このアイデアを銀河分類の非常に難しい課題に適用する。
ニューラルネットワークのレンズを通して原型銀河形態を要約し視覚化する新しい方法を提案する。
論文 参考訳(メタデータ) (2023-11-29T12:39:31Z) - Semi-Supervised Domain Adaptation for Cross-Survey Galaxy Morphology
Classification and Anomaly Detection [57.85347204640585]
We developed a Universal Domain Adaptation method DeepAstroUDA。
異なるタイプのクラスオーバーラップしたデータセットに適用することができる。
初めて、我々は2つの非常に異なる観測データセットに対するドメイン適応の有効利用を実演した。
論文 参考訳(メタデータ) (2022-11-01T18:07:21Z) - Realistic galaxy image simulation via score-based generative models [0.0]
本研究では,銀河の観測を模倣した現実的かつ偽のイメージを生成するために,スコアベースの生成モデルが利用できることを示す。
主観的には、生成された銀河は実際のデータセットのサンプルと比較すると非常に現実的である。
論文 参考訳(メタデータ) (2021-11-02T16:27:08Z) - DeepShadows: Separating Low Surface Brightness Galaxies from Artifacts
using Deep Learning [70.80563014913676]
本研究では,低地光度銀河と人工物とを分離する問題に対する畳み込みニューラルネットワーク(CNN)の利用について検討する。
我々は、CNNが低地光度宇宙の研究に非常に有望な道を提供することを示した。
論文 参考訳(メタデータ) (2020-11-24T22:51:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。