論文の概要: Investigation on deep learning-based galaxy image translation models
- arxiv url: http://arxiv.org/abs/2508.03291v1
- Date: Tue, 05 Aug 2025 10:08:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-06 18:18:55.907418
- Title: Investigation on deep learning-based galaxy image translation models
- Title(参考訳): 深層学習に基づく銀河画像翻訳モデルの検討
- Authors: Hengxin Ruan, Qiufan Lin, Shupei Chen, Yang Wang, Wei Zhang,
- Abstract要約: 銀河画像変換は、銀河物理学や宇宙論において重要な応用である。
画像翻訳におけるほとんどの取り組みは、銀河画像のピクセルレベルとモルフォロジーレベル統計に焦点を当てている。
本研究では,高次物理情報保存における生成モデルの有効性について検討した。
- 参考スコア(独自算出の注目度): 6.18270362513197
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Galaxy image translation is an important application in galaxy physics and cosmology. With deep learning-based generative models, image translation has been performed for image generation, data quality enhancement, information extraction, and generalized for other tasks such as deblending and anomaly detection. However, most endeavors on image translation primarily focus on the pixel-level and morphology-level statistics of galaxy images. There is a lack of discussion on the preservation of complex high-order galaxy physical information, which would be more challenging but crucial for studies that rely on high-fidelity image translation. Therefore, we investigated the effectiveness of generative models in preserving high-order physical information (represented by spectroscopic redshift) along with pixel-level and morphology-level information. We tested four representative models, i.e. a Swin Transformer, an SRGAN, a capsule network, and a diffusion model, using the SDSS and CFHTLS galaxy images. We found that these models show different levels of incapabilities in retaining redshift information, even if the global structures of galaxies and morphology-level statistics can be roughly reproduced. In particular, the cross-band peak fluxes of galaxies were found to contain meaningful redshift information, whereas they are subject to noticeable uncertainties in the translation of images, which may substantially be due to the nature of many-to-many mapping. Nonetheless, imperfect translated images may still contain a considerable amount of information and thus hold promise for downstream applications for which high image fidelity is not strongly required. Our work can facilitate further research on how complex physical information is manifested on galaxy images, and it provides implications on the development of image translation models for scientific use.
- Abstract(参考訳): 銀河画像変換は、銀河物理学や宇宙論において重要な応用である。
深層学習に基づく生成モデルでは、画像生成、データ品質向上、情報抽出のために画像翻訳が行われ、遅延や異常検出といった他のタスクのために一般化されている。
しかし、画像翻訳におけるほとんどの取り組みは、主に銀河画像のピクセルレベルとモルフォロジーレベル統計に焦点を当てている。
複雑な高次銀河の物理情報の保存に関する議論は欠如しており、これは高忠実度画像翻訳に依存する研究にとってより難しいが不可欠である。
そこで本研究では,高次物理情報保存における生成モデルの有効性について検討した。
我々はSDSSとCFHTLSの銀河画像を用いて,Swin Transformer,SRGAN,カプセルネットワーク,拡散モデルという4つの代表モデルを検討した。
これらのモデルは、銀河のグローバル構造や形態学レベルの統計を大まかに再現できるとしても、赤方偏移情報の保持において異なるレベルの能力を示す。
特に、銀河のクロスバンドピークフラックスは有意義な赤方偏移情報を含むことが判明したが、画像の翻訳には顕著な不確実性があり、これは実質的には多対多のマッピングの性質に起因していると考えられる。
それでも、不完全な翻訳画像にはかなりの量の情報が含まれており、高い画像の忠実さを強く要求しない下流アプリケーションへの約束が守られている。
我々の研究は、銀河画像に複雑な物理情報がどのように現れるかのさらなる研究を容易にし、科学利用のための画像翻訳モデルの開発に影響を及ぼす。
関連論文リスト
- Can AI Dream of Unseen Galaxies? Conditional Diffusion Model for Galaxy Morphology Augmentation [4.3933321767775135]
本研究では,機械学習データを拡張するために,現実的な銀河画像を合成するための条件拡散モデルを提案する。
本研究では,本モデルが特定の形態的特徴条件に密着した多彩な高忠実度銀河画像を生成することを示す。
このモデルにより、生成外挿により、よく注釈付けされたデータを未知の領域に投影し、希少なオブジェクト検出を進めることができる。
論文 参考訳(メタデータ) (2025-06-19T11:44:09Z) - PixCell: A generative foundation model for digital histopathology images [49.00921097924924]
PixCellは,病理組織学における最初の拡散ベース生成基盤モデルである。
われわれはPanCan-30MでPixCellをトレーニングした。
論文 参考訳(メタデータ) (2025-06-05T15:14:32Z) - A Versatile Framework for Analyzing Galaxy Image Data by Implanting Human-in-the-loop on a Large Vision Model [14.609681101463334]
大型ビジョンモデル(LVM)と下流タスク(DST)に基づく銀河画像の一般解析のためのフレームワークを提案する。
銀河画像の低信号-雑音比を考えると、我々は大きな視覚モデルにHuman-in-the-loop (HITL)モジュールを組み込んだ。
1000のデータポイントでトレーニングされたオブジェクト検出では、DSTが96.7%、ResNet50とMask R-CNNが93.1%である。
論文 参考訳(メタデータ) (2024-05-17T16:29:27Z) - xT: Nested Tokenization for Larger Context in Large Images [79.37673340393475]
xTは、グローバルコンテキストを局所的な詳細で集約するビジョントランスフォーマーのフレームワークである。
我々は、挑戦的な分類タスクにおいて、精度を最大8.6%向上させることができる。
論文 参考訳(メタデータ) (2024-03-04T10:29:58Z) - Learned representation-guided diffusion models for large-image generation [58.192263311786824]
自己教師型学習(SSL)からの埋め込みを条件とした拡散モデルを訓練する新しいアプローチを導入する。
我々の拡散モデルは、これらの特徴を高品質な病理組織学およびリモートセンシング画像に投影することに成功した。
実画像のバリエーションを生成して実データを増やすことにより、パッチレベルおよび大規模画像分類タスクの下流精度が向上する。
論文 参考訳(メタデータ) (2023-12-12T14:45:45Z) - Spiral-Elliptical automated galaxy morphology classification from
telescope images [0.40792653193642503]
我々は、望遠鏡の銀河画像から効率的に抽出できる2つの新しい銀河形態統計、降下平均と降下分散を開発した。
我々は,Sloan Digital Sky Surveyの銀河画像データを用いて,提案した画像統計の有効性能を実証した。
論文 参考訳(メタデータ) (2023-10-10T22:36:52Z) - BioGAN: An unpaired GAN-based image to image translation model for
microbiological images [1.6427658855248812]
微生物画像のための画像翻訳モデルとして,未ペアのGAN(Generative Adversarial Network)画像を開発した。
本稿では,実験室で撮影された画像の高レベルな特徴をフィールド画像に変換するために,適応的・知覚的損失を利用したGANモデルBioGANの設計を提案する。
論文 参考訳(メタデータ) (2023-06-09T19:30:49Z) - Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-04-19T17:59:45Z) - InvGAN: Invertible GANs [88.58338626299837]
InvGANはInvertible GANの略で、高品質な生成モデルの潜在空間に実際の画像を埋め込むことに成功した。
これにより、画像のインペイント、マージ、オンラインデータ拡張を実行できます。
論文 参考訳(メタデータ) (2021-12-08T21:39:00Z) - Multi-Texture GAN: Exploring the Multi-Scale Texture Translation for
Brain MR Images [1.9163481966968943]
既存のアルゴリズムのかなりの割合は、ターゲットスキャナーからテクスチャの詳細を明示的に利用し保存することはできない。
本論文では,再構成イメージをより詳細に強調するために,マルチスケールテクスチャ転送の設計を行う。
本手法は,最先端手法において,プロトコール間あるいはスカンナ間翻訳において優れた結果が得られる。
論文 参考訳(メタデータ) (2021-02-14T19:14:06Z) - Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。
ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。
提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文 参考訳(メタデータ) (2020-03-15T11:04:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。