論文の概要: A Self-attention Guided Multi-scale Gradient GAN for Diversified X-ray
Image Synthesis
- arxiv url: http://arxiv.org/abs/2210.06334v1
- Date: Sun, 9 Oct 2022 13:17:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 12:14:34.371671
- Title: A Self-attention Guided Multi-scale Gradient GAN for Diversified X-ray
Image Synthesis
- Title(参考訳): 可変X線画像合成のための自己注意ガイド付きマルチスケールグラディエントGAN
- Authors: Muhammad Muneeb Saad, Mubashir Husain Rehmani, and Ruairi O'Reilly
- Abstract要約: GAN(Generative Adversarial Networks)を用いて,合成画像の生成によるデータ制限問題に対処する。
モード崩壊、非収束、不安定といったトレーニング課題は、多彩で高品質な画像の合成において、GANのパフォーマンスを低下させる。
本研究では,バイオメディカル画像の特徴の長距離依存性の関係をモデル化する,注意誘導型マルチスケール勾配GANアーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 0.6308539010172307
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Imbalanced image datasets are commonly available in the domain of biomedical
image analysis. Biomedical images contain diversified features that are
significant in predicting targeted diseases. Generative Adversarial Networks
(GANs) are utilized to address the data limitation problem via the generation
of synthetic images. Training challenges such as mode collapse,
non-convergence, and instability degrade a GAN's performance in synthesizing
diversified and high-quality images. In this work, SAMGAN, an attention-guided
multi-scale gradient GAN architecture is proposed to model the relationship
between long-range dependencies of biomedical image features and improves the
training performance using a flow of multi-scale gradients at multiple
resolutions in the layers of generator and discriminator models. The intent is
to reduce the impact of mode collapse and stabilize the training of GAN using
an attention mechanism with multi-scale gradient learning for diversified X-ray
image synthesis. Multi-scale Structural Similarity Index Measure (MS-SSIM) and
Frechet Inception Distance (FID) are used to identify the occurrence of mode
collapse and evaluate the diversity of synthetic images generated. The proposed
architecture is compared with the multi-scale gradient GAN (MSG-GAN) to assess
the diversity of generated synthetic images. Results indicate that the SAMGAN
outperforms MSG-GAN in synthesizing diversified images as evidenced by the
MS-SSIM and FID scores.
- Abstract(参考訳): 不均衡画像データセットは、バイオメディカル画像分析の領域で一般的に利用できる。
バイオメディカル画像は、標的疾患の予測に重要な多様な特徴を含んでいる。
GAN(Generative Adversarial Networks)を用いて,合成画像の生成によるデータ制限問題に対処する。
モード崩壊、非コンバージェンス、不安定といったトレーニング課題は、多様化した高品質の画像の合成においてganのパフォーマンスを劣化させる。
本研究では,生物医用画像特徴の長期依存関係をモデル化し,生成層と判別器モデルの複数解像度におけるマルチスケール勾配の流れを用いてトレーニング性能を向上させるために,注意誘導型多スケール勾配ganアーキテクチャを提案する。
本研究の目的は,モード崩壊の影響を低減し,マルチスケール勾配学習によるマルチスケールX線画像合成によるGANの訓練を安定化することである。
マルチスケール構造類似度指数測定(MS-SSIM)とFrechet Inception Distance(FID)を用いてモード崩壊の発生を特定し,生成した合成画像の多様性を評価する。
提案アーキテクチャは、生成した合成画像の多様性を評価するために、マルチスケール勾配GAN(MSG-GAN)と比較する。
以上の結果から,SAMGANはMS-SSIMとFIDスコアにより,多彩な画像の合成においてMSG-GANよりも優れていた。
関連論文リスト
- Adaptive Input-image Normalization for Solving the Mode Collapse Problem in GAN-based X-ray Images [0.08192907805418582]
この研究は、適応入力-画像正規化をDeep Conversaal GANとAuxiliary GANと統合してモード崩壊問題を緩和する利点の実証的な実証に寄与する。
その結果, 適応入出力正規化によるDCGANとACGANは, 非正規化X線画像でDCGANとACGANより優れていた。
論文 参考訳(メタデータ) (2023-09-21T16:43:29Z) - On Sensitivity and Robustness of Normalization Schemes to Input
Distribution Shifts in Automatic MR Image Diagnosis [58.634791552376235]
深層学習(DL)モデルは、再構成画像を入力として、複数の疾患の診断において最先端のパフォーマンスを達成した。
DLモデルは、トレーニングとテストフェーズ間の入力データ分布の変化につながるため、さまざまなアーティファクトに敏感である。
本稿では,グループ正規化やレイヤ正規化といった他の正規化手法を用いて,画像のさまざまなアーチファクトに対して,モデル性能にロバスト性を注入することを提案する。
論文 参考訳(メタデータ) (2023-06-23T03:09:03Z) - An Attentive-based Generative Model for Medical Image Synthesis [18.94900480135376]
注意に基づく二重コントラスト生成モデルであるADC-cycleGANを提案する。
このモデルは、二重コントラスト損失項とCycleGAN損失を統合し、合成された画像がソース領域と区別可能であることを保証する。
実験により,提案したADCサイクルGANモデルが,他の最先端生成モデルに匹敵するサンプルを生成することが示された。
論文 参考訳(メタデータ) (2023-06-02T14:17:37Z) - Less is More: Unsupervised Mask-guided Annotated CT Image Synthesis with
Minimum Manual Segmentations [2.1785903900600316]
医用画像合成のための新しい手法,すなわちunsupervised Mask (UM)-guided synthesisを提案する。
UM誘導合成は、忠実度、多様性、有用性が著しく高い高品質な合成画像を提供する。
論文 参考訳(メタデータ) (2023-03-19T20:30:35Z) - Hierarchical Transformer for Survival Prediction Using Multimodality
Whole Slide Images and Genomics [63.76637479503006]
下流タスクのためのギガピクセルレベルのスライド病理画像(WSI)の良質な表現を学習することが重要である。
本稿では,病理画像と対応する遺伝子間の階層的マッピングを学習する階層型マルチモーダルトランスフォーマーフレームワークを提案する。
より優れたWSI表現能力を維持しながら、ベンチマーク手法と比較してGPUリソースが少ないアーキテクチャです。
論文 参考訳(メタデータ) (2022-11-29T23:47:56Z) - SIAN: Style-Guided Instance-Adaptive Normalization for Multi-Organ
Histopathology Image Synthesis [63.845552349914186]
本研究では,異なる臓器に対して,現実的な色分布とテクスチャを合成するためのスタイル誘導型インスタンス適応正規化(SIAN)を提案する。
4つのフェーズは一緒に動作し、生成ネットワークに統合され、イメージセマンティクス、スタイル、インスタンスレベルのバウンダリを埋め込む。
論文 参考訳(メタデータ) (2022-09-02T16:45:46Z) - Evaluating the Quality and Diversity of DCGAN-based Generatively
Synthesized Diabetic Retinopathy Imagery [0.07499722271664144]
公的に利用可能な糖尿病網膜症(DR)データセットは不均衡であり、DRを持つ画像の数が限られている。
この不均衡に対処するには、GAN(Geneversarative Adrial Networks)を使用して、データセットを合成画像で拡張する。
合成画像の品質と多様性を評価するために、マルチスケール構造類似度指数(MS-SSIM)、コサイン距離(CD)、Fr't Inception Distance(FID)などの評価指標を用いる。
論文 参考訳(メタデータ) (2022-08-10T23:50:01Z) - MRI to PET Cross-Modality Translation using Globally and Locally Aware
GAN (GLA-GAN) for Multi-Modal Diagnosis of Alzheimer's Disease [1.7499351967216341]
現実像を合成できるGAN(Generative Adversarial Network)は、標準的なデータ拡張手法の代替として大きな可能性を秘めている。
本稿では,グローバルな構造的整合性と局所的細部への忠実さを両立させるマルチパスアーキテクチャにより,グローバルかつ局所的に認識された画像間変換GAN(GLA-GAN)を提案する。
論文 参考訳(メタデータ) (2021-08-04T16:38:33Z) - Diffusion-Weighted Magnetic Resonance Brain Images Generation with
Generative Adversarial Networks and Variational Autoencoders: A Comparison
Study [55.78588835407174]
本研究では,高画質,多彩で現実的な拡散重み付き磁気共鳴画像が深部生成モデルを用いて合成可能であることを示す。
Introspective Variational AutoencoderとStyle-Based GANの2つのネットワークを医療分野におけるデータ拡張の資格として提示する。
論文 参考訳(メタデータ) (2020-06-24T18:00:01Z) - Pathological Retinal Region Segmentation From OCT Images Using Geometric
Relation Based Augmentation [84.7571086566595]
本稿では,幾何学と形状の内在的関係を共同で符号化することで,従来のGANベースの医用画像合成法よりも優れた手法を提案する。
提案手法は,取得手順の異なる画像を有する公開RETOUCHデータセット上で,最先端のセグメンテーション手法より優れている。
論文 参考訳(メタデータ) (2020-03-31T11:50:43Z) - Hi-Net: Hybrid-fusion Network for Multi-modal MR Image Synthesis [143.55901940771568]
マルチモーダルMR画像合成のためのHybrid-fusion Network(Hi-Net)を提案する。
当社のHi-Netでは,各モーダリティの表現を学習するために,モーダリティ特化ネットワークを用いている。
マルチモーダル合成ネットワークは、潜在表現と各モーダルの階層的特徴を密結合するように設計されている。
論文 参考訳(メタデータ) (2020-02-11T08:26:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。