論文の概要: Addressing the Intra-class Mode Collapse Problem using Adaptive Input
Image Normalization in GAN-based X-ray Images
- arxiv url: http://arxiv.org/abs/2201.10324v1
- Date: Tue, 25 Jan 2022 13:54:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-26 14:56:50.764425
- Title: Addressing the Intra-class Mode Collapse Problem using Adaptive Input
Image Normalization in GAN-based X-ray Images
- Title(参考訳): GANベースのX線画像における適応入力画像正規化を用いたクラス内モード崩壊問題への対処
- Authors: Muhammad Muneeb Saad, Mubashir Husain Rehmani and Ruairi O'Reilly
- Abstract要約: この研究は、Deep Convolutional GANの適応型入出力正規化の統合による利点の実証的な実証に寄与する。
その結果,適応的な入出力正規化を持つDCGANは,非正規化X線画像でDCGANより優れていた。
- 参考スコア(独自算出の注目度): 0.7090165638014329
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Biomedical image datasets can be imbalanced due to the rarity of targeted
diseases. Generative Adversarial Networks play a key role in addressing this
imbalance by enabling the generation of synthetic images to augment and balance
datasets. It is important to generate synthetic images that incorporate a
diverse range of features such that they accurately represent the distribution
of features present in the training imagery. Furthermore, the absence of
diverse features in synthetic images can degrade the performance of machine
learning classifiers. The mode collapse problem can impact a Generative
Adversarial Network's capacity to generate diversified images. The mode
collapse comes in two varieties; intra-class and inter-class. In this paper,
the intra-class mode collapse problem is investigated, and its subsequent
impact on the diversity of synthetic X-ray images is evaluated. This work
contributes an empirical demonstration of the benefits of integrating the
adaptive input-image normalization for the Deep Convolutional GAN to alleviate
the intra-class mode collapse problem. Results demonstrate that the DCGAN with
adaptive input-image normalization outperforms DCGAN with un-normalized X-ray
images as evident by the superior diversity scores.
- Abstract(参考訳): バイオメディカル画像データセットは、標的疾患の希少性のために不均衡にすることができる。
生成型逆ネットワークはこの不均衡に対処する上で重要な役割を果たす。合成画像の生成によってデータセットの強化とバランスをとることができる。
訓練画像に存在する特徴の分布を正確に表現するような多種多様な特徴を組み込んだ合成画像を生成することが重要である。
さらに、合成画像に多様な特徴がないことは、機械学習分類器の性能を低下させる可能性がある。
モード崩壊問題は、ジェネレーティブ・アドバイサル・ネットワークの多様な画像を生成する能力に影響を与える可能性がある。
モード崩壊はクラス内とクラス間という2つの種類がある。
本稿では, クラス内モード崩壊問題を調査し, その後の合成x線画像の多様性に対する影響について検討した。
この研究は、クラス内モード崩壊問題を緩和するために、Deep Convolutional GANの適応入力-画像正規化を統合する利点の実証的な実証に寄与する。
その結果,適応的な入出力正規化を有するDCGANは,非正規化X線画像でDCGANより優れており,優れた多様性スコアが得られた。
関連論文リスト
- Unsupervised Feature Orthogonalization for Learning Distortion-Invariant Representations [0.13108652488669734]
本研究では、教師なし特徴の直交化と視覚変換器の能力を統合する新しい手法であるunORANIC+を紹介する。
unORANIC+の合理化アーキテクチャは、解剖学的および画像特異的な属性を効果的に分離し、堅牢で偏りのない潜在表現をもたらす。
大規模な実験は、UnORANIC+の復元能力、腐敗の回復力、および既存の画像歪みを修正する能力を示す。
本手法を先進的な医用画像解析のための有望なアルゴリズムとして位置づけた,多様な画像ソースとサンプルサイズのデータセットへの適応性を確認した。
論文 参考訳(メタデータ) (2024-09-18T19:25:38Z) - StealthDiffusion: Towards Evading Diffusion Forensic Detection through Diffusion Model [62.25424831998405]
StealthDiffusionは、AI生成した画像を高品質で受け入れがたい敵の例に修正するフレームワークである。
ホワイトボックスとブラックボックスの設定の両方で有効であり、AI生成した画像を高品質な敵の偽造に変換する。
論文 参考訳(メタデータ) (2024-08-11T01:22:29Z) - Adaptive Input-image Normalization for Solving the Mode Collapse Problem in GAN-based X-ray Images [0.08192907805418582]
この研究は、適応入力-画像正規化をDeep Conversaal GANとAuxiliary GANと統合してモード崩壊問題を緩和する利点の実証的な実証に寄与する。
その結果, 適応入出力正規化によるDCGANとACGANは, 非正規化X線画像でDCGANとACGANより優れていた。
論文 参考訳(メタデータ) (2023-09-21T16:43:29Z) - On Sensitivity and Robustness of Normalization Schemes to Input
Distribution Shifts in Automatic MR Image Diagnosis [58.634791552376235]
深層学習(DL)モデルは、再構成画像を入力として、複数の疾患の診断において最先端のパフォーマンスを達成した。
DLモデルは、トレーニングとテストフェーズ間の入力データ分布の変化につながるため、さまざまなアーティファクトに敏感である。
本稿では,グループ正規化やレイヤ正規化といった他の正規化手法を用いて,画像のさまざまなアーチファクトに対して,モデル性能にロバスト性を注入することを提案する。
論文 参考訳(メタデータ) (2023-06-23T03:09:03Z) - An Attentive-based Generative Model for Medical Image Synthesis [18.94900480135376]
注意に基づく二重コントラスト生成モデルであるADC-cycleGANを提案する。
このモデルは、二重コントラスト損失項とCycleGAN損失を統合し、合成された画像がソース領域と区別可能であることを保証する。
実験により,提案したADCサイクルGANモデルが,他の最先端生成モデルに匹敵するサンプルを生成することが示された。
論文 参考訳(メタデータ) (2023-06-02T14:17:37Z) - ViT-DAE: Transformer-driven Diffusion Autoencoder for Histopathology
Image Analysis [4.724009208755395]
高品質な病理画像合成のための視覚変換器(ViT)と拡散オートエンコーダを統合したViT-DAEを提案する。
提案手法は, 実写画像生成におけるGAN法とバニラDAE法より優れている。
論文 参考訳(メタデータ) (2023-04-03T15:00:06Z) - Person Image Synthesis via Denoising Diffusion Model [116.34633988927429]
本研究では,高忠実度人物画像合成に拡散モデルをいかに応用できるかを示す。
2つの大規模ベンチマークとユーザスタディの結果は、挑戦的なシナリオ下で提案したアプローチのフォトリアリズムを実証している。
論文 参考訳(メタデータ) (2022-11-22T18:59:50Z) - A Self-attention Guided Multi-scale Gradient GAN for Diversified X-ray
Image Synthesis [0.6308539010172307]
GAN(Generative Adversarial Networks)を用いて,合成画像の生成によるデータ制限問題に対処する。
モード崩壊、非収束、不安定といったトレーニング課題は、多彩で高品質な画像の合成において、GANのパフォーマンスを低下させる。
本研究では,バイオメディカル画像の特徴の長距離依存性の関係をモデル化する,注意誘導型マルチスケール勾配GANアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-10-09T13:17:17Z) - Auto-regressive Image Synthesis with Integrated Quantization [55.51231796778219]
本稿では,条件付き画像生成のための多目的フレームワークを提案する。
CNNの帰納バイアスと自己回帰の強力なシーケンスモデリングが組み込まれている。
提案手法は,最先端技術と比較して,優れた多彩な画像生成性能を実現する。
論文 参考訳(メタデータ) (2022-07-21T22:19:17Z) - Ensembling with Deep Generative Views [72.70801582346344]
生成モデルは、色やポーズの変化などの現実世界の変動を模倣する人工画像の「ビュー」を合成することができる。
そこで本研究では, 画像分類などの下流解析作業において, 実画像に適用できるかどうかを検討する。
StyleGAN2を再生増強の源として使用し、顔の属性、猫の顔、車を含む分類タスクについてこの設定を調査します。
論文 参考訳(メタデータ) (2021-04-29T17:58:35Z) - Encoding Robustness to Image Style via Adversarial Feature Perturbations [72.81911076841408]
我々は、画像画素ではなく特徴統計を直接摂動することで、頑健なモデルを生成することで、敵の訓練に適応する。
提案手法であるAdvBN(Adversarial Batch Normalization)は,トレーニング中に最悪の機能摂動を発生させる単一ネットワーク層である。
論文 参考訳(メタデータ) (2020-09-18T17:52:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。