Fugu-MT 論文翻訳(概要): Cross-Domain Adversarial Augmentation: Stabilizing GANs for Medical and Handwriting Data Scarcity

論文の概要: Cross-Domain Adversarial Augmentation: Stabilizing GANs for Medical and Handwriting Data Scarcity

arxiv url: http://arxiv.org/abs/2605.01815v1
Date: Sun, 03 May 2026 10:48:26 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-05 20:33:49.949227
Title: Cross-Domain Adversarial Augmentation: Stabilizing GANs for Medical and Handwriting Data Scarcity
Title（参考訳）: 医療・手書きデータ共有のためのGANの安定化
Authors: Md. Sohanuzzaman Soad, Mahady Al Hady, S M Rafiuddin Rifat, Sudip Ghose,
Abstract要約: Generative Adversarial Networks (GAN)は、視覚タスクにおけるデータの不足を軽減するための実用的なルートを提供する。 64x64解像度のDCGANモデルを用いて,Bangla手書き文字と胸部X線画像の2つの低リソース領域における生成増強について検討した。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Generative Adversarial Networks (GANs) offer a pragmatic route to mitigate data scarcity in vision tasks. We study generative augmentation across two low-resource domains: Bangla handwritten characters and chest X-ray imaging using DCGAN-style models trained at 64x64 resolution. We evaluate fidelity and diversity via Inception Score (IS), Fr'echet Inception Distance (FID), and embedding visualizations (t-SNE/UMAP), and assess downstream utility by training classifiers on real versus real synthetic data. Our experiments show that generative augmentation improves sample diversity and yields consistent gains in classifier performance under limited-data regimes. We analyze stability enhancements (e.g., gradient-penalized objectives and spectral normalization) and report ablations on synthetic-to-real ratios and sample filtering. We discuss evaluation caveats for medical images, dataset licensing, and privacy risks associated with synthetic data. The resulting protocol is simple to reproduce and provides a strong baseline for applying generative augmentation to resource-constrained imaging tasks.
Abstract（参考訳）: Generative Adversarial Networks (GAN)は、視覚タスクにおけるデータの不足を軽減するための実用的なルートを提供する。 64x64解像度のDCGANモデルを用いて,Bangla手書き文字と胸部X線画像の2つの低リソース領域における生成増強について検討した。 Inception Score (IS), Fr'echet Inception Distance (FID), Embedding Visualizations (t-SNE/UMAP) を用いて,インセプションスコア(IS), Fr'echet Inception Distance (FID), 組込みビジュアライゼーション (T-SNE/UMAP) による忠実度と多様性を評価し, 実データと実データを用いた分類器の訓練により下流の有用性を評価する。実験の結果, 生成的増大はサンプルの多様性を向上し, 限定データ体制下での分類器性能が一貫した向上をもたらすことがわかった。安定度向上(グラデーション・ペナル化目標,スペクトル正規化)を解析し,合成-実比および試料ろ過について報告する。医用画像の評価,データセットライセンス,および合成データに関連するプライバシーリスクについて論じる。得られたプロトコルは簡単に再現でき、資源制約された撮像タスクに生成増強を適用するための強力なベースラインを提供する。

関連論文リスト

Adapting HFMCA to Graph Data: Self-Supervised Learning for Generalizable fMRI Representations [57.054499278843856]
機能的磁気共鳴画像(fMRI)解析は、データセットのサイズが限られ、研究間でのドメインの変動が原因で大きな課題に直面している。コンピュータビジョンにインスパイアされた従来の自己教師付き学習手法は、正と負のサンプルペアに依存することが多い。本稿では,最近開発された階層関数最大相関アルゴリズム(HFMCA)をグラフ構造fMRIデータに適用することを提案する。
論文参考訳（メタデータ） (2025-10-05T12:35:01Z)
Subtyping Breast Lesions via Generative Augmentation based Long-tailed Recognition in Ultrasound [8.410718166932798]
本稿では,高忠実度データ合成による分布バイアスを緩和する長鎖分類のためのフレームワークを提案する。提案手法は,最先端手法と比較して有望な性能を実現する。
論文参考訳（メタデータ） (2025-07-30T10:50:41Z)
Bt-GAN: Generating Fair Synthetic Healthdata via Bias-transforming Generative Adversarial Networks [3.3903891679981593]
本稿では,医療領域に特化して設計されたGANベースの合成データジェネレータであるBias-transforming Generative Adversarial Networks (Bt-GAN)について述べる。以上の結果から,Bt-GANはSOTA精度を向上し,公平性とバイアスの最小化を図った。
論文参考訳（メタデータ） (2024-04-21T12:16:38Z)
DetDiffusion: Synergizing Generative and Perceptive Models for Enhanced Data Generation and Perception [78.26734070960886]
現在の知覚モデルは、リソース集約的なデータセットに大きく依存している。セグメンテーションを通じて知覚認識損失(P.A.損失)を導入し、品質と制御性の両方を改善した。本手法は,世代間における知覚認識属性(P.A. Attr)の抽出と利用により,データ拡張をカスタマイズする。
論文参考訳（メタデータ） (2024-03-20T04:58:03Z)
ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文参考訳（メタデータ） (2023-09-03T07:55:46Z)
Vision-Language Modelling For Radiological Imaging and Reports In The Low Data Regime [70.04389979779195]
本稿では,視覚および言語入力を共通空間に埋め込んだ医用視覚言語モデル(VLM)について検討する。本稿では,新しい画像領域やテキスト領域への汎用事前学習モデルの適用など,低データ性能向上のためのいくつかの候補手法について検討する。テキスト・ツー・イメージ検索をベンチマークとして,2つの胸部X線および放射線学的報告を用いた可変サイズのトレーニングデータセットを用いて,これらの手法の性能評価を行った。
論文参考訳（メタデータ） (2023-03-30T18:20:00Z)
Deceive D: Adaptive Pseudo Augmentation for GAN Training with Limited Data [125.7135706352493]
GAN(Generative Adversarial Network)は、高忠実度画像を合成するために、訓練に十分なデータを必要とする。近年の研究では、差別者の過度な適合により、限られたデータでGANを訓練することは困難であることが示されている。本稿では,APA (Adaptive Pseudo Augmentation) と呼ばれる新しい手法を提案する。
論文参考訳（メタデータ） (2021-11-12T18:13:45Z)
Negative Data Augmentation [127.28042046152954]
負のデータ拡張サンプルは、データ分散のサポートに関する情報を提供することを示す。我々は、NDAを識別器の合成データの追加源として利用する新しいGAN訓練目標を提案する。実験により,本手法で訓練したモデルでは,異常検出能力の向上とともに条件付き・条件付き画像生成の改善を実現している。
論文参考訳（メタデータ） (2021-02-09T20:28:35Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。