論文の概要: GeMix: Conditional GAN-Based Mixup for Improved Medical Image Augmentation
- arxiv url: http://arxiv.org/abs/2507.15577v1
- Date: Mon, 21 Jul 2025 12:58:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-22 20:51:32.398132
- Title: GeMix: Conditional GAN-Based Mixup for Improved Medical Image Augmentation
- Title(参考訳): GeMix:医療画像改善のための条件付きGANベースの混合
- Authors: Hugo Carlesso, Maria Eliza Patulea, Moncef Garouani, Radu Tudor Ionescu, Josiane Mothe,
- Abstract要約: 本稿では,2段階のフレームワークであるGeMixを提案する。
我々は,3つのバックボーン(ResNet-50,ResNet-101,EfficientNet-B0)を用いて,大規模COVIDx-CT-3データセット上でGeMixをベンチマークした。実際のデータと組み合わせると,従来のすべてのバックボーンの混合よりもマクロF1が増加し,新型コロナウイルス検出の偽陰性率が低下する。
- 参考スコア(独自算出の注目度): 20.792833454137625
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mixup has become a popular augmentation strategy for image classification, yet its naive pixel-wise interpolation often produces unrealistic images that can hinder learning, particularly in high-stakes medical applications. We propose GeMix, a two-stage framework that replaces heuristic blending with a learned, label-aware interpolation powered by class-conditional GANs. First, a StyleGAN2-ADA generator is trained on the target dataset. During augmentation, we sample two label vectors from Dirichlet priors biased toward different classes and blend them via a Beta-distributed coefficient. Then, we condition the generator on this soft label to synthesize visually coherent images that lie along a continuous class manifold. We benchmark GeMix on the large-scale COVIDx-CT-3 dataset using three backbones (ResNet-50, ResNet-101, EfficientNet-B0). When combined with real data, our method increases macro-F1 over traditional mixup for all backbones, reducing the false negative rate for COVID-19 detection. GeMix is thus a drop-in replacement for pixel-space mixup, delivering stronger regularization and greater semantic fidelity, without disrupting existing training pipelines. We publicly release our code at https://github.com/hugocarlesso/GeMix to foster reproducibility and further research.
- Abstract(参考訳): ミックスアップは画像分類の一般的な拡張戦略となっているが、その単純なピクセルワイド補間はしばしば非現実的なイメージを生成し、特に高精細な医学的応用において学習を妨げる。
本稿では,GANをベースとした学習されたラベル認識補間により,ヒューリスティックブレンディングを置き換えた2段階のフレームワークであるGeMixを提案する。
まず、StyleGAN2-ADAジェネレータがターゲットデータセットでトレーニングされる。
拡張中、ディリクレの先行する2つのラベルベクトルを異なるクラスに偏り、ベータ分散係数でブレンドする。
そして、このソフトラベル上の生成元を条件に、連続クラス多様体に沿ってある視覚的コヒーレントなイメージを合成する。
3つのバックボーン(ResNet-50、ResNet-101、EfficientNet-B0)を使用して、大規模なCOVIDx-CT-3データセット上でGeMixをベンチマークする。
実際のデータと組み合わせると、従来の混合骨よりもマクロF1が増加し、新型コロナウイルス検出の偽陰率が低下する。
このように、GeMixはピクセル空間のミックスアップをドロップインで置き換えることで、既存のトレーニングパイプラインを中断することなく、より強力な正規化とセマンティック忠実性を提供する。
再現性とさらなる研究を促進するため、私たちはhttps://github.com/hugocarlesso/GeMixでコードを公開しています。
関連論文リスト
- SUMix: Mixup with Semantic and Uncertain Information [41.99721365685618]
混合データ拡張アプローチは、ディープラーニングの様々なタスクに応用されている。
そこで我々は,SUMix という新しい手法を提案し,混合率と混合試料の不確かさを学習する。
論文 参考訳(メタデータ) (2024-07-10T16:25:26Z) - Enhanced Long-Tailed Recognition with Contrastive CutMix Augmentation [10.208913996525055]
本稿では,長期認識の性能を高めるために,意味的に一貫したラベルを持つ拡張サンプルを構築するContrastive CutMixを提案する。
実験の結果,我々のConCutMixはテールクラスの精度と全体的な性能を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2024-07-06T01:31:49Z) - DiffuseMix: Label-Preserving Data Augmentation with Diffusion Models [18.44432223381586]
近年、ディープニューラルネットワークの一般化を改善するために、画像混合に基づく拡張技術が数多く導入されている。
これらの手法では、2つ以上のランダムに選択された自然画像が混合され、拡張画像を生成する。
DiffuseMixを提案する。DiffuseMixは、拡散モデルを利用してトレーニング画像を再構成する新しいデータ拡張手法である。
論文 参考訳(メタデータ) (2024-04-05T05:31:02Z) - Adversarial AutoMixup [50.1874436169571]
本稿では,AdAutomixupを提案する。
画像分類のための堅牢な分類器を訓練するために、挑戦的なサンプルを生成する。
本手法は, 様々な分類シナリオにおいて, 技術状況に優れる。
論文 参考訳(メタデータ) (2023-12-19T08:55:00Z) - Image Processing and Machine Learning for Hyperspectral Unmixing: An Overview and the HySUPP Python Package [80.11512905623417]
アンミキシングは、ピクセル内のエンドメンバーの分数量を推定する。
本稿では,先進的および従来型のアンミックス手法の概要について述べる。
シミュレーションされた3つのデータセットと2つの実際のデータセット上でのアンミックス手法の性能を比較した。
論文 参考訳(メタデータ) (2023-08-18T08:10:41Z) - LUMix: Improving Mixup by Better Modelling Label Uncertainty [33.56660038646426]
ディープ・ネットワークはノイズの多いサンプルと正規化技術で訓練するとより一般化できる。
以前のMixupベースの手法は、画像とラベルを線形に組み合わせ、追加のトレーニングデータを生成する。
トレーニング中にラベルの摂動を追加することで、そのような不確実性をモデル化するLUMixを提案する。
論文 参考訳(メタデータ) (2022-11-29T00:47:55Z) - C-Mixup: Improving Generalization in Regression [71.10418219781575]
混合アルゴリズムは、一対の例とその対応するラベルを線形補間することによって一般化を改善する。
ラベルの類似度に基づいてサンプリング確率を調整するC-Mixupを提案する。
C-Mixupは6.56%、4.76%、5.82%の改善、タスクの一般化、アウト・オブ・ディストリビューションの堅牢性を実現している。
論文 参考訳(メタデータ) (2022-10-11T20:39:38Z) - Mix-Teaching: A Simple, Unified and Effective Semi-Supervised Learning
Framework for Monocular 3D Object Detection [22.074959519526605]
Mix-Teachingは、ラベル付き画像とラベルなし画像の両方をトレーニング段階で使用するための効果的な半教師付き学習フレームワークである。
Mix-Teaching は MonoFlex と GUPNet を KITTI データセット上で様々なラベル付け比率で大幅に改善している。
論文 参考訳(メタデータ) (2022-07-10T12:07:25Z) - ReMix: Towards Image-to-Image Translation with Limited Data [154.71724970593036]
本稿では,この問題に対処するためのデータ拡張手法(ReMix)を提案する。
特徴レベルでのトレーニングサンプルを補間し、サンプル間の知覚的関係に基づく新しいコンテンツ損失を提案します。
提案手法は, 生成のあいまいさを効果的に低減し, コンテンツ保存結果を生成する。
論文 参考訳(メタデータ) (2021-03-31T06:24:10Z) - SnapMix: Semantically Proportional Mixing for Augmenting Fine-grained
Data [124.95585891086894]
提案はSemantically Proportional Mixing(SnapMix)と呼ばれる
クラスアクティベーションマップ(CAM)を利用して、きめ細かいデータを強化する際にラベルノイズを低減します。
本手法は既存の混合型アプローチを一貫して上回っている。
論文 参考訳(メタデータ) (2020-12-09T03:37:30Z) - Un-Mix: Rethinking Image Mixtures for Unsupervised Visual Representation
Learning [108.999497144296]
近年の先進的な教師なし学習手法では,同じ画像から2つの「ビュー」を学習表現として比較するために,サイムズ様の枠組みを用いている。
この研究は、教師なし学習においてラベル空間上の距離の概念を巻き込み、正対と負対のソフトな類似度をモデルに認識させることを目的としている。
その概念的単純さにもかかわらず、この解 -- 教師なし画像混合(Un-Mix)により、変換された入力と対応する新しいラベル空間からより微妙でより堅牢で一般化された表現を学習できることを実証的に示す。
論文 参考訳(メタデータ) (2020-03-11T17:59:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。