論文の概要: Improving Diagnostic Performance on Small and Imbalanced Datasets Using Class-Based Input Image Composition
- arxiv url: http://arxiv.org/abs/2511.03891v1
- Date: Wed, 05 Nov 2025 22:34:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-07 20:17:53.229629
- Title: Improving Diagnostic Performance on Small and Imbalanced Datasets Using Class-Based Input Image Composition
- Title(参考訳): クラスベース入力画像合成による小・不均衡データセットの診断性能の向上
- Authors: Hlali Azzeddine, Majid Ben Yakhlef, Soulaiman El Hazzat,
- Abstract要約: 小さく不均衡なデータセットと入力画像の品質の低下は、ディープラーニングモデルによる高い誤予測率につながる可能性がある。
本稿では,同じクラスの複数の画像が統合された視覚合成系に融合することで,学習用インプットを再構成する手法であるクラスベースイメージコンポジションを提案する。
- 参考スコア(独自算出の注目度): 0.2676349883103403
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Small, imbalanced datasets and poor input image quality can lead to high false predictions rates with deep learning models. This paper introduces Class-Based Image Composition, an approach that allows us to reformulate training inputs through a fusion of multiple images of the same class into combined visual composites, named Composite Input Images (CoImg). That enhances the intra-class variance and improves the valuable information density per training sample and increases the ability of the model to distinguish between subtle disease patterns. Our method was evaluated on the Optical Coherence Tomography Dataset for Image-Based Deep Learning Methods (OCTDL) (Kulyabin et al., 2024), which contains 2,064 high-resolution optical coherence tomography (OCT) scans of the human retina, representing seven distinct diseases with a significant class imbalance. We constructed a perfectly class-balanced version of this dataset, named Co-OCTDL, where each scan is resented as a 3x1 layout composite image. To assess the effectiveness of this new representation, we conducted a comparative analysis between the original dataset and its variant using a VGG16 model. A fair comparison was ensured by utilizing the identical model architecture and hyperparameters for all experiments. The proposed approach markedly improved diagnostic results.The enhanced Dataset achieved near-perfect accuracy (99.6%) with F1-score (0.995) and AUC (0.9996), compared to a baseline model trained on raw dataset. The false prediction rate was also significantly lower, this demonstrates that the method can producehigh-quality predictions even for weak datasets affected by class imbalance or small sample size.
- Abstract(参考訳): 小さく不均衡なデータセットと入力画像の品質の低下は、ディープラーニングモデルによる高い誤予測率につながる可能性がある。
本稿では,同じクラスの複数のイメージを合成合成合成合成画像(CoImg)に融合することで,学習用インプットを再構成する手法であるクラスベースイメージコンポジションを提案する。
これにより、クラス内の分散が向上し、トレーニングサンプルあたりの価値情報密度が向上し、微妙な病気パターンを識別する能力が向上する。
画像ベース深層学習法(OCTDL)の光学コヒーレンス・トモグラフィー・データセット(Kulyabin et al , 2024)を用いて, 網膜の2,064個の高分解能光コヒーレンス・トモグラフィー(OCT)スキャンを行った。
我々は,このデータセットの完全なクラスバランス版であるCo-OCTDLを構築し,各スキャンを3x1レイアウト複合画像として再送した。
この表現の有効性を評価するため、VGG16モデルを用いて、元のデータセットとその変種の比較分析を行った。
すべての実験で同一のモデルアーキテクチャとハイパーパラメータを利用することで、公平な比較が得られた。
拡張データセットはF1スコア(0.995)とAUC(0.9996)でほぼ完全精度(99.6%)を達成した。
また, 誤り予測率も有意に低く, クラス不均衡や小サンプルサイズの影響を受けない弱いデータセットであっても, 高品質な予測が可能であることを示した。
関連論文リスト
- SkinDualGen: Prompt-Driven Diffusion for Simultaneous Image-Mask Generation in Skin Lesions [0.0]
本稿では, トレーニング済み安定拡散2.0モデルを用いて, 高品質な合成皮膚病変画像を生成する手法を提案する。
実データと合成データを組み合わせたハイブリッドデータセットは、分類とセグメンテーションモデルの性能を著しく向上させる。
論文 参考訳(メタデータ) (2025-07-26T15:00:37Z) - CytoDiff: AI-Driven Cytomorphology Image Synthesis for Medical Diagnostics [0.9350583142732543]
我々は,LoRA重みを微調整した安定拡散モデルであるCytoDiffを紹介した。
小さな非バランスな実データセットを使用することで、クラス毎に5,000の合成画像が追加され、ResNet分類器の精度は27%から78%(+51%)に向上した。
同様に、CLIPに基づく分類精度は62%から77%(+15%)に向上した。
論文 参考訳(メタデータ) (2025-07-07T14:49:05Z) - Comparative Analysis and Ensemble Enhancement of Leading CNN Architectures for Breast Cancer Classification [0.0]
本研究は,病理組織像を用いた乳癌分類への新規かつ正確なアプローチを提案する。
さまざまな画像データセット間で、主要な畳み込みニューラルネットワーク(CNN)モデルを体系的に比較する。
そこで本研究では,スタンドアロンCNNモデルにおいて,例外的分類精度を実現するために必要な設定について検討した。
論文 参考訳(メタデータ) (2024-10-04T11:31:43Z) - Iterative Online Image Synthesis via Diffusion Model for Imbalanced
Classification [29.730360798234294]
医用画像分類におけるクラス不均衡問題に対処するための反復オンライン画像合成フレームワークを提案する。
このフレームワークにはオンライン画像合成(OIS)と精度適応サンプリング(AAS)という2つの重要なモジュールが組み込まれている。
不均衡な分類に対処するための提案手法の有効性を評価するため,HAM10000およびAPTOSデータセットを用いて実験を行った。
論文 参考訳(メタデータ) (2024-03-13T10:51:18Z) - Training Class-Imbalanced Diffusion Model Via Overlap Optimization [55.96820607533968]
実世界のデータセットで訓練された拡散モデルは、尾クラスの忠実度が劣ることが多い。
拡散モデルを含む深い生成モデルは、豊富な訓練画像を持つクラスに偏りがある。
本研究では,異なるクラスに対する合成画像の分布の重複を最小限に抑えるために,コントラスト学習に基づく手法を提案する。
論文 参考訳(メタデータ) (2024-02-16T16:47:21Z) - DiffMix: Diffusion Model-based Data Synthesis for Nuclei Segmentation
and Classification in Imbalanced Pathology Image Datasets [8.590026259176806]
拡散モデルを用いた現実的なデータ合成法を提案する。
トレーニングデータの配布を拡大するために,仮想パッチを2種類生成する。
意味ラベル条件付き拡散モデルを用いて、現実的で高品質な画像サンプルを生成する。
論文 参考訳(メタデータ) (2023-06-25T05:31:08Z) - Optimizations of Autoencoders for Analysis and Classification of
Microscopic In Situ Hybridization Images [68.8204255655161]
同様のレベルの遺伝子発現を持つ顕微鏡画像の領域を検出・分類するためのディープラーニングフレームワークを提案する。
分析するデータには教師なし学習モデルが必要です。
論文 参考訳(メタデータ) (2023-04-19T13:45:28Z) - Performance of GAN-based augmentation for deep learning COVID-19 image
classification [57.1795052451257]
ディープラーニングを医療分野に適用する上で最大の課題は、トレーニングデータの提供である。
データ拡張は、限られたデータセットに直面した時に機械学習で使用される典型的な方法論である。
本研究は, 新型コロナウイルスの胸部X線画像セットを限定して, StyleGAN2-ADAモデルを用いて訓練するものである。
論文 参考訳(メタデータ) (2023-04-18T15:39:58Z) - Significantly improving zero-shot X-ray pathology classification via fine-tuning pre-trained image-text encoders [50.689585476660554]
本稿では,正対損失緩和とランダムな文サンプリングを含む新たな微調整手法を提案する。
提案手法は,胸部X線データセットと3つの事前訓練モデル間のゼロショット病理分類を一貫して改善する。
論文 参考訳(メタデータ) (2022-12-14T06:04:18Z) - Cross-Site Severity Assessment of COVID-19 from CT Images via Domain
Adaptation [64.59521853145368]
CT画像によるコロナウイルス病2019(COVID-19)の早期かつ正確な重症度評価は,集中治療単位のイベント推定に有効である。
ラベル付きデータを拡張し、分類モデルの一般化能力を向上させるためには、複数のサイトからデータを集約する必要がある。
この課題は、軽度の感染症と重度の感染症の集団不均衡、部位間のドメイン分布の相違、不均一な特徴の存在など、いくつかの課題に直面する。
論文 参考訳(メタデータ) (2021-09-08T07:56:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。