論文の概要: Few-shot learning for COVID-19 Chest X-Ray Classification with
Imbalanced Data: An Inter vs. Intra Domain Study
- arxiv url: http://arxiv.org/abs/2401.10129v1
- Date: Thu, 18 Jan 2024 16:59:27 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-19 15:45:50.187445
- Title: Few-shot learning for COVID-19 Chest X-Ray Classification with
Imbalanced Data: An Inter vs. Intra Domain Study
- Title(参考訳): 不均衡データを用いたcovid-19胸部x線分類のための少数撮影学習--ドメイン間比較研究
- Authors: Alejandro Gal\'an-Cuenca, Antonio Javier Gallego, Marcelo Saval-Calvo,
Antonio Pertusa
- Abstract要約: 医療画像データセットは、コンピュータ支援診断、治療計画、医学研究に使用される訓練モデルに不可欠である。
データ分散のばらつき、データの不足、ジェネリックイメージから事前トレーニングされたモデルを使用する場合の転送学習の問題などである。
本稿では,データ不足と分散不均衡の影響を軽減するために,一連の手法を統合したシームズニューラルネットワークに基づく手法を提案する。
- 参考スコア(独自算出の注目度): 49.5374512525016
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Medical image datasets are essential for training models used in
computer-aided diagnosis, treatment planning, and medical research. However,
some challenges are associated with these datasets, including variability in
data distribution, data scarcity, and transfer learning issues when using
models pre-trained from generic images. This work studies the effect of these
challenges at the intra- and inter-domain level in few-shot learning scenarios
with severe data imbalance. For this, we propose a methodology based on Siamese
neural networks in which a series of techniques are integrated to mitigate the
effects of data scarcity and distribution imbalance. Specifically, different
initialization and data augmentation methods are analyzed, and four adaptations
to Siamese networks of solutions to deal with imbalanced data are introduced,
including data balancing and weighted loss, both separately and combined, and
with a different balance of pairing ratios. Moreover, we also assess the
inference process considering four classifiers, namely Histogram, $k$NN, SVM,
and Random Forest. Evaluation is performed on three chest X-ray datasets with
annotated cases of both positive and negative COVID-19 diagnoses. The accuracy
of each technique proposed for the Siamese architecture is analyzed separately
and their results are compared to those obtained using equivalent methods on a
state-of-the-art CNN. We conclude that the introduced techniques offer
promising improvements over the baseline in almost all cases, and that the
selection of the technique may vary depending on the amount of data available
and the level of imbalance.
- Abstract(参考訳): 医療画像データセットは、コンピュータ支援診断、治療計画、医学研究に使用される訓練モデルに不可欠である。
しかし、データ分散の可変性、データ不足、ジェネリックイメージから事前トレーニングされたモデルを使用する際のトランスファー学習の問題など、これらのデータセットにはいくつかの課題がある。
本研究は,厳格なデータ不均衡を伴う単発学習シナリオにおける,ドメイン内およびドメイン間レベルでの課題の効果について検討する。
そこで本研究では,データ不足と分散不均衡の影響を軽減するために,一連の手法を統合したシームズニューラルネットワークに基づく手法を提案する。
具体的には、異なる初期化法とデータ拡張法を解析し、データバランスと重み付き損失を含む不均衡データを扱うソリューションのシームズネットワークへの4つの適応と、ペアリング比の異なるバランスを導入している。
さらに,Histogram,$k$NN,SVM,Random Forestの4つの分類子を考慮した推論プロセスの評価を行った。
3つの胸部X線データセットで陽性と陰性の両方の診断を行った場合の評価を行った。
siameseアーキテクチャで提案する各手法の精度を別々に解析し,その結果を最先端cnnの等価手法を用いて求めた手法と比較した。
提案手法は, ほぼすべての事例において, ベースラインよりも有望な改善をもたらすとともに, 利用可能なデータ量や不均衡度によって, 技術の選択が変化する可能性がある。
関連論文リスト
- A Multi-Dataset Classification-Based Deep Learning Framework for Electronic Health Records and Predictive Analysis in Healthcare [0.5999777817331317]
本研究では,複数のデータセットを分類するための新しいディープラーニング予測分析フレームワークを提案する。
Residual NetworksとArtificial Neural Networksを組み合わせたハイブリッドディープラーニングモデルを提案し,急性および慢性疾患を検出する。
厳密な実験と評価の結果,網膜基底像,肝硬変ステージ,心疾患診断予測では,93%,99%,95%の精度が得られた。
論文 参考訳(メタデータ) (2024-09-25T08:13:39Z) - Iterative Online Image Synthesis via Diffusion Model for Imbalanced
Classification [29.730360798234294]
医用画像分類におけるクラス不均衡問題に対処するための反復オンライン画像合成フレームワークを提案する。
このフレームワークにはオンライン画像合成(OIS)と精度適応サンプリング(AAS)という2つの重要なモジュールが組み込まれている。
不均衡な分類に対処するための提案手法の有効性を評価するため,HAM10000およびAPTOSデータセットを用いて実験を行った。
論文 参考訳(メタデータ) (2024-03-13T10:51:18Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - Effective Class-Imbalance learning based on SMOTE and Convolutional
Neural Networks [0.1074267520911262]
不均衡データ(ID)は、機械学習(ML)モデルから満足な結果を得るための問題である。
本稿では,Deep Neural Networks(DNN)とConvolutional Neural Networks(CNN)に基づく手法の有効性を検討する。
信頼性の高い結果を得るために,ランダムにシャッフルしたデータ分布を用いて100回実験を行った。
論文 参考訳(メタデータ) (2022-09-01T07:42:16Z) - Feature robustness and sex differences in medical imaging: a case study
in MRI-based Alzheimer's disease detection [1.7616042687330637]
我々はADNI MRIデータセットの2つの分類方式を比較した。
訓練データセットの性構成に対する男女試験対象者のモデル性能の強い依存は見つからない。
論文 参考訳(メタデータ) (2022-04-04T17:37:54Z) - Analyzing the Effects of Handling Data Imbalance on Learned Features
from Medical Images by Looking Into the Models [50.537859423741644]
不均衡なデータセットでモデルをトレーニングすることは、学習問題にユニークな課題をもたらす可能性がある。
ニューラルネットワークの内部ユニットを深く調べて、データの不均衡処理が学習した機能にどのように影響するかを観察します。
論文 参考訳(メタデータ) (2022-04-04T09:38:38Z) - Cross-Site Severity Assessment of COVID-19 from CT Images via Domain
Adaptation [64.59521853145368]
CT画像によるコロナウイルス病2019(COVID-19)の早期かつ正確な重症度評価は,集中治療単位のイベント推定に有効である。
ラベル付きデータを拡張し、分類モデルの一般化能力を向上させるためには、複数のサイトからデータを集約する必要がある。
この課題は、軽度の感染症と重度の感染症の集団不均衡、部位間のドメイン分布の相違、不均一な特徴の存在など、いくつかの課題に直面する。
論文 参考訳(メタデータ) (2021-09-08T07:56:51Z) - Deep Mining External Imperfect Data for Chest X-ray Disease Screening [57.40329813850719]
我々は、外部のCXRデータセットを組み込むことで、不完全なトレーニングデータにつながると論じ、課題を提起する。
本研究は,多ラベル病分類問題を重み付き独立二分課題として分類する。
我々のフレームワークは、ドメインとラベルの相違を同時にモデル化し、対処し、優れた知識マイニング能力を実現する。
論文 参考訳(メタデータ) (2020-06-06T06:48:40Z) - Predictive Modeling of ICU Healthcare-Associated Infections from
Imbalanced Data. Using Ensembles and a Clustering-Based Undersampling
Approach [55.41644538483948]
本研究は,集中治療室における危険因子の同定と医療関連感染症の予測に焦点をあてる。
感染発生率の低減に向けた意思決定を支援することを目的とする。
論文 参考訳(メタデータ) (2020-05-07T16:13:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。