論文の概要: CXR-CML: Improved zero-shot classification of long-tailed multi-label diseases in Chest X-Rays
- arxiv url: http://arxiv.org/abs/2507.19398v1
- Date: Fri, 25 Jul 2025 16:05:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-28 16:16:49.027844
- Title: CXR-CML: Improved zero-shot classification of long-tailed multi-label diseases in Chest X-Rays
- Title(参考訳): CXR-CML:胸部X線における長尾多ラベル疾患のゼロショット分類の改善
- Authors: Rajesh Madhipati, Sheethal Bhat, Lukas Buess, Andreas Maier,
- Abstract要約: 臨床所見の分布におけるクラス不均衡は,自己教師型ディープラーニングモデルにおいて重要な課題である。
本稿では,潜在空間内のクラス分布と直接整合するクラス重み付け機構を提案する。
提案手法では,MIMIC-CXR-JPGデータセットの40クラスで0ショットAUCスコアが7%向上した。
- 参考スコア(独自算出の注目度): 3.196204482566275
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Chest radiography (CXR) plays a crucial role in the diagnosis of various diseases. However, the inherent class imbalance in the distribution of clinical findings presents a significant challenge for current self-supervised deep learning models. These models often fail to accurately classify long-tailed classes. Current Vision-Language models such as Contrastive Language Image Pre-training (CLIP) models effectively model the manifold distribution of the latent space, enabling high zero-shot classification accuracies. Although CLIP performs well on most of the primary classes in the dataset, our work reveals that its effectiveness decreases significantly for classes with a long-tailed distribution. Our approach employs a class-weighting mechanism that directly aligns with the distribution of classes within the latent space. This method ensures a substantial improvement in overall classification performance, with particular emphasis on enhancing the recognition and accuracy of rarely observed classes. We accomplish this by applying Gaussian Mixture Model (GMM) clustering to the latent space. The subsequent clusters are further refined by Student t-distribution, followed by a metric loss that utilizes the altered embeddings. Our approach facilitates stable and adaptive clustering of the features. This results in a notable average improvement of 7\% points in zero-shot AUC scores across 40 classes in the MIMIC-CXR-JPG dataset from previous SOTA models.
- Abstract(参考訳): 胸部X線撮影(CXR)は各種疾患の診断において重要な役割を担っている。
しかし, 臨床所見の分布に内在するクラス不均衡は, 現在の自己教師型ディープラーニングモデルにとって大きな課題となっている。
これらのモデルは長い尾のクラスを正確に分類できないことが多い。
Contrastive Language Image Pre-Training (CLIP) モデルのような現在の視覚言語モデルは、潜在空間の多様体分布を効果的にモデル化し、高いゼロショット分類精度を実現する。
CLIPはデータセットのほとんどの主要クラスでうまく機能するが、長い尾の分布を持つクラスでは、その効果が著しく低下することが明らかになった。
我々のアプローチでは、潜在空間内のクラスの分布と直接整合するクラス重み付け機構を採用している。
本手法は, 全体の分類性能を著しく向上させ, 特に稀に観察されるクラスの認識と精度の向上に重点を置いている。
本稿では,ガウス混合モデル (GMM) クラスタリングを潜在空間に適用することによって実現した。
その後のクラスタは、Student t-distributionによってさらに洗練され、その後、変更した埋め込みを利用するメトリックロスが続く。
提案手法は特徴の安定かつ適応的なクラスタリングを促進する。
その結果,従来のSOTAモデルを用いたMIMIC-CXR-JPGデータセットでは,0ショットAUCスコアが40クラスに 7 % 向上した。
関連論文リスト
- Unbiased Max-Min Embedding Classification for Transductive Few-Shot Learning: Clustering and Classification Are All You Need [83.10178754323955]
わずかなショットラーニングにより、モデルがいくつかのラベル付き例から一般化できる。
本稿では,Unbiased Max-Min Embedding Classification (UMMEC)法を提案する。
本手法は最小ラベル付きデータを用いて分類性能を著しく向上させ, 注釈付きLの最先端化を推し進める。
論文 参考訳(メタデータ) (2025-03-28T07:23:07Z) - Long-tailed Medical Diagnosis with Relation-aware Representation Learning and Iterative Classifier Calibration [14.556686415877602]
本稿では,Long-tailed Medical Diagnosis (LMD) フレームワークを提案する。
私たちのフレームワークは最先端のアプローチを大きく超えています。
論文 参考訳(メタデータ) (2025-02-05T14:57:23Z) - Solving the long-tailed distribution problem by exploiting the synergies and balance of different techniques [6.068761166911576]
長い尾のデータ分布は一般的であり、経験的リスク最小化で訓練されたモデルでは、尾のクラスを効果的に学習し分類することは困難である。
SCL(Supervised Contrastive Learning)、RSG(Rare-Class Sample Generator)、LDAM(Label-Distribution-Aware Margin Loss)の3つのロングテール認識技術について検討した。
論文 参考訳(メタデータ) (2025-01-23T15:35:15Z) - Electroencephalogram Emotion Recognition via AUC Maximization [0.0]
不均衡データセットは神経科学、認知科学、医学診断などの分野で大きな課題を提起する。
本研究は,DEAPデータセットにおけるライキングラベルを例として,イシュークラスの不均衡に対処する。
論文 参考訳(メタデータ) (2024-08-16T19:08:27Z) - Bias Mitigating Few-Shot Class-Incremental Learning [17.185744533050116]
クラス増分学習は,限定された新規クラスサンプルを用いて,新規クラスを継続的に認識することを目的としている。
最近の手法では,段階的なセッションで特徴抽出器を微調整することにより,ベースクラスとインクリメンタルクラスの精度の不均衡を緩和している。
本研究では,FSCIL問題におけるモデルバイアスを緩和する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-02-01T10:37:41Z) - RanPAC: Random Projections and Pre-trained Models for Continual Learning [59.07316955610658]
継続学習(CL)は、古いタスクを忘れずに、非定常データストリームで異なるタスク(分類など)を学習することを目的としている。
本稿では,事前学習モデルを用いたCLの簡潔かつ効果的なアプローチを提案する。
論文 参考訳(メタデータ) (2023-07-05T12:49:02Z) - Successive Subspace Learning for Cardiac Disease Classification with
Two-phase Deformation Fields from Cine MRI [36.044984400761535]
本研究は,CVD分類のための軽量な逐次サブスペース学習フレームワークを提案する。
解釈可能なフィードフォワードデザインに基づいており、心房と組み合わせている。
3D CNNベースのアプローチと比較して、我々のフレームワークは140$times$より少ないパラメータで優れた分類性能を実現する。
論文 参考訳(メタデータ) (2023-01-21T15:00:59Z) - Learnable Distribution Calibration for Few-Shot Class-Incremental
Learning [122.2241120474278]
FSCIL(Few-shot class-incremental Learning)は、古いクラス分布を記憶し、少数のトレーニングサンプルから新しいクラス分布を推定するという課題に直面している。
本稿では,これら2つの課題を統一フレームワークを用いて体系的に解決することを目的とした,学習可能な分布校正手法を提案する。
論文 参考訳(メタデータ) (2022-10-01T09:40:26Z) - Calibrating Class Activation Maps for Long-Tailed Visual Recognition [60.77124328049557]
本稿では,CNNの長期分布からネットワーク学習を改善するための2つの効果的な修正を提案する。
まず,ネットワーク分類器の学習と予測を改善するために,CAMC (Class Activation Map) モジュールを提案する。
第2に,長期化問題における表現学習における正規化分類器の利用について検討する。
論文 参考訳(メタデータ) (2021-08-29T05:45:03Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Entropy-Based Uncertainty Calibration for Generalized Zero-Shot Learning [49.04790688256481]
一般化ゼロショット学習(GZSL)の目的は、目に見えないクラスと見えないクラスの両方を認識することである。
ほとんどのGZSLメソッドは、通常、見えないクラスの意味情報から視覚表現を合成することを学ぶ。
本論文では,三重項損失を持つ2重変分オートエンコーダを利用する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-01-09T05:21:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。