論文の概要: Label-Efficient Chest X-ray Diagnosis via Partial CLIP Adaptation
- arxiv url: http://arxiv.org/abs/2507.07254v1
- Date: Wed, 09 Jul 2025 19:57:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-11 16:40:15.19368
- Title: Label-Efficient Chest X-ray Diagnosis via Partial CLIP Adaptation
- Title(参考訳): 部分的CLIP適応による胸部X線診断
- Authors: Heet Nitinkumar Dalsania,
- Abstract要約: 本稿では胸部X線診断のためのラベル効率戦略を提案する。
実験ではNIH Chest X-ray14データセットと、トレーニング済みのCLIP ViT-B/32モデルを使用する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern deep learning implementations for medical imaging usually rely on large labeled datasets. These datasets are often difficult to obtain due to privacy concerns, high costs, and even scarcity of cases. In this paper, a label-efficient strategy is proposed for chest X-ray diagnosis that seeks to reflect real-world hospital scenarios. The experiments use the NIH Chest X-ray14 dataset and a pre-trained CLIP ViT-B/32 model. The model is adapted via partial fine-tuning of its visual encoder and then evaluated using zero-shot and few-shot learning with 1-16 labeled examples per disease class. The tests demonstrate that CLIP's pre-trained vision-language features can be effectively adapted to few-shot medical imaging tasks, achieving over 20\% improvement in mean AUC score as compared to the zero-shot baseline. The key aspect of this work is to attempt to simulate internal hospital workflows, where image archives exist but annotations are sparse. This work evaluates a practical and scalable solution for both common and rare disease diagnosis. Additionally this research is intended for academic and experimental purposes only and has not been peer reviewed yet. All code is found at https://github.com/heet007-code/CLIP-disease-xray.
- Abstract(参考訳): 医療画像のための現代のディープラーニングの実装は通常、大きなラベル付きデータセットに依存している。
これらのデータセットは、プライバシの懸念、高いコスト、さらにはケースの不足のために入手が難しいことが多い。
本稿では,現実の病院シナリオを反映した胸部X線診断のためのラベル効率戦略を提案する。
実験ではNIH Chest X-ray14データセットと、トレーニング済みのCLIP ViT-B/32モデルを使用した。
このモデルは、視覚エンコーダの部分的な微調整によって適応され、ゼロショットと少数ショット学習を用いて、疾患のクラス毎に1-16ラベルの例で評価される。
このテストでは、CLIPの事前訓練された視覚言語機能は、ゼロショットベースラインに比べて平均AUCスコアが20倍以上の改善を達成し、数ショットの医療画像タスクに効果的に適応できることが示されている。
この研究の重要な側面は、画像アーカイブが存在するがアノテーションは少ない内部の病院ワークフローをシミュレートすることである。
本研究は, 一般的な診断と稀な診断の両方に対して, 実用的でスケーラブルなソリューションを評価するものである。
また、本研究は学術的・実験的目的のみを対象としており、まだ査読されていない。
すべてのコードはhttps://github.com/heet007-code/CLIP-disease-xrayにある。
関連論文リスト
- Interpreting Biomedical VLMs on High-Imbalance Out-of-Distributions: An Insight into BiomedCLIP on Radiology [0.0]
我々は、高度にバランスの取れない、アウト・オブ・ディストリビューションな医療データセットに適用した場合、BiomedCLIPの限界を分析する。
ゼロショット設定下でのモデルは,すべてのラベルを過度に予測し,精度の低下とクラス間分離性に繋がることを示す。
我々は、現実の環境で信頼性と適用性を高めるために、モデルの慎重な適応の必要性を強調します。
論文 参考訳(メタデータ) (2025-06-17T02:59:42Z) - Position-Guided Prompt Learning for Anomaly Detection in Chest X-Rays [46.78926066405227]
胸部X線異常検出は重要な課題である。
近年,多数の医用画像に基づいて事前トレーニングされたCLIPベースの手法は,ゼロ/フェーショットダウンストリームタスクにおいて顕著な性能を示した。
凍結したCLIPモデルにタスクデータを適応させる位置誘導型プロンプト学習法を提案する。
論文 参考訳(メタデータ) (2024-05-20T12:11:41Z) - Weakly-supervised positional contrastive learning: application to
cirrhosis classification [45.63061034568991]
大規模な医療画像データセットは、低信頼で弱いラベルで安価に注釈を付けることができる。
組織学に基づく診断のような高信頼なラベルへのアクセスは稀で費用がかかる。
提案手法は,効率的な弱教師付き位置対応学習戦略 (WSP) を提案する。
論文 参考訳(メタデータ) (2023-07-10T15:02:13Z) - Vision-Language Modelling For Radiological Imaging and Reports In The
Low Data Regime [70.04389979779195]
本稿では,視覚および言語入力を共通空間に埋め込んだ医用視覚言語モデル(VLM)について検討する。
本稿では,新しい画像領域やテキスト領域への汎用事前学習モデルの適用など,低データ性能向上のためのいくつかの候補手法について検討する。
テキスト・ツー・イメージ検索をベンチマークとして,2つの胸部X線および放射線学的報告を用いた可変サイズのトレーニングデータセットを用いて,これらの手法の性能評価を行った。
論文 参考訳(メタデータ) (2023-03-30T18:20:00Z) - Significantly improving zero-shot X-ray pathology classification via fine-tuning pre-trained image-text encoders [50.689585476660554]
本稿では,正対損失緩和とランダムな文サンプリングを含む新たな微調整手法を提案する。
提案手法は,胸部X線データセットと3つの事前訓練モデル間のゼロショット病理分類を一貫して改善する。
論文 参考訳(メタデータ) (2022-12-14T06:04:18Z) - A knee cannot have lung disease: out-of-distribution detection with
in-distribution voting using the medical example of chest X-ray
classification [58.720142291102135]
この研究では、胸部X線分類モデルであるCheXnetを用いて、胸部X線14データセットをトレーニングした。
複数ラベル分類のためのOODデータを検出するために,IDV(In-distriion voting)を提案する。
ID (chest X-ray 14) と OOD データ (IRMA と ImageNet) に基づいてトレーニングした IDV アプローチは,平均で3つのデータセットにわたる 0.999 OOD 検出 AUC を達成した。
論文 参考訳(メタデータ) (2022-08-01T18:20:36Z) - Multi-Label Generalized Zero Shot Learning for the Classification of
Disease in Chest Radiographs [0.7734726150561088]
胸部X線画像の複数の病変を同時に予測できるゼロショット学習ネットワークを提案する。
ネットワークはエンドツーエンドのトレーニングが可能で、オフライン機能抽出器の独立した事前トレーニングは不要である。
我々のネットワークは、リコール、精度、f1スコア、受信機動作特性曲線の領域において、2つの強いベースラインを上回ります。
論文 参考訳(メタデータ) (2021-07-14T09:04:20Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - BS-Net: learning COVID-19 pneumonia severity on a large Chest X-Ray
dataset [6.5800499500032705]
我々は、Chest X-rays画像(CXR)に基づいて、新型コロナウイルス患者の肺妥協の度合いを判定するエンド・ツー・エンドのディープラーニングアーキテクチャを設計する。
当院で収集した約5,000個のCXR注釈画像の臨床的データセットを利用して検討した。
私たちのソリューションは、評価精度と一貫性において、一人のアノテータよりも優れています。
論文 参考訳(メタデータ) (2020-06-08T13:55:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。