論文の概要: How many samples to label for an application given a foundation model? Chest X-ray classification study
- arxiv url: http://arxiv.org/abs/2510.11553v1
- Date: Mon, 13 Oct 2025 15:53:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:30.441282
- Title: How many samples to label for an application given a foundation model? Chest X-ray classification study
- Title(参考訳): 基礎モデルに基づくアプリケーションにラベルをつけるサンプルはいくつあるか?胸部X線分類学的研究
- Authors: Nikolay Nechaev, Evgenia Przhezdzetskaya, Viktor Gombolevskiy, Dmitry Umerenkov, Dmitry Dylov,
- Abstract要約: 特定ROC-AUC閾値に必要なトレーニングサイズを予測するために,パワー・ロー・フィット(Power-law fits)の評価を行った。
XrayCLIP と XraySigLIP は,ResNet-50 ベースラインよりもラベル付きサンプルの方がはるかに少ない性能を実現している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Chest X-ray classification is vital yet resource-intensive, typically demanding extensive annotated data for accurate diagnosis. Foundation models mitigate this reliance, but how many labeled samples are required remains unclear. We systematically evaluate the use of power-law fits to predict the training size necessary for specific ROC-AUC thresholds. Testing multiple pathologies and foundation models, we find XrayCLIP and XraySigLIP achieve strong performance with significantly fewer labeled examples than a ResNet-50 baseline. Importantly, learning curve slopes from just 50 labeled cases accurately forecast final performance plateaus. Our results enable practitioners to minimize annotation costs by labeling only the essential samples for targeted performance.
- Abstract(参考訳): 胸部X線分類は必須だが資源集約であり、通常は正確な診断のために広範囲の注釈付きデータを必要とする。
基礎モデルは、この依存を緩和するが、ラベル付きサンプルの数はまだ不明である。
我々は,特定のROC-AUC閾値に必要なトレーニングサイズを予測するために,パワー・ロー・フィットの使用を体系的に評価した。
XrayCLIP と XraySigLIP は ResNet-50 ベースラインに比べてラベル付き例が大幅に少ないほど高い性能が得られる。
重要なことは、わずか50のラベル付きケースから学習曲線の傾きを正確に予測することである。
この結果から,対象のパフォーマンスに必須のサンプルのみをラベル付けすることで,アノテーションのコストを最小限に抑えることができた。
関連論文リスト
- Revisiting Performance Claims for Chest X-Ray Models Using Clinical Context [12.0757445616255]
それぞれのCXRに先立って記録された放電サマリーを用いて,各CXRラベルの事前検査または事前試験の確率を導出する。
いくつかの診断ラベルでは、CXRモデルはテスト前の確率が非常に低い場合に最もよく機能する傾向にある。
このショートカットが存在しないバランスの取れたテストセットでは,パフォーマンスが急激に低下していることが分かりました。
論文 参考訳(メタデータ) (2025-09-24T01:10:35Z) - Clinically-Inspired Hierarchical Multi-Label Classification of Chest X-rays with a Penalty-Based Loss Function [1.264536505250038]
本稿では,臨床診断性を高めるマルチラベル胸部X線(CXR)画像分類法を提案する。
臨床的に有意な診断関係を捉えるため,階層的なラベル分類を取り入れた。
実験では,受信機動作特性曲線(AUROC)の0.903の平均値を得た。
論文 参考訳(メタデータ) (2025-02-05T20:15:06Z) - How Can We Tame the Long-Tail of Chest X-ray Datasets? [0.0]
胸部X線(英: Chest X-rays、CXR)は、多数の異常を推測するために用いられる医療画像のモダリティである。
非常に一般的に観測されており、CXRデータセットで十分に表現されているものはほとんどない。
現在のモデルでは、稀ではあるが高い意味を持つラベルの独立した差別的特徴を学習することは困難である。
論文 参考訳(メタデータ) (2023-09-08T12:28:40Z) - Automated Labeling of German Chest X-Ray Radiology Reports using Deep
Learning [50.591267188664666]
本稿では,ルールベースのドイツ語CheXpertモデルによってラベル付けされたレポートに基づいて,ディープラーニングに基づくCheXpertラベル予測モデルを提案する。
その結果,3つのタスクすべてにおいて,ルールベースモデルを大幅に上回ったアプローチの有効性が示された。
論文 参考訳(メタデータ) (2023-06-09T16:08:35Z) - Self-Supervised Learning as a Means To Reduce the Need for Labeled Data
in Medical Image Analysis [64.4093648042484]
胸部X線画像のデータセットとバウンディングボックスラベルを用いて,13種類の異常の分類を行った。
ラベル付きデータの平均精度と精度を60%に抑えることで,完全教師付きモデルと同等の性能が得られることを示す。
論文 参考訳(メタデータ) (2022-06-01T09:20:30Z) - Label Cleaning Multiple Instance Learning: Refining Coarse Annotations
on Single Whole-Slide Images [83.7047542725469]
病理検体の全スライディング画像(WSI)における癌領域のアノテーションは、臨床診断、生医学研究、機械学習アルゴリズムの開発において重要な役割を担っている。
本稿では,外部トレーニングデータを必要とせず,単一のWSI上で粗いアノテーションを洗練するためのLC-MIL (Label Cleaning Multiple Instance Learning) を提案する。
乳癌リンパ節転移,肝癌,大腸癌の検体を併用した異種 WSI 実験の結果,LC-MIL は粗いアノテーションを著しく改善し,単一スライドから学習しながらも,最先端の代替品よりも優れていた。
論文 参考訳(メタデータ) (2021-09-22T15:06:06Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Self-Training with Improved Regularization for Sample-Efficient Chest
X-Ray Classification [80.00316465793702]
挑戦的なシナリオで堅牢なモデリングを可能にするディープラーニングフレームワークを提案する。
その結果,85%のラベル付きデータを用いて,大規模データ設定で学習した分類器の性能に適合する予測モデルを構築することができた。
論文 参考訳(メタデータ) (2020-05-03T02:36:00Z) - Localization of Critical Findings in Chest X-Ray without Local
Annotations Using Multi-Instance Learning [0.0]
ディープラーニングモデルは説明責任の欠如に苦しむことが多い。
ディープラーニングモデルは、ピクセルレベルラベルやバウンディングボックス座標のような、局所的なアノテートされたトレーニングデータを必要とする。
本研究では,マルチインスタンス学習に基づく解釈可能なDLアルゴリズムを用いて,これらの欠点に対処する。
論文 参考訳(メタデータ) (2020-01-23T21:29:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。