論文の概要: Correcting Class Imbalances with Self-Training for Improved Universal Lesion Detection and Tagging
- arxiv url: http://arxiv.org/abs/2504.05207v1
- Date: Mon, 07 Apr 2025 15:57:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-15 19:55:25.974814
- Title: Correcting Class Imbalances with Self-Training for Improved Universal Lesion Detection and Tagging
- Title(参考訳): ユニバーサル病変検出とタグ付けの改善のための自己訓練によるクラス不均衡の補正
- Authors: Alexander Shieh, Tejas Sudharshan Mathai, Jianfei Liu, Angshuman Paul, Ronald M. Summers,
- Abstract要約: CT研究におけるユニバーサル病変検出・タグング(ULDT)は,腫瘍の負担評価と経過に伴う病変の進行(成長・収縮)の追跡に重要である。
以前の研究では、DeepLesionデータセット(4,427人、研究10,594人、CTスライス32,120人、病変32,735人、体の一部のラベル8人)をアルゴリズム開発に使用していたが、このデータセットは完全に注釈付けされておらず、クラス不均衡を含んでいる。
我々は,DeepLesionの11.5%のサブセットを限定的に使用して,ULDTのための自己学習パイプラインを開発した。
- 参考スコア(独自算出の注目度): 43.06199185109424
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Universal lesion detection and tagging (ULDT) in CT studies is critical for tumor burden assessment and tracking the progression of lesion status (growth/shrinkage) over time. However, a lack of fully annotated data hinders the development of effective ULDT approaches. Prior work used the DeepLesion dataset (4,427 patients, 10,594 studies, 32,120 CT slices, 32,735 lesions, 8 body part labels) for algorithmic development, but this dataset is not completely annotated and contains class imbalances. To address these issues, in this work, we developed a self-training pipeline for ULDT. A VFNet model was trained on a limited 11.5\% subset of DeepLesion (bounding boxes + tags) to detect and classify lesions in CT studies. Then, it identified and incorporated novel lesion candidates from a larger unseen data subset into its training set, and self-trained itself over multiple rounds. Multiple self-training experiments were conducted with different threshold policies to select predicted lesions with higher quality and cover the class imbalances. We discovered that direct self-training improved the sensitivities of over-represented lesion classes at the expense of under-represented classes. However, upsampling the lesions mined during self-training along with a variable threshold policy yielded a 6.5\% increase in sensitivity at 4 FP in contrast to self-training without class balancing (72\% vs 78.5\%) and a 11.7\% increase compared to the same self-training policy without upsampling (66.8\% vs 78.5\%). Furthermore, we show that our results either improved or maintained the sensitivity at 4FP for all 8 lesion classes.
- Abstract(参考訳): CT研究におけるユニバーサル病変検出・タグング(ULDT)は,腫瘍の負担評価と経過に伴う病変の進行(成長・収縮)の追跡に重要である。
しかし、完全な注釈付きデータの欠如は、有効なULDTアプローチの開発を妨げる。
以前の研究では、DeepLesionデータセット(4,427人、研究10,594人、CTスライス32,120人、病変32,735人、体の一部のラベル8人)をアルゴリズム開発に使用していたが、このデータセットは完全に注釈付けされておらず、クラス不均衡を含んでいる。
これらの課題に対処するため,我々はULDTのための自己学習パイプラインを開発した。
VFNetモデルは、CT研究の病変を検出し分類するために、DeepLesionの11.5\%サブセット(バウンディングボックスとタグ)でトレーニングされた。
その後、より大きな未確認データサブセットから新たな病変候補を特定し、そのトレーニングセットに組み入れ、複数のラウンドで自己学習を行った。
複数の自己学習実験を、異なるしきい値ポリシーで実施し、より高い品質で予測された病変を選択し、クラス不均衡をカバーした。
その結果, 自己訓練により, 過度に表現された病変に対する感受性が向上し, 過度に表現された病変に対する感受性が向上することが判明した。
しかし、自己トレーニング中に採取した病変のアップサンプリングと可変しきい値ポリシは、クラスバランスのない自己トレーニング(72 % vs 78.5 %)に比べて4 FPで6.5 %、アップサンプリングのない同じセルフトレーニングポリシー(66.8 % vs 78.5 %)に比べて11.7 %上昇した。
さらに,8種類の病変に対して4FPの感度を改善または維持した。
関連論文リスト
- Class Imbalance Correction for Improved Universal Lesion Detection and Tagging in CT [1.7098468543752943]
我々は、DeepLesionの限られたサブセット(6%、1331病変、1309スライス)を使用して、VFNetモデルをトレーニングし、病変を検出し、タグ付けします。
私たちは、DeepLesionでクラス不均衡を最初に報告し、それに対応するためにデータ駆動のステップを取りました。
論文 参考訳(メタデータ) (2025-04-08T00:58:26Z) - 3D Universal Lesion Detection and Tagging in CT with Self-Training [3.68620908362189]
本研究では,3次元病変を検知し,身体部位に応じてタグ付けするための自己学習パイプラインを提案する。
私たちの知る限り、私たちは初めて3Dの病変を共同で検出し、身体のラベルに従ってタグ付けしました。
論文 参考訳(メタデータ) (2025-04-07T15:50:27Z) - Self-Supervised Pretraining Improves Performance and Inference
Efficiency in Multiple Lung Ultrasound Interpretation Tasks [65.23740556896654]
肺超音波検査における複数分類課題に適用可能なニューラルネットワーク特徴抽出器を,自己指導型プレトレーニングで作成できるかどうかを検討した。
3つの肺超音波のタスクを微調整すると、事前訓練されたモデルにより、各テストセットの受信操作曲線(AUC)における平均クロスタスク面積は、それぞれ0.032と0.061に改善された。
論文 参考訳(メタデータ) (2023-09-05T21:36:42Z) - Achieving Reliable and Fair Skin Lesion Diagnosis via Unsupervised Domain Adaptation [43.1078084014722]
教師なしドメイン適応(UDA)は、信頼性の高い分類器を開発するために、大きな外部データセットを統合することができる。
UDAは少数派に対する偏見を効果的に軽減し、診断システムの公平性を高めることができる。
論文 参考訳(メタデータ) (2023-07-06T17:32:38Z) - SSL-CPCD: Self-supervised learning with composite pretext-class
discrimination for improved generalisability in endoscopic image analysis [3.1542695050861544]
深層学習に基づく教師付き手法は医用画像解析において広く普及している。
大量のトレーニングデータと、目に見えないデータセットに対する一般的な問題に直面する必要がある。
本稿では,加法的角マージンを用いたパッチレベルのインスタンスグループ識別とクラス間変動のペナル化について検討する。
論文 参考訳(メタデータ) (2023-05-31T21:28:08Z) - Patch-level instance-group discrimination with pretext-invariant
learning for colitis scoring [2.691339855008848]
自己教師型学習(SSL)のためのプリテキスト不変表現学習(PLD-PIRL)を用いたパッチレベルの新しいインスタンスグループ識別手法を提案する。
本実験では,ベースライン教師付きネットワークや最先端SSL方式と比較して,精度とロバスト性の向上を実証した。
論文 参考訳(メタデータ) (2022-07-11T21:06:29Z) - Dynamic Bank Learning for Semi-supervised Federated Image Diagnosis with
Class Imbalance [65.61909544178603]
クラス不均衡半教師付きFL(imFed-Semi)の実用的かつ困難な問題について検討する。
このImFed-Semi問題は、クラス比例情報を利用してクライアントトレーニングを改善する新しい動的銀行学習方式によって解決される。
25,000個のCTスライスによる頭蓋内出血診断と10,015個の皮膚内視鏡画像による皮膚病変診断の2つの公開実世界の医療データセットに対するアプローチを評価した。
論文 参考訳(メタデータ) (2022-06-27T06:51:48Z) - Identifying and mitigating bias in algorithms used to manage patients in
a pandemic [4.756860520861679]
現実のデータセットを使用して、新型コロナウイルスの死亡率、人工呼吸器の状態、入院状態を予測するために、ロジスティック回帰モデルが作成された。
モデルではバイアス試験の回数が57%減少した。
キャリブレーション後, 予測モデルの平均感度は0.527から0.955に増加した。
論文 参考訳(メタデータ) (2021-10-30T21:10:56Z) - SOUL: An Energy-Efficient Unsupervised Online Learning Seizure Detection
Classifier [68.8204255655161]
神経活動を記録して発作を検出するインプラントデバイスは、発作を抑えるために警告を発したり神経刺激を誘発したりするために採用されている。
移植可能な発作検出システムでは、低出力で最先端のオンライン学習アルゴリズムを使用して、神経信号のドリフトに動的に適応することができる。
SOULはTSMCの28nmプロセスで0.1mm2を占め、1.5nJ/分級エネルギー効率を実現した。
論文 参考訳(メタデータ) (2021-10-01T23:01:20Z) - Deep learning-based COVID-19 pneumonia classification using chest CT
images: model generalizability [54.86482395312936]
深層学習(DL)分類モデルは、異なる国の3DCTデータセット上で、COVID-19陽性患者を特定するために訓練された。
我々は、データセットと72%の列車、8%の検証、20%のテストデータを組み合わせたDLベースの9つの同一分類モデルを訓練した。
複数のデータセットでトレーニングされ、トレーニングに使用されるデータセットの1つからテストセットで評価されたモデルは、よりよいパフォーマンスを示した。
論文 参考訳(メタデータ) (2021-02-18T21:14:52Z) - Deep Lesion Tracker: Monitoring Lesions in 4D Longitudinal Imaging
Studies [19.890200389017213]
深部病変追跡器(DLT)は、外観と解剖学的信号の両方を使用するディープラーニングアプローチです。
我々は,公開deeplesionデータベースから3891個の病巣対からなる最初の病巣追跡ベンチマークをリリースする。
dltは100の縦断研究の外部臨床検査セットをよく一般化し、88%の精度を達成する。
論文 参考訳(メタデータ) (2020-12-09T05:23:46Z) - CovidDeep: SARS-CoV-2/COVID-19 Test Based on Wearable Medical Sensors
and Efficient Neural Networks [51.589769497681175]
新型コロナウイルス(SARS-CoV-2)がパンデミックを引き起こしている。
SARS-CoV-2の逆転写-ポリメラーゼ連鎖反応に基づく現在の試験体制は、試験要求に追いついていない。
我々は,効率的なDNNと市販のWMSを組み合わせたCovidDeepというフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-20T21:47:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。