論文の概要: Deep Mining External Imperfect Data for Chest X-ray Disease Screening
- arxiv url: http://arxiv.org/abs/2006.03796v1
- Date: Sat, 6 Jun 2020 06:48:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-24 21:41:19.476205
- Title: Deep Mining External Imperfect Data for Chest X-ray Disease Screening
- Title(参考訳): 胸部X線検査における深部鉱毒異常データ
- Authors: Luyang Luo, Lequan Yu, Hao Chen, Quande Liu, Xi Wang, Jiaqi Xu, and
Pheng-Ann Heng
- Abstract要約: 我々は、外部のCXRデータセットを組み込むことで、不完全なトレーニングデータにつながると論じ、課題を提起する。
本研究は,多ラベル病分類問題を重み付き独立二分課題として分類する。
我々のフレームワークは、ドメインとラベルの相違を同時にモデル化し、対処し、優れた知識マイニング能力を実現する。
- 参考スコア(独自算出の注目度): 57.40329813850719
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning approaches have demonstrated remarkable progress in automatic
Chest X-ray analysis. The data-driven feature of deep models requires training
data to cover a large distribution. Therefore, it is substantial to integrate
knowledge from multiple datasets, especially for medical images. However,
learning a disease classification model with extra Chest X-ray (CXR) data is
yet challenging. Recent researches have demonstrated that performance
bottleneck exists in joint training on different CXR datasets, and few made
efforts to address the obstacle. In this paper, we argue that incorporating an
external CXR dataset leads to imperfect training data, which raises the
challenges. Specifically, the imperfect data is in two folds: domain
discrepancy, as the image appearances vary across datasets; and label
discrepancy, as different datasets are partially labeled. To this end, we
formulate the multi-label thoracic disease classification problem as weighted
independent binary tasks according to the categories. For common categories
shared across domains, we adopt task-specific adversarial training to alleviate
the feature differences. For categories existing in a single dataset, we
present uncertainty-aware temporal ensembling of model predictions to mine the
information from the missing labels further. In this way, our framework
simultaneously models and tackles the domain and label discrepancies, enabling
superior knowledge mining ability. We conduct extensive experiments on three
datasets with more than 360,000 Chest X-ray images. Our method outperforms
other competing models and sets state-of-the-art performance on the official
NIH test set with 0.8349 AUC, demonstrating its effectiveness of utilizing the
external dataset to improve the internal classification.
- Abstract(参考訳): ディープラーニングのアプローチは、胸部x線自動分析において著しく進歩している。
深層モデルのデータ駆動機能は、大規模な分布をカバーするためにトレーニングデータを必要とする。
したがって、複数のデータセット、特に医療画像からの知識を統合することは極めて重要である。
しかし、胸部x線(cxr)データを用いた疾患分類モデルの学習はまだ困難である。
近年の研究では、異なるCXRデータセットのジョイントトレーニングにパフォーマンスボトルネックが存在することが示されており、障害に対処する努力は少ない。
本稿では,外部のCXRデータセットを組み込むことで,不完全なトレーニングデータが得られることを議論する。
具体的には、画像の外観がデータセットによって異なるため、ドメインの差分と、異なるデータセットが部分的にラベル付けされているため、ラベルの差分である。
そこで我々は,多ラベル胸部疾患分類問題を重み付き独立二分課題として分類した。
ドメイン間で共有される共通カテゴリでは、機能の違いを軽減するためにタスク固有の敵トレーニングを採用します。
単一のデータセットに存在するカテゴリに対して,モデル予測の不確実性を考慮した時間的センシングを行い,不足ラベルからの情報をさらに抽出する。
このように、我々のフレームワークはドメインとラベルの相違を同時にモデル化し、対処し、優れた知識マイニング能力を実現する。
30万以上の胸部x線画像を含む3つのデータセットについて広範な実験を行った。
本手法は他の競合モデルよりも優れており、0.8349 aucの公式nihテストセットで最新性能を設定でき、外部データセットを利用して内部分類を改善する効果を実証する。
関連論文リスト
- Semantically Redundant Training Data Removal and Deep Model
Classification Performance: A Study with Chest X-rays [5.454938535500864]
本稿では,意味的に冗長なトレーニングデータを識別・除去するためのエントロピーに基づくサンプルスコアリング手法を提案する。
我々は、トレーニングデータの情報サブセットに基づいてトレーニングされたモデルが、トレーニングセット全体においてトレーニングされたモデルよりも大幅に優れる、公開可能なNIH胸部X線データセットを使用することを実証する。
論文 参考訳(メタデータ) (2023-09-18T13:56:34Z) - How Can We Tame the Long-Tail of Chest X-ray Datasets? [0.0]
胸部X線(英: Chest X-rays、CXR)は、多数の異常を推測するために用いられる医療画像のモダリティである。
非常に一般的に観測されており、CXRデータセットで十分に表現されているものはほとんどない。
現在のモデルでは、稀ではあるが高い意味を持つラベルの独立した差別的特徴を学習することは困難である。
論文 参考訳(メタデータ) (2023-09-08T12:28:40Z) - When More is Less: Incorporating Additional Datasets Can Hurt
Performance By Introducing Spurious Correlations [16.782625445546273]
その結果、2つの病院のデータに基づいてトレーニングされたモデルでは、1つの病院のデータでトレーニングされたモデルよりも、両方の病院でグループ精度が劣っていることがわかった。
この現象は, 病院固有のイメージアーティファクトが原因で, 疾患と病院との間に生じる急激な相関関係から生じると説明される。
論文 参考訳(メタデータ) (2023-08-08T17:58:45Z) - Vision-Language Modelling For Radiological Imaging and Reports In The
Low Data Regime [70.04389979779195]
本稿では,視覚および言語入力を共通空間に埋め込んだ医用視覚言語モデル(VLM)について検討する。
本稿では,新しい画像領域やテキスト領域への汎用事前学習モデルの適用など,低データ性能向上のためのいくつかの候補手法について検討する。
テキスト・ツー・イメージ検索をベンチマークとして,2つの胸部X線および放射線学的報告を用いた可変サイズのトレーニングデータセットを用いて,これらの手法の性能評価を行った。
論文 参考訳(メタデータ) (2023-03-30T18:20:00Z) - Learn to Ignore: Domain Adaptation for Multi-Site MRI Analysis [1.3079444139643956]
本稿では,画像に含まれるスキャナ関連の特徴を無視し,分類タスクに関連する特徴を学習する新しい手法を提案する。
本手法は,多発性硬化症患者と健常者との分類作業において,最先端の領域適応法よりも優れていた。
論文 参考訳(メタデータ) (2021-10-13T15:40:50Z) - The pitfalls of using open data to develop deep learning solutions for
COVID-19 detection in chest X-rays [64.02097860085202]
深層学習モデルは、胸部X線から新型コロナウイルスを識別するために開発された。
オープンソースデータのトレーニングやテストでは,結果は異例です。
データ分析とモデル評価は、人気のあるオープンソースデータセットであるCOVIDxが実際の臨床問題を代表していないことを示している。
論文 参考訳(メタデータ) (2021-09-14T10:59:11Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Fader Networks for domain adaptation on fMRI: ABIDE-II study [68.5481471934606]
我々は3次元畳み込みオートエンコーダを用いて、無関係な空間画像表現を実現するとともに、ABIDEデータ上で既存のアプローチより優れていることを示す。
論文 参考訳(メタデータ) (2020-10-14T16:50:50Z) - Learning Invariant Feature Representation to Improve Generalization
across Chest X-ray Datasets [55.06983249986729]
我々は、トレーニングデータと同じデータセットでテストすると、ディープラーニングモデルが、異なるソースからデータセットでテストされると、パフォーマンスが低下し始めることを示す。
対戦型トレーニング戦略を用いることで、ネットワークはソース不変表現を学習せざるを得ないことを示す。
論文 参考訳(メタデータ) (2020-08-04T07:41:15Z) - Ensemble Deep Learning on Large, Mixed-Site fMRI Datasets in Autism and
Other Tasks [0.1160208922584163]
我々は、これまでコンパイルされた最大のマルチソース機能的MRI(fMRI)コネクトロミックデータセットを備えた畳み込みニューラルネットワーク(CNN)を訓練する。
ASDとTDの制御を区別するディープラーニングモデルは、時間的および小脳の接続に大きく焦点を絞っている。
論文 参考訳(メタデータ) (2020-02-14T17:28:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。