論文の概要: A Real Use Case of Semi-Supervised Learning for Mammogram Classification
in a Local Clinic of Costa Rica
- arxiv url: http://arxiv.org/abs/2107.11696v1
- Date: Sat, 24 Jul 2021 22:26:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-28 03:21:27.741233
- Title: A Real Use Case of Semi-Supervised Learning for Mammogram Classification
in a Local Clinic of Costa Rica
- Title(参考訳): コスタリカ地方診療所におけるマンモグラム分類のための半教師付き学習の実例
- Authors: Saul Calderon-Ramirez, Diego Murillo-Hernandez, Kevin Rojas-Salazar,
David Elizondo, Shengxiang Yang, Miguel Molina-Cabello
- Abstract要約: ディープラーニングモデルのトレーニングには、かなりの量のラベル付きイメージが必要です。
多くの公開データセットが、さまざまな病院や診療所のデータで構築されている。
ラベルなしデータを利用した半教師付き深層学習手法であるMixMatchを提案し評価した。
- 参考スコア(独自算出の注目度): 0.5541644538483946
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The implementation of deep learning based computer aided diagnosis systems
for the classification of mammogram images can help in improving the accuracy,
reliability, and cost of diagnosing patients. However, training a deep learning
model requires a considerable amount of labeled images, which can be expensive
to obtain as time and effort from clinical practitioners is required. A number
of publicly available datasets have been built with data from different
hospitals and clinics. However, using models trained on these datasets for
later work on images sampled from a different hospital or clinic might result
in lower performance. This is due to the distribution mismatch of the datasets,
which include different patient populations and image acquisition protocols.
The scarcity of labeled data can also bring a challenge towards the application
of transfer learning with models trained using these source datasets. In this
work, a real world scenario is evaluated where a novel target dataset sampled
from a private Costa Rican clinic is used, with few labels and heavily
imbalanced data. The use of two popular and publicly available datasets
(INbreast and CBIS-DDSM) as source data, to train and test the models on the
novel target dataset, is evaluated. The use of the semi-supervised deep
learning approach known as MixMatch, to leverage the usage of unlabeled data
from the target dataset, is proposed and evaluated. In the tests, the
performance of models is extensively measured, using different metrics to
assess the performance of a classifier under heavy data imbalance conditions.
It is shown that the use of semi-supervised deep learning combined with
fine-tuning can provide a meaningful advantage when using scarce labeled
observations. We make available the novel dataset for the benefit of the
community.
- Abstract(参考訳): マンモグラム画像分類のための深層学習型コンピュータ支援診断システムの実装は、患者の診断の正確性、信頼性、コストを改善するのに役立つ。
しかし、深層学習モデルの訓練には大量のラベル付き画像が必要であり、臨床医の時間と労力を必要とするため、コストがかかる可能性がある。
多くの公開データセットが、さまざまな病院や診療所のデータで構築されている。
しかし、これらのデータセットでトレーニングされたモデルを使用して、異なる病院やクリニックから採取された画像の後での研究を行うことで、パフォーマンスが低下する可能性がある。
これは、異なる患者集団と画像取得プロトコルを含むデータセットの分布ミスマッチが原因である。
ラベル付きデータの不足は、これらのソースデータセットを使用してトレーニングされたモデルによる転送学習の応用にも課題をもたらす可能性がある。
本研究では,コスタリカンの民間診療所から採取した新たなターゲットデータセットを,ラベルが少なく,不均衡なデータを用いて実世界のシナリオで評価する。
2つの人気データセット(inbreastおよびcbis-ddsm)をソースデータとして使用して、新しいターゲットデータセットでモデルをトレーニングおよびテストし、評価する。
そこで,MixMatchと呼ばれる半教師付き深層学習手法を用いて,対象データセットからのラベルなしデータの利用法を提案し,評価した。
テストでは、重度データ不均衡条件下で分類器の性能を評価するために異なるメトリクスを使用して、モデルの性能を広範囲に測定する。
半教師付き深層学習と微調整を組み合わせることで,ラベル付き観測が不足している場合に有意義な利点が期待できる。
私たちはコミュニティの利益のために、新しいデータセットを利用可能にします。
関連論文リスト
- An analysis of data variation and bias in image-based dermatological datasets for machine learning classification [2.039829968340841]
臨床皮膚学では、分類モデルはRGB画像のみを入力として、患者の皮膚の悪性病変を検出することができる。
学習に基づくほとんどの手法では、トレーニングにおいて皮膚科のデータセットから取得したデータを用いており、これは金の基準によって大きく検証されている。
本研究の目的は,皮膚内視鏡検査と臨床検査のギャップを評価し,データセットの変動がトレーニングに与える影響を理解することである。
論文 参考訳(メタデータ) (2025-01-15T17:18:46Z) - Refining Tuberculosis Detection in CXR Imaging: Addressing Bias in Deep Neural Networks via Interpretability [1.9936075659851882]
実験データから完全な分類精度を得ることができたとしても,深層学習モデルの信頼性は限られていると論じる。
大規模プロキシタスクでディープニューラルネットワークを事前トレーニングし、MOON(Mixed objective Optimization Network)を使用することで、モデルとエキスパート間の決定基盤の整合性を改善することができることを示す。
論文 参考訳(メタデータ) (2024-07-19T06:41:31Z) - Exploring Data Redundancy in Real-world Image Classification through
Data Selection [20.389636181891515]
ディープラーニングモデルはトレーニングに大量のデータを必要とすることが多く、結果としてコストが増大する。
実世界の画像データの冗長性を調べるために,シナプスインテリジェンスと勾配ノルムに基づく2つのデータ評価指標を提案する。
オンラインおよびオフラインのデータ選択アルゴリズムは、検査されたデータ値に基づいてクラスタリングとグループ化によって提案される。
論文 参考訳(メタデータ) (2023-06-25T03:31:05Z) - MedFMC: A Real-world Dataset and Benchmark For Foundation Model
Adaptation in Medical Image Classification [41.16626194300303]
ファンデーションモデルは、多くの場合、大規模なデータで事前訓練されているが、様々なビジョンや言語アプリケーションのジャンプ開始において、最も成功している。
最近の進歩により、下流タスクにおける基礎モデルの適応は、少数のトレーニングサンプルだけで効率的に行えるようになった。
しかし, 医用画像解析におけるそのような学習パラダイムの適用は, 一般に公開されているデータやベンチマークが不足しているため, 依然として少ない。
論文 参考訳(メタデータ) (2023-06-16T01:46:07Z) - Vision-Language Modelling For Radiological Imaging and Reports In The
Low Data Regime [70.04389979779195]
本稿では,視覚および言語入力を共通空間に埋め込んだ医用視覚言語モデル(VLM)について検討する。
本稿では,新しい画像領域やテキスト領域への汎用事前学習モデルの適用など,低データ性能向上のためのいくつかの候補手法について検討する。
テキスト・ツー・イメージ検索をベンチマークとして,2つの胸部X線および放射線学的報告を用いた可変サイズのトレーニングデータセットを用いて,これらの手法の性能評価を行った。
論文 参考訳(メタデータ) (2023-03-30T18:20:00Z) - Unsupervised pre-training of graph transformers on patient population
graphs [48.02011627390706]
異種臨床データを扱うグラフ変換器を用いたネットワークを提案する。
自己教師型, 移動学習環境において, 事前学習方式の利点を示す。
論文 参考訳(メタデータ) (2022-07-21T16:59:09Z) - Self-Supervised Learning as a Means To Reduce the Need for Labeled Data
in Medical Image Analysis [64.4093648042484]
胸部X線画像のデータセットとバウンディングボックスラベルを用いて,13種類の異常の分類を行った。
ラベル付きデータの平均精度と精度を60%に抑えることで,完全教師付きモデルと同等の性能が得られることを示す。
論文 参考訳(メタデータ) (2022-06-01T09:20:30Z) - Deep learning-based COVID-19 pneumonia classification using chest CT
images: model generalizability [54.86482395312936]
深層学習(DL)分類モデルは、異なる国の3DCTデータセット上で、COVID-19陽性患者を特定するために訓練された。
我々は、データセットと72%の列車、8%の検証、20%のテストデータを組み合わせたDLベースの9つの同一分類モデルを訓練した。
複数のデータセットでトレーニングされ、トレーニングに使用されるデータセットの1つからテストセットで評価されたモデルは、よりよいパフォーマンスを示した。
論文 参考訳(メタデータ) (2021-02-18T21:14:52Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Self-Training with Improved Regularization for Sample-Efficient Chest
X-Ray Classification [80.00316465793702]
挑戦的なシナリオで堅牢なモデリングを可能にするディープラーニングフレームワークを提案する。
その結果,85%のラベル付きデータを用いて,大規模データ設定で学習した分類器の性能に適合する予測モデルを構築することができた。
論文 参考訳(メタデータ) (2020-05-03T02:36:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。