論文の概要: Improving Semi-supervised Deep Learning by using Automatic Thresholding
to Deal with Out of Distribution Data for COVID-19 Detection using Chest
X-ray Images
- arxiv url: http://arxiv.org/abs/2211.02142v1
- Date: Thu, 3 Nov 2022 20:56:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-07 17:21:57.304361
- Title: Improving Semi-supervised Deep Learning by using Automatic Thresholding
to Deal with Out of Distribution Data for COVID-19 Detection using Chest
X-ray Images
- Title(参考訳): 胸部X線画像を用いたCOVID-19検出のための分布データの自動取得による半教師付き深層学習の改善
- Authors: Isaac Benavides-Mata, Saul Calderon-Ramirez
- Abstract要約: ラベルなしデータセットにおける分布外データをフィルタリングする自動しきい値抽出法を提案する。
胸部X線画像を用いた新型コロナウイルス検出装置の訓練において,2つの簡単な自動しきい値設定法を検証した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Semi-supervised learning (SSL) leverages both labeled and unlabeled data for
training models when the labeled data is limited and the unlabeled data is
vast. Frequently, the unlabeled data is more widely available than the labeled
data, hence this data is used to improve the level of generalization of a model
when the labeled data is scarce. However, in real-world settings unlabeled data
might depict a different distribution than the labeled dataset distribution.
This is known as distribution mismatch. Such problem generally occurs when the
source of unlabeled data is different from the labeled data. For instance, in
the medical imaging domain, when training a COVID-19 detector using chest X-ray
images, different unlabeled datasets sampled from different hospitals might be
used. In this work, we propose an automatic thresholding method to filter
out-of-distribution data in the unlabeled dataset. We use the Mahalanobis
distance between the labeled and unlabeled datasets using the feature space
built by a pre-trained Image-net Feature Extractor (FE) to score each unlabeled
observation. We test two simple automatic thresholding methods in the context
of training a COVID-19 detector using chest X-ray images. The tested methods
provide an automatic manner to define what unlabeled data to preserve when
training a semi-supervised deep learning architecture.
- Abstract(参考訳): 半教師付き学習(SSL)では、ラベル付きデータが制限され、ラベルなしデータが広大な場合、ラベル付きデータとラベルなしデータの両方をトレーニングモデルに活用する。
ラベル付けされていないデータはラベル付きデータよりも広く利用でき、ラベル付きデータが不足している場合のモデルの一般化レベルを改善するためにこのデータを使用する。
しかし、実世界の無ラベルデータでは、ラベル付きデータセットの分布とは異なる分布が描かれる可能性がある。
これは分布ミスマッチとして知られている。
このような問題は一般にラベルのないデータソースがラベル付きデータと異なる場合に発生する。
例えば、医療画像領域では、胸部X線画像を用いて新型コロナウイルス検出装置を訓練する場合、異なる病院から採取された異なるラベルのないデータセットが使用される可能性がある。
本研究では,ラベルなしデータセットの分布外データをフィルタリングする自動しきい値設定手法を提案する。
ラベル付きデータセットとラベルなしデータセットの間のマハラノビス距離は、事前学習されたイメージネット特徴指数(FE)によって構築された特徴空間を用いて、ラベルなしの観測をスコアする。
胸部x線画像を用いたcovid-19検出器の訓練において,簡易な2つのしきい値法をテストした。
テスト方法は、半教師付きディープラーニングアーキテクチャをトレーニングする際に、ラベルのないデータを保存するための自動的な方法を提供する。
関連論文リスト
- Continuous Contrastive Learning for Long-Tailed Semi-Supervised Recognition [50.61991746981703]
現在の最先端のLTSSLアプローチは、大規模な未ラベルデータに対して高品質な擬似ラベルに依存している。
本稿では,長期学習における様々な提案を統一する新しい確率的枠組みを提案する。
我々は、信頼度とスムーズな擬似ラベルを用いて、我々のフレームワークをラベルなしデータに拡張する、連続的コントラスト学習手法であるCCLを導入する。
論文 参考訳(メタデータ) (2024-10-08T15:06:10Z) - You can't handle the (dirty) truth: Data-centric insights improve pseudo-labeling [60.27812493442062]
擬似ラベル法を改善するためにラベル付きデータ品質を調査することが重要であることを示す。
具体的には、擬似ラベルの拡張のために、DIPSと呼ばれる新しいデータキャラクタリゼーションと選択フレームワークを導入する。
本研究では,多種多様な実世界のデータセットを対象とした擬似ラベル手法に対するDIPSの適用性と影響を実証する。
論文 参考訳(メタデータ) (2024-06-19T17:58:40Z) - FlatMatch: Bridging Labeled Data and Unlabeled Data with Cross-Sharpness
for Semi-Supervised Learning [73.13448439554497]
Semi-Supervised Learning (SSL) は、ラベル付きデータが極めて少ない豊富なラベル付きデータを活用する効果的な方法である。
ほとんどのSSLメソッドは、通常、異なるデータ変換間のインスタンス単位の一貫性に基づいている。
本研究では,2つのデータセット間の一貫した学習性能を確保するために,クロスシャープネス尺度を最小化するFlatMatchを提案する。
論文 参考訳(メタデータ) (2023-10-25T06:57:59Z) - Bidirectional Copy-Paste for Semi-Supervised Medical Image Segmentation [15.815414883505722]
半教師付き医用画像セグメンテーションでは、ラベル付きデータとラベルなしデータの間に経験的ミスマッチ問題が存在する。
本稿では, ラベル付きとラベルなしのデータを双方向にコピー・ペーストする, 問題を緩和するための簡単な手法を提案する。
実験の結果,各種半教師付き医用画像セグメンテーションデータセットの他の最先端技術と比較すると,ACDCデータセットでは21%以上のDiceの改善が見られた(5%ラベル付きデータ)。
論文 参考訳(メタデータ) (2023-05-01T06:06:51Z) - CTRL: Clustering Training Losses for Label Error Detection [4.49681473359251]
教師付き機械学習では、正確なラベルの使用は高い精度を保証するために極めて重要である。
本稿では,ラベル誤り検出のための新しいフレームワークClustering TRaining Lossesを提案する。
モデルが異なる方法でクリーンでノイズの多いラベルを学習する観察に基づいて、ラベルエラーを2つのステップで検出する。
論文 参考訳(メタデータ) (2022-08-17T18:09:19Z) - Self-Supervised Learning as a Means To Reduce the Need for Labeled Data
in Medical Image Analysis [64.4093648042484]
胸部X線画像のデータセットとバウンディングボックスラベルを用いて,13種類の異常の分類を行った。
ラベル付きデータの平均精度と精度を60%に抑えることで,完全教師付きモデルと同等の性能が得られることを示す。
論文 参考訳(メタデータ) (2022-06-01T09:20:30Z) - OSSGAN: Open-Set Semi-Supervised Image Generation [26.67298827670573]
我々は、オープンセット半教師付き画像生成と呼ばれる条件付きGANの挑戦的なトレーニング手法を導入する。
OSSGANは、未ラベルの画像が関心のクラスのうちの1つまたは2つに属しているかどうかに基づいて、差別者に決定の手がかりを提供する。
Tiny ImageNetとImageNetの実験結果は、教師付きBigGANおよび半教師付きメソッドよりも顕著に改善されている。
論文 参考訳(メタデータ) (2022-04-29T17:26:09Z) - Incorporating Semi-Supervised and Positive-Unlabeled Learning for
Boosting Full Reference Image Quality Assessment [73.61888777504377]
フル参照(FR)画像品質評価(IQA)は、その知覚的差異をプリズム品質基準で測定することにより、歪み画像の視覚的品質を評価する。
ラベルなしデータは、画像劣化または復元プロセスから容易に収集することができ、ラベルなしのトレーニングデータを利用してFR-IQA性能を高めることを奨励する。
本稿では, 半教師付き, 正の未ラベル学習(PU)を用いて, ラベルなしデータを活用し, オフレーヤの悪影響を軽減することを提案する。
論文 参考訳(メタデータ) (2022-04-19T09:10:06Z) - GuidedMix-Net: Semi-supervised Semantic Segmentation by Using Labeled
Images as Reference [90.5402652758316]
半教師付きセマンティックセマンティックセグメンテーションのための新しい手法である GuidedMix-Net を提案する。
ラベル付き情報を使用して、ラベルなしのインスタンスの学習をガイドする。
競合セグメンテーションの精度を達成し、mIoUを以前のアプローチに比べて+7$%大きく改善する。
論文 参考訳(メタデータ) (2021-12-28T06:48:03Z) - Dealing with Distribution Mismatch in Semi-supervised Deep Learning for
Covid-19 Detection Using Chest X-ray Images: A Novel Approach Using Feature
Densities [0.6882042556551609]
半教師付きディープラーニングは、大きなラベル付きデータセットの魅力的な代替手段である。
実世界の使用状況設定では、ラベル付きデータセットとは異なる分布を示す可能性がある。
これにより、ラベル付きデータセットとラベル付きデータセットの分散ミスマッチが発生します。
論文 参考訳(メタデータ) (2021-08-17T00:35:43Z) - Identifying Mislabeled Images in Supervised Learning Utilizing
Autoencoder [0.0]
画像分類において、不正確なラベルは、分類モデルも不正確なものとなる可能性がある。
本稿では,分類ネットワークをトレーニングする前に,教師なしの手法をトレーニングデータに適用する。
このアルゴリズムは実験データセットの67%以上の不正ラベル付きデータを検出および削除することができる。
論文 参考訳(メタデータ) (2020-11-07T03:09:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。