論文の概要: Sample Efficient Learning of Image-Based Diagnostic Classifiers Using
Probabilistic Labels
- arxiv url: http://arxiv.org/abs/2102.06164v1
- Date: Thu, 11 Feb 2021 18:13:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-13 02:14:43.573423
- Title: Sample Efficient Learning of Image-Based Diagnostic Classifiers Using
Probabilistic Labels
- Title(参考訳): 確率ラベルを用いた画像ベース診断分類器のサンプル学習
- Authors: Roberto Vega, Pouneh Gorji, Zichen Zhang, Xuebin Qin, Abhilash
Rakkunedeth Hareendranathan, Jeevesh Kapur, Jacob L. Jaremko, Russell Greiner
- Abstract要約: 確率ラベルの学習と利用により、比較的小さなデータセットから正確で校正されたディープネットワークをトレーニングする方法を提案する。
従来の手法と比較して,これらのラベルでトレーニングしたモデルの精度は最大22%向上した。
- 参考スコア(独自算出の注目度): 11.377362220429786
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep learning approaches often require huge datasets to achieve good
generalization. This complicates its use in tasks like image-based medical
diagnosis, where the small training datasets are usually insufficient to learn
appropriate data representations. For such sensitive tasks it is also important
to provide the confidence in the predictions. Here, we propose a way to learn
and use probabilistic labels to train accurate and calibrated deep networks
from relatively small datasets. We observe gains of up to 22% in the accuracy
of models trained with these labels, as compared with traditional approaches,
in three classification tasks: diagnosis of hip dysplasia, fatty liver, and
glaucoma. The outputs of models trained with probabilistic labels are
calibrated, allowing the interpretation of its predictions as proper
probabilities. We anticipate this approach will apply to other tasks where few
training instances are available and expert knowledge can be encoded as
probabilities.
- Abstract(参考訳): ディープラーニングのアプローチは、しばしば優れた一般化を達成するために巨大なデータセットを必要とする。
これは、画像ベースの医療診断などのタスクでの使用を複雑にします。小さなトレーニングデータセットは通常、適切なデータ表現を学ぶには不十分です。
このような敏感なタスクでは、予測に自信を提供することも重要です。
本稿では,確率ラベルの学習と利用により,比較的小さなデータセットから高精度で校正されたディープネットワークを学習する手法を提案する。
従来のアプローチと比較すると, ヒップ異形成, 脂肪肝, 緑内障の3つの分類課題において, これらのラベルで訓練したモデルの精度は最大22%向上した。
確率ラベルで訓練されたモデルの出力は校正され、その予測を適切な確率として解釈することができる。
このアプローチは、トレーニングインスタンスが少なく、専門家の知識を確率としてエンコードできる他のタスクにも適用できると予想しています。
関連論文リスト
- Refining Tuberculosis Detection in CXR Imaging: Addressing Bias in Deep Neural Networks via Interpretability [1.9936075659851882]
実験データから完全な分類精度を得ることができたとしても,深層学習モデルの信頼性は限られていると論じる。
大規模プロキシタスクでディープニューラルネットワークを事前トレーニングし、MOON(Mixed objective Optimization Network)を使用することで、モデルとエキスパート間の決定基盤の整合性を改善することができることを示す。
論文 参考訳(メタデータ) (2024-07-19T06:41:31Z) - A Saliency-based Clustering Framework for Identifying Aberrant
Predictions [49.1574468325115]
本稿では, 異常予測の概念を導入し, 分類誤差の性質が頻度と同じくらい重要であることを強調した。
本稿では,誤分類率の低減と異常予測の識別を両立する,新しい,効率的なトレーニング手法を提案する。
本手法を獣医学の分野である獣医学の分野に応用し, 被曝率は高いが, 人体医学に比べて広く研究されていない。
論文 参考訳(メタデータ) (2023-11-11T01:53:59Z) - Contrastive Deep Encoding Enables Uncertainty-aware
Machine-learning-assisted Histopathology [6.548275341067594]
テラバイトのトレーニングデータを意識的に深層ネットワークにプリトレーニングして情報表現を符号化することができる。
提案手法は,ランダムに選択されたアノテーションが1~10%しかないパッチレベルの分類において,最先端のSOTA(State-of-the-art)に到達可能であることを示す。
論文 参考訳(メタデータ) (2023-09-13T17:37:19Z) - Self-Supervised Learning as a Means To Reduce the Need for Labeled Data
in Medical Image Analysis [64.4093648042484]
胸部X線画像のデータセットとバウンディングボックスラベルを用いて,13種類の異常の分類を行った。
ラベル付きデータの平均精度と精度を60%に抑えることで,完全教師付きモデルと同等の性能が得られることを示す。
論文 参考訳(メタデータ) (2022-06-01T09:20:30Z) - Semi-supervised Deep Learning for Image Classification with Distribution
Mismatch: A Survey [1.5469452301122175]
ディープラーニングモデルは、予測モデルをトレーニングするためにラベル付き観測の豊富な部分に依存します。
ラベル付きデータ観測を収集することは高価であり、ディープラーニングモデルの使用は理想的ではない。
多くの状況では、異なる非競合データソースが利用可能である。
これにより、ラベル付きデータセットと非ラベル付きデータセットの間にかなりの分散ミスマッチが発生するリスクが生じる。
論文 参考訳(メタデータ) (2022-03-01T02:46:00Z) - Masked prediction tasks: a parameter identifiability view [49.533046139235466]
マスク付きトークンの予測に広く用いられている自己教師型学習手法に着目する。
いくつかの予測タスクは識別可能性をもたらすが、他のタスクはそうではない。
論文 参考訳(メタデータ) (2022-02-18T17:09:32Z) - Debiased Pseudo Labeling in Self-Training [77.83549261035277]
ディープニューラルネットワークは、大規模ラベル付きデータセットの助けを借りて、幅広いタスクで顕著なパフォーマンスを達成する。
ラベル付きデータの要求を軽減するため、ラベル付けされていないデータに擬似ラベルを付けることにより、学術と産業の両方で自己学習が広く使われている。
疑似ラベルの生成と利用を2つの独立した頭文字で分離するデバイアスドを提案する。
論文 参考訳(メタデータ) (2022-02-15T02:14:33Z) - A Real Use Case of Semi-Supervised Learning for Mammogram Classification
in a Local Clinic of Costa Rica [0.5541644538483946]
ディープラーニングモデルのトレーニングには、かなりの量のラベル付きイメージが必要です。
多くの公開データセットが、さまざまな病院や診療所のデータで構築されている。
ラベルなしデータを利用した半教師付き深層学習手法であるMixMatchを提案し評価した。
論文 参考訳(メタデータ) (2021-07-24T22:26:50Z) - Scalable Marginal Likelihood Estimation for Model Selection in Deep
Learning [78.83598532168256]
階層型モデル選択は、推定困難のため、ディープラーニングではほとんど使われない。
本研究は,検証データが利用できない場合,限界的可能性によって一般化が向上し,有用であることを示す。
論文 参考訳(メタデータ) (2021-04-11T09:50:24Z) - Self-Training with Improved Regularization for Sample-Efficient Chest
X-Ray Classification [80.00316465793702]
挑戦的なシナリオで堅牢なモデリングを可能にするディープラーニングフレームワークを提案する。
その結果,85%のラベル付きデータを用いて,大規模データ設定で学習した分類器の性能に適合する予測モデルを構築することができた。
論文 参考訳(メタデータ) (2020-05-03T02:36:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。