論文の概要: MyriadAL: Active Few Shot Learning for Histopathology
- arxiv url: http://arxiv.org/abs/2310.16161v1
- Date: Tue, 24 Oct 2023 20:08:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-26 18:07:00.076187
- Title: MyriadAL: Active Few Shot Learning for Histopathology
- Title(参考訳): MyriadAL: 病理学のためのアクティブショットラーニング
- Authors: Nico Schiavone, Jingyi Wang, Shuangzhi Li, Roger Zemp, and Xingyu Li
- Abstract要約: 我々は、Myriad Active Learning (MAL)という、アクティブな数個のショットラーニングフレームワークを導入する。
MALには、コントラスト学習エンコーダ、擬似ラベル生成、ループ内の新しいクエリサンプル選択が含まれている。
2つの公的な病理組織学データセットの実験により、MALは以前の研究に比べてテスト精度、マクロF1スコア、ラベル効率が優れていることが示された。
- 参考スコア(独自算出の注目度): 10.652626309100889
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Active Learning (AL) and Few Shot Learning (FSL) are two label-efficient
methods which have achieved excellent results recently. However, most prior
arts in both learning paradigms fail to explore the wealth of the vast
unlabelled data. In this study, we address this issue in the scenario where the
annotation budget is very limited, yet a large amount of unlabelled data for
the target task is available. We frame this work in the context of
histopathology where labelling is prohibitively expensive. To this end, we
introduce an active few shot learning framework, Myriad Active Learning (MAL),
including a contrastive-learning encoder, pseudo-label generation, and novel
query sample selection in the loop. Specifically, we propose to massage
unlabelled data in a self-supervised manner, where the obtained data
representations and clustering knowledge form the basis to activate the AL
loop. With feedback from the oracle in each AL cycle, the pseudo-labels of the
unlabelled data are refined by optimizing a shallow task-specific net on top of
the encoder. These updated pseudo-labels serve to inform and improve the active
learning query selection process. Furthermore, we introduce a novel recipe to
combine existing uncertainty measures and utilize the entire uncertainty list
to reduce sample redundancy in AL. Extensive experiments on two public
histopathology datasets show that MAL has superior test accuracy, macro
F1-score, and label efficiency compared to prior works, and can achieve a
comparable test accuracy to a fully supervised algorithm while labelling only
5% of the dataset.
- Abstract(参考訳): アクティブラーニング(AL)とFew Shot Learning(FSL)は,近年,優れた成果を上げているラベル効率のよい2つの手法である。
しかし、両方の学習パラダイムにおけるほとんどの先行技術は、膨大な未学習データの富を探索することができない。
本研究では,アノテーションの予算が非常に限られているが,目的とするタスクにラベルなしのデータが大量に含まれている場合に,この問題に対処する。
この研究は、ラベリングが禁止的に高価である病理組織学の文脈で行われます。
そこで,本研究では,ループ内のコントラスト学習エンコーダ,擬似ラベル生成,新規クエリサンプル選択などを含む,能動的少数ショット学習フレームワークであるmyriad active learning (mal)を提案する。
具体的には、得られたデータ表現とクラスタリング知識が基礎を形成してalループを活性化する自己教師あり方式で、ラベルなしデータをマッサージする。
各ALサイクルのオラクルからのフィードバックにより、エンコーダの上の浅いタスク固有ネットを最適化することにより、未ラベルデータの擬似ラベルを洗練する。
これらの更新された擬似ラベルは、アクティブな学習クエリ選択プロセスの通知と改善に役立つ。
さらに,既存の不確実性対策を組み合わせて,不確実性リスト全体を活用し,alのサンプル冗長性を低減するための新しいレシピを提案する。
2つの公開病理組織学データセットに関する広範な実験により、malは以前の研究よりも優れたテスト精度、マクロf1-スコア、ラベル効率を示し、データセットのわずか5%をラベル付けしながら、完全な教師付きアルゴリズムと同等のテスト精度を達成できることが示された。
関連論文リスト
- Deep Active Learning with Manifold-preserving Trajectory Sampling [2.0717982775472206]
アクティブラーニング(AL)は、アノテーション(ラベル付け)のためのラベルなしデータの選択を最適化するための方法である
既存のディープALメソッドは、間違いなく、ラベル付きデータによって引き起こされるバイアスに悩まされ、ALコンテキストにおけるラベルなしデータよりもはるかに低い割合で処理される。
我々は,より正確な多様体を表現するためにラベル付きデータから学習した特徴空間を強制することを目的とした,manifold-Preserving Trajectory Smpling (MPTS) という新しい手法を提案する。
論文 参考訳(メタデータ) (2024-10-21T03:04:09Z) - XAL: EXplainable Active Learning Makes Classifiers Better Low-resource Learners [71.8257151788923]
低リソーステキスト分類のための新しい説明可能なアクティブラーニングフレームワーク(XAL)を提案する。
XALは分類器に対して、推論を正当化し、合理的な説明ができないラベルのないデータを掘り下げることを推奨している。
6つのデータセットの実験では、XALは9つの強いベースラインに対して一貫した改善を達成している。
論文 参考訳(メタデータ) (2023-10-09T08:07:04Z) - Deep Active Learning with Contrastive Learning Under Realistic Data Pool
Assumptions [2.578242050187029]
アクティブラーニングは、モデルが望まれる精度を迅速に到達できるようにする、ラベルのないデータプールから最も情報性の高いデータを特定することを目的としている。
既存のアクティブラーニング手法の多くは、未ラベルのデータプールに対象タスクに関連するサンプルのみが存在する理想的な環境で評価されている。
我々は,不明瞭でタスク非関連なアウト・オブ・ディストリビューションと,イン・ディストリビューション・サンプルを含む,新しいアクティブ・ラーニング・ベンチマークを導入する。
論文 参考訳(メタデータ) (2023-03-25T10:46:10Z) - Is margin all you need? An extensive empirical study of active learning
on tabular data [66.18464006872345]
我々は,OpenML-CC18ベンチマークを用いて,69の実世界のデータセット上での各種能動学習アルゴリズムの性能を解析した。
意外なことに、古典的なマージンサンプリング技術は、現在の最先端技術を含む、他のすべてのものよりも優れている。
論文 参考訳(メタデータ) (2022-10-07T21:18:24Z) - Pareto Optimization for Active Learning under Out-of-Distribution Data
Scenarios [79.02009938011447]
本研究では,未ラベルデータプールからバッチサイズを固定した未ラベルサンプルの最適なサブセットを選択するサンプリング手法を提案する。
実験の結果,従来の機械学習(ML)タスクとディープラーニング(DL)タスクの両方において,その効果が示された。
論文 参考訳(メタデータ) (2022-07-04T04:11:44Z) - Active Learning by Feature Mixing [52.16150629234465]
本稿では,ALFA-Mixと呼ばれるバッチ能動学習手法を提案する。
予測の不整合を求めることにより,不整合な特徴を持つインスタンスを同定する。
これらの予測の不整合は、モデルが未認識のインスタンスで認識できない特徴を発見するのに役立ちます。
論文 参考訳(メタデータ) (2022-03-14T12:20:54Z) - A Lagrangian Duality Approach to Active Learning [119.36233726867992]
トレーニングデータのサブセットのみをラベル付けするバッチアクティブな学習問題を考察する。
制約付き最適化を用いて学習問題を定式化し、各制約はラベル付きサンプルにモデルの性能を拘束する。
数値実験により,提案手法は最先端の能動学習法と同等かそれ以上に機能することを示した。
論文 参考訳(メタデータ) (2022-02-08T19:18:49Z) - ATM: An Uncertainty-aware Active Self-training Framework for
Label-efficient Text Classification [13.881283744970979]
ATMは、ラベルのないデータを活用するために自己学習を利用する新しいフレームワークであり、特定のALアルゴリズムに依存しない。
我々はATMが最強のアクティブラーニングと自己学習ベースラインを上回り、ラベル効率を平均51.9%向上させることを実証した。
論文 参考訳(メタデータ) (2021-12-16T11:09:48Z) - Dash: Semi-Supervised Learning with Dynamic Thresholding [72.74339790209531]
我々は、ラベルのない例を使ってモデルをトレーニングする半教師付き学習(SSL)アプローチを提案する。
提案手法であるDashは、ラベルなしデータ選択の観点から適応性を享受する。
論文 参考訳(メタデータ) (2021-09-01T23:52:29Z) - Deep Active Learning via Open Set Recognition [0.0]
多くのアプリケーションでは、データは簡単に取得できるが、顕著な例を示すのに高価で時間がかかる。
オープンセット認識問題として能動的学習を定式化する。
現在のアクティブな学習方法とは異なり、我々のアルゴリズムはタスクラベルを必要とせずにタスクを学習することができる。
論文 参考訳(メタデータ) (2020-07-04T22:09:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。