論文の概要: OpenPath: Open-Set Active Learning for Pathology Image Classification via Pre-trained Vision-Language Models
- arxiv url: http://arxiv.org/abs/2506.15318v1
- Date: Wed, 18 Jun 2025 09:47:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-19 19:35:51.626789
- Title: OpenPath: Open-Set Active Learning for Pathology Image Classification via Pre-trained Vision-Language Models
- Title(参考訳): OpenPath: 事前学習型視覚言語モデルによる病理画像分類のためのオープンセットアクティブラーニング
- Authors: Lanfeng Zhong, Xin Liao, Shichuan Zhang, Shaoting Zhang, Guotai Wang,
- Abstract要約: 病理画像分類のためのオープンセット能動的学習手法OpenPathを提案する。
OpenPathは、選択されたサンプルの純度が高いため、モデルの性能を大幅に向上させる。
- 参考スコア(独自算出の注目度): 22.494367900953645
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pathology image classification plays a crucial role in accurate medical diagnosis and treatment planning. Training high-performance models for this task typically requires large-scale annotated datasets, which are both expensive and time-consuming to acquire. Active Learning (AL) offers a solution by iteratively selecting the most informative samples for annotation, thereby reducing the labeling effort. However, most AL methods are designed under the assumption of a closed-set scenario, where all the unannotated images belong to target classes. In real-world clinical environments, the unlabeled pool often contains a substantial amount of Out-Of-Distribution (OOD) data, leading to low efficiency of annotation in traditional AL methods. Furthermore, most existing AL methods start with random selection in the first query round, leading to a significant waste of labeling costs in open-set scenarios. To address these challenges, we propose OpenPath, a novel open-set active learning approach for pathological image classification leveraging a pre-trained Vision-Language Model (VLM). In the first query, we propose task-specific prompts that combine target and relevant non-target class prompts to effectively select In-Distribution (ID) and informative samples from the unlabeled pool. In subsequent queries, Diverse Informative ID Sampling (DIS) that includes Prototype-based ID candidate Selection (PIS) and Entropy-Guided Stochastic Sampling (EGSS) is proposed to ensure both purity and informativeness in a query, avoiding the selection of OOD samples. Experiments on two public pathology image datasets show that OpenPath significantly enhances the model's performance due to its high purity of selected samples, and outperforms several state-of-the-art open-set AL methods. The code is available at \href{https://github.com/HiLab-git/OpenPath}{https://github.com/HiLab-git/OpenPath}..
- Abstract(参考訳): 病理画像分類は、正確な診断と治療計画において重要な役割を担っている。
このタスクのためにハイパフォーマンスモデルをトレーニングするには、一般的に大規模なアノテートデータセットが必要です。
アクティブラーニング(AL)は、アノテーションの最も情報性の高いサンプルを反復的に選択することで、ラベリングの労力を減らすソリューションを提供する。
しかし、ほとんどのALメソッドは、すべての未注釈画像が対象クラスに属するクローズドセットのシナリオを前提に設計されている。
実世界の臨床環境では、ラベルのないプールは、しばしばかなりの量のOf-Distribution(OOD)データを含んでおり、従来のAL手法ではアノテーションの効率が低くなる。
さらに、既存のALメソッドのほとんどは、最初のクエリラウンドでランダムに選択することから始まり、オープンセットシナリオにおけるラベルのコストを大幅に無駄にする。
これらの課題に対処するため、我々は、VLM(Vision-Language Model)を利用した、病理画像分類のための新しいオープンセット能動的学習手法OpenPathを提案する。
第1のクエリでは、ターゲットと関連する非ターゲットクラスプロンプトを組み合わせたタスク固有のプロンプトを提案し、非ラベル付きプールからIn-Distribution(ID)とインフォメーションサンプルを効果的に選択する。
その後のクエリでは、プロトタイプベースのID候補選択(PIS)とエントロピー誘導確率サンプリング(EGSS)を含むDIS(Diverse Informative ID Smpling)が提案され、OODサンプルの選択を回避し、クエリの純度と情報性の両方を保証する。
2つの公開病理画像データセットの実験により、OpenPathは、選択されたサンプルの純度が高いため、モデルの性能を大幅に向上し、最先端のオープンセットALメソッドよりも優れていることが示された。
コードは \href{https://github.com/HiLab-git/OpenPath}{https://github.com/HiLab-git/OpenPath} で公開されている。
と。
関連論文リスト
- Class Balance Matters to Active Class-Incremental Learning [61.11786214164405]
まず、大規模な未ラベルデータのプールから始めて、インクリメンタルな学習のための最も情報に富んだサンプルを注釈付けします。
そこで我々は,クラスバランスと情報提供性を両立させるため,クラスバランス選択(CBS)戦略を提案する。
我々のCBSは、プリトレーニング済みモデルとプロンプトチューニング技術に基づいて、これらのCILメソッドに接続し、再生することができる。
論文 参考訳(メタデータ) (2024-12-09T16:37:27Z) - MyriadAL: Active Few Shot Learning for Histopathology [10.652626309100889]
我々は、Myriad Active Learning (MAL)という、アクティブな数個のショットラーニングフレームワークを導入する。
MALには、コントラスト学習エンコーダ、擬似ラベル生成、ループ内の新しいクエリサンプル選択が含まれている。
2つの公的な病理組織学データセットの実験により、MALは以前の研究に比べてテスト精度、マクロF1スコア、ラベル効率が優れていることが示された。
論文 参考訳(メタデータ) (2023-10-24T20:08:15Z) - OpenAL: An Efficient Deep Active Learning Framework for Open-Set
Pathology Image Classification [6.374541716921289]
対象クラスと非対象クラスの両方でラベル付けされていないプールからサンプルをクエリする際の課題に対処する,効率的なフレームワークであるOpenALを提案する。
病理画像のきめ細かい分類実験により、OpenALはターゲットクラスサンプルのクエリ品質を大幅に改善できることが示された。
論文 参考訳(メタデータ) (2023-07-11T13:36:07Z) - Deep Active Learning with Contrastive Learning Under Realistic Data Pool
Assumptions [2.578242050187029]
アクティブラーニングは、モデルが望まれる精度を迅速に到達できるようにする、ラベルのないデータプールから最も情報性の高いデータを特定することを目的としている。
既存のアクティブラーニング手法の多くは、未ラベルのデータプールに対象タスクに関連するサンプルのみが存在する理想的な環境で評価されている。
我々は,不明瞭でタスク非関連なアウト・オブ・ディストリビューションと,イン・ディストリビューション・サンプルを含む,新しいアクティブ・ラーニング・ベンチマークを導入する。
論文 参考訳(メタデータ) (2023-03-25T10:46:10Z) - Prompt-driven efficient Open-set Semi-supervised Learning [52.30303262499391]
オープンセット半教師付き学習(OSSL)は関心を集めており、未ラベルデータにのみOOD(Out-of-distribution)サンプルが組み込まれているというより実践的なシナリオを調査している。
我々はOpenPromptと呼ばれる,プロンプト駆動の効率的なOSSLフレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-28T16:25:08Z) - Pareto Optimization for Active Learning under Out-of-Distribution Data
Scenarios [79.02009938011447]
本研究では,未ラベルデータプールからバッチサイズを固定した未ラベルサンプルの最適なサブセットを選択するサンプリング手法を提案する。
実験の結果,従来の機械学習(ML)タスクとディープラーニング(DL)タスクの両方において,その効果が示された。
論文 参考訳(メタデータ) (2022-07-04T04:11:44Z) - A Lagrangian Duality Approach to Active Learning [119.36233726867992]
トレーニングデータのサブセットのみをラベル付けするバッチアクティブな学習問題を考察する。
制約付き最適化を用いて学習問題を定式化し、各制約はラベル付きサンプルにモデルの性能を拘束する。
数値実験により,提案手法は最先端の能動学習法と同等かそれ以上に機能することを示した。
論文 参考訳(メタデータ) (2022-02-08T19:18:49Z) - Pseudo-Labeled Auto-Curriculum Learning for Semi-Supervised Keypoint
Localization [88.74813798138466]
オブジェクトのキーポイントのローカライズは、基本的な視覚的問題である。
キーポイントローカライゼーションネットワークの教師付き学習は、しばしば大量のデータを必要とする。
本稿では,一連の動的しきい値を持つ信頼度の高い擬似ラベルサンプルを自動的に選択する。
論文 参考訳(メタデータ) (2022-01-21T09:51:58Z) - Towards General and Efficient Active Learning [20.888364610175987]
アクティブラーニングは、限られたアノテーション予算を利用するために最も有益なサンプルを選択することを目的としている。
本稿では,新しい汎用能動学習法(GEAL)を提案する。
提案手法は,同一モデルの単一パス推定を用いて,異なるデータセット上でデータ選択処理を行うことができる。
論文 参考訳(メタデータ) (2021-12-15T08:35:28Z) - Trash to Treasure: Harvesting OOD Data with Cross-Modal Matching for
Open-Set Semi-Supervised Learning [101.28281124670647]
オープンセット半教師付き学習(Open-set SSL)では、ラベルなしデータにOOD(Out-of-distribution)サンプルを含む、難しいが実用的なシナリオを調査する。
我々は、OODデータの存在を効果的に活用し、特徴学習を増強する新しいトレーニングメカニズムを提案する。
我々のアプローチは、オープンセットSSLのパフォーマンスを大幅に向上させ、最先端技術よりも大きなマージンで性能を向上します。
論文 参考訳(メタデータ) (2021-08-12T09:14:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。