論文の概要: Exploiting Diversity of Unlabeled Data for Label-Efficient
Semi-Supervised Active Learning
- arxiv url: http://arxiv.org/abs/2207.12302v1
- Date: Mon, 25 Jul 2022 16:11:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-26 14:59:04.958982
- Title: Exploiting Diversity of Unlabeled Data for Label-Efficient
Semi-Supervised Active Learning
- Title(参考訳): ラベル効率半教師付きアクティブラーニングにおけるラベルなしデータの多様性の活用
- Authors: Felix Buchert, Nassir Navab, Seong Tae Kim
- Abstract要約: アクティブラーニング(英: Active Learning)は、ラベリングのための最も重要なサンプルを選択することで、高価なラベリングの問題に対処する研究分野である。
アクティブな学習環境における初期ラベル付けのための最も情報性の高いサンプル群を選択するために,多様性に基づく新しい初期データセット選択アルゴリズムを提案する。
また、一貫性に基づく埋め込みの多様性に基づくサンプリングを用いた、新しいアクティブな学習クエリ戦略を提案する。
- 参考スコア(独自算出の注目度): 57.436224561482966
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The availability of large labeled datasets is the key component for the
success of deep learning. However, annotating labels on large datasets is
generally time-consuming and expensive. Active learning is a research area that
addresses the issues of expensive labeling by selecting the most important
samples for labeling. Diversity-based sampling algorithms are known as integral
components of representation-based approaches for active learning. In this
paper, we introduce a new diversity-based initial dataset selection algorithm
to select the most informative set of samples for initial labeling in the
active learning setting. Self-supervised representation learning is used to
consider the diversity of samples in the initial dataset selection algorithm.
Also, we propose a novel active learning query strategy, which uses
diversity-based sampling on consistency-based embeddings. By considering the
consistency information with the diversity in the consistency-based embedding
scheme, the proposed method could select more informative samples for labeling
in the semi-supervised learning setting. Comparative experiments show that the
proposed method achieves compelling results on CIFAR-10 and Caltech-101
datasets compared with previous active learning approaches by utilizing the
diversity of unlabeled data.
- Abstract(参考訳): 大規模ラベル付きデータセットの可用性は、ディープラーニングの成功の鍵となるコンポーネントである。
しかし、大規模なデータセットにラベルをアノテートするのは一般的に時間と費用がかかる。
アクティブラーニング(active learning)は、最も重要なラベリングサンプルを選択することで、高価なラベリングの問題に対処する研究領域である。
多様性に基づくサンプリングアルゴリズムは、アクティブラーニングのための表現ベースアプローチの不可欠なコンポーネントとして知られています。
本稿では,新しい多様性に基づく初期データセット選択アルゴリズムを導入し,アクティブな学習環境における初期ラベル付けのための最も情報に富んだサンプルを選定する。
自己教師付き表現学習は、初期データセット選択アルゴリズムにおけるサンプルの多様性を検討するために用いられる。
また,一貫性に基づく組込みに多様性に基づくサンプリングを用いる,新しいアクティブラーニングクエリ戦略を提案する。
整合性に基づく埋め込み方式の多様性と整合性を考慮し、半教師付き学習環境におけるラベル付けのためのより情報的なサンプルを選択することができる。
比較実験により,従来のアクティブラーニング手法に比べてcifar-101データセットとcaltech-101データセットで有意な結果を得た。
関連論文リスト
- BAL: Balancing Diversity and Novelty for Active Learning [53.289700543331925]
多様な不確実なデータのバランスをとるために適応的なサブプールを構築する新しいフレームワークであるBalancing Active Learning (BAL)を導入する。
我々のアプローチは、広く認識されているベンチマークにおいて、確立されたすべてのアクティブな学習方法より1.20%優れています。
論文 参考訳(メタデータ) (2023-12-26T08:14:46Z) - Deep Active Learning with Contrastive Learning Under Realistic Data Pool
Assumptions [2.578242050187029]
アクティブラーニングは、モデルが望まれる精度を迅速に到達できるようにする、ラベルのないデータプールから最も情報性の高いデータを特定することを目的としている。
既存のアクティブラーニング手法の多くは、未ラベルのデータプールに対象タスクに関連するサンプルのみが存在する理想的な環境で評価されている。
我々は,不明瞭でタスク非関連なアウト・オブ・ディストリビューションと,イン・ディストリビューション・サンプルを含む,新しいアクティブ・ラーニング・ベンチマークを導入する。
論文 参考訳(メタデータ) (2023-03-25T10:46:10Z) - Pseudo-Labeled Auto-Curriculum Learning for Semi-Supervised Keypoint
Localization [88.74813798138466]
オブジェクトのキーポイントのローカライズは、基本的な視覚的問題である。
キーポイントローカライゼーションネットワークの教師付き学習は、しばしば大量のデータを必要とする。
本稿では,一連の動的しきい値を持つ信頼度の高い擬似ラベルサンプルを自動的に選択する。
論文 参考訳(メタデータ) (2022-01-21T09:51:58Z) - Towards General and Efficient Active Learning [20.888364610175987]
アクティブラーニングは、限られたアノテーション予算を利用するために最も有益なサンプルを選択することを目的としている。
本稿では,新しい汎用能動学習法(GEAL)を提案する。
提案手法は,同一モデルの単一パス推定を用いて,異なるデータセット上でデータ選択処理を行うことができる。
論文 参考訳(メタデータ) (2021-12-15T08:35:28Z) - Multiple-criteria Based Active Learning with Fixed-size Determinantal
Point Processes [43.71112693633952]
本稿では,情報性,代表性,多様性の3つの相補的基準を取り入れた,複数基準に基づく能動学習アルゴリズムを提案する。
提案手法は,他の複数基準のALアルゴリズムよりも性能が優れ,安定であることを示す。
論文 参考訳(メタデータ) (2021-07-04T13:22:54Z) - Data Shapley Valuation for Efficient Batch Active Learning [21.76249748709411]
Active Data Shapley(ADS)は、バッチアクティブラーニングのためのフィルタリングレイヤーです。
ADSは、ラベルのないデータのプールが現実世界の異常を示す場合に特に効果的であることを示す。
論文 参考訳(メタデータ) (2021-04-16T18:53:42Z) - Minimax Active Learning [61.729667575374606]
アクティブラーニングは、人間のアノテーションによってラベル付けされる最も代表的なサンプルをクエリすることによって、ラベル効率の高いアルゴリズムを開発することを目指している。
現在のアクティブラーニング技術は、最も不確実なサンプルを選択するためにモデルの不確実性に頼るか、クラスタリングを使うか、最も多様なラベルのないサンプルを選択するために再構築する。
我々は,不確実性と多様性を両立させる半教師付きミニマックスエントロピーに基づく能動学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-12-18T19:03:40Z) - Deep Active Learning for Sequence Labeling Based on Diversity and
Uncertainty in Gradient [5.33024001730262]
シーケンスラベリングタスクにおいて、不確実性と多様性の両方を組み込んだ場合、アクティブラーニングを用いてラベル付きトレーニングデータの量を削減することができることを示す。
我々は,複数のタスク,データセット,モデル,そして古典的不確実性に基づくサンプリングと多様性に基づくサンプリングを一貫して上回る勾配埋め込みアプローチにおいて,重み付けされた多様性を選択することで,シーケンスベースアプローチの効果を検討した。
論文 参考訳(メタデータ) (2020-11-27T06:03:27Z) - Adversarial Knowledge Transfer from Unlabeled Data [62.97253639100014]
本稿では,インターネット規模の未ラベルデータから知識を伝達し,分類器の性能を向上させるための新しいAdversarial Knowledge Transferフレームワークを提案する。
我々の手法の重要な新しい側面は、ラベル付けされていないソースデータは、ラベル付けされたターゲットデータと異なるクラスであることができ、個別のプリテキストタスクを定義する必要がないことである。
論文 参考訳(メタデータ) (2020-08-13T08:04:27Z) - Similarity Search for Efficient Active Learning and Search of Rare
Concepts [78.5475382904847]
我々は,現在ラベル付けされている集合の近傍にラベル付けする候補プールを制限することにより,能動的学習と探索法の計算効率を向上する。
提案手法は,従来のグローバルアプローチと同じような平均精度とリコールを実現し,選択の計算コストを最大3桁まで削減し,Webスケールのアクティブラーニングを可能にした。
論文 参考訳(メタデータ) (2020-06-30T19:46:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。