論文の概要: Active Learning for Open-set Annotation
- arxiv url: http://arxiv.org/abs/2201.06758v1
- Date: Tue, 18 Jan 2022 06:11:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-19 17:13:56.234432
- Title: Active Learning for Open-set Annotation
- Title(参考訳): オープンセットアノテーションのためのアクティブラーニング
- Authors: Kun-Peng Ning, Xun Zhao, Yu Li, Sheng-Jun Huang
- Abstract要約: 我々はLfOSAと呼ばれる新しいアクティブラーニングフレームワークを提案する。このフレームワークは、効果的なサンプリング戦略を用いて分類性能を高め、アノテーションのための既知のクラスからサンプルを正確に検出する。
実験結果から,提案手法は既知のクラスの選択精度を著しく向上し,アノテーションコストの低い分類精度を最先端の能動学習法よりも向上させることができることがわかった。
- 参考スコア(独自算出の注目度): 38.739845944840454
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing active learning studies typically work in the closed-set setting by
assuming that all data examples to be labeled are drawn from known classes.
However, in real annotation tasks, the unlabeled data usually contains a large
amount of examples from unknown classes, resulting in the failure of most
active learning methods. To tackle this open-set annotation (OSA) problem, we
propose a new active learning framework called LfOSA, which boosts the
classification performance with an effective sampling strategy to precisely
detect examples from known classes for annotation. The LfOSA framework
introduces an auxiliary network to model the per-example max activation value
(MAV) distribution with a Gaussian Mixture Model, which can dynamically select
the examples with highest probability from known classes in the unlabeled set.
Moreover, by reducing the temperature $T$ of the loss function, the detection
model will be further optimized by exploiting both known and unknown
supervision. The experimental results show that the proposed method can
significantly improve the selection quality of known classes, and achieve
higher classification accuracy with lower annotation cost than state-of-the-art
active learning methods. To the best of our knowledge, this is the first work
of active learning for open-set annotation.
- Abstract(参考訳): 既存のアクティブラーニング研究は通常、ラベル付けされるすべてのデータ例が既知のクラスから引き出されると仮定してクローズドセット設定で動作する。
しかし、実際のアノテーションタスクでは、ラベルなしデータは通常未知のクラスから大量のサンプルを含むため、ほとんどのアクティブな学習方法が失敗する。
このオープンセットアノテーション(OSA)問題に対処するために,LfOSAと呼ばれる新しいアクティブ学習フレームワークを提案する。
LfOSAフレームワークは、ガウス混合モデルを用いて、サンプルごとの最大アクティベーション値(MAV)分布をモデル化する補助ネットワークを導入し、未ラベル集合の既知のクラスから、最も高い確率のサンプルを動的に選択できる。
さらに、損失関数の温度$t$を下げることで、既知の監視と未知の監視の両方を利用して検出モデルをさらに最適化する。
実験の結果,提案手法は既知のクラスの選択品質を著しく向上させ,最先端のアクティブラーニング手法よりもアノテーションコストを低く分類精度を向上できることがわかった。
私たちの知る限りでは、これはオープンセットアノテーションのためのアクティブラーニングの最初の仕事です。
関連論文リスト
- STENCIL: Submodular Mutual Information Based Weak Supervision for
Cold-Start Active Learning [2.1485350418225244]
STENCILは、クラス不均衡のコールドスタート設定において、一般的なアクティブな学習手法に対して、複数のテキスト分類データセットに対して10%-24%、レアクラスのF-1スコアを17%-40%の精度で改善する。
論文 参考訳(メタデータ) (2024-02-21T01:54:58Z) - Inconsistency-Based Data-Centric Active Open-Set Annotation [6.652785290214744]
NEATは、オープンセットデータを積極的にアノテートするデータ中心のアクティブラーニング手法である。
NEATは、アクティブなオープンセットアノテーションのための最先端のアクティブな学習方法よりも、はるかに優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2024-01-10T04:18:02Z) - XAL: EXplainable Active Learning Makes Classifiers Better Low-resource Learners [71.8257151788923]
低リソーステキスト分類のための新しい説明可能なアクティブラーニングフレームワーク(XAL)を提案する。
XALは分類器に対して、推論を正当化し、合理的な説明ができないラベルのないデータを掘り下げることを推奨している。
6つのデータセットの実験では、XALは9つの強いベースラインに対して一貫した改善を達成している。
論文 参考訳(メタデータ) (2023-10-09T08:07:04Z) - Active Learning Principles for In-Context Learning with Large Language
Models [65.09970281795769]
本稿では,アクティブ・ラーニング・アルゴリズムが,文脈内学習における効果的な実演選択手法としてどのように機能するかを検討する。
ALによる文脈内サンプル選択は,不確実性の低い高品質な事例を優先し,試験例と類似性を有することを示す。
論文 参考訳(メタデータ) (2023-05-23T17:16:04Z) - Enlarging Instance-specific and Class-specific Information for Open-set
Action Recognition [47.69171542776917]
よりリッチなセマンティックな多様性を持つ機能は、同じ不確実性スコアの下で、オープンセットのパフォーマンスを著しく向上させることができる。
よりIS情報を保持するために、インスタンスの分散を同じクラス内に保持するために、新しいPSLフレームワークが提案されている。
論文 参考訳(メタデータ) (2023-03-25T04:07:36Z) - Active Pointly-Supervised Instance Segmentation [106.38955769817747]
アクティブポイント制御型インスタンスセグメンテーション(APIS)という,経済的なアクティブな学習環境を提案する。
APISはボックスレベルのアノテーションから始まり、ボックス内のポイントを反復的にサンプリングし、オブジェクトに落ちているかどうかを問う。
これらの戦略で開発されたモデルは、挑戦的なMS-COCOデータセットに対して一貫したパフォーマンス向上をもたらす。
論文 参考訳(メタデータ) (2022-07-23T11:25:24Z) - Optimizing Active Learning for Low Annotation Budgets [6.753808772846254]
ディープラーニングでは、アクティブな学習は通常、微調整によって連続した深層モデルを更新する反復的なプロセスとして実装される。
移行学習にインスパイアされたアプローチを用いてこの問題に対処する。
本稿では,ALプロセスの反復性を利用してより堅牢なサンプルを抽出する新しい取得関数を提案する。
論文 参考訳(メタデータ) (2022-01-18T18:53:10Z) - MCDAL: Maximum Classifier Discrepancy for Active Learning [74.73133545019877]
近年の最先端のアクティブラーニング手法は, 主にGAN(Generative Adversarial Networks)をサンプル取得に活用している。
本稿では,MCDAL(Maximum Discrepancy for Active Learning)と呼ぶ新しいアクティブラーニングフレームワークを提案する。
特に,両者の差分を最大化することにより,より厳密な決定境界を学習する2つの補助的分類層を利用する。
論文 参考訳(メタデータ) (2021-07-23T06:57:08Z) - Semi-supervised Active Learning for Instance Segmentation via Scoring
Predictions [25.408505612498423]
インスタンスセグメンテーションのための新規かつ原則的な半教師付きアクティブ学習フレームワークを提案する。
具体的には,クラス,バウンディングボックス,マスクの手がかりを明示的に評価するトリプレットスコア予測(tsp)という不確実性サンプリング戦略を提案する。
医用画像データセットを用いた結果から,提案手法が有意義な方法で利用可能なデータから知識を具現化することを示す。
論文 参考訳(メタデータ) (2020-12-09T02:36:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。