論文の概要: Minimizing Supervision in Multi-label Categorization
- arxiv url: http://arxiv.org/abs/2005.12892v1
- Date: Tue, 26 May 2020 17:35:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-28 23:56:29.622756
- Title: Minimizing Supervision in Multi-label Categorization
- Title(参考訳): マルチラベル分類における監督の最小化
- Authors: Rajat, Munender Varshney, Pravendra Singh, Vinay P. Namboodiri
- Abstract要約: 20%のサンプルで、完全に教師されたパフォーマンスの98%以上を維持できることが示されています。
提案手法は、すべてのベンチマークデータセットとモデルの組み合わせに対して、他のすべてのベースライン指標を一貫して上回る。
- 参考スコア(独自算出の注目度): 32.41523973213862
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multiple categories of objects are present in most images. Treating this as a
multi-class classification is not justified. We treat this as a multi-label
classification problem. In this paper, we further aim to minimize the
supervision required for providing supervision in multi-label classification.
Specifically, we investigate an effective class of approaches that associate a
weak localization with each category either in terms of the bounding box or
segmentation mask. Doing so improves the accuracy of multi-label
categorization. The approach we adopt is one of active learning, i.e.,
incrementally selecting a set of samples that need supervision based on the
current model, obtaining supervision for these samples, retraining the model
with the additional set of supervised samples and proceeding again to select
the next set of samples. A crucial concern is the choice of the set of samples.
In doing so, we provide a novel insight, and no specific measure succeeds in
obtaining a consistently improved selection criterion. We, therefore, provide a
selection criterion that consistently improves the overall baseline criterion
by choosing the top k set of samples for a varied set of criteria. Using this
criterion, we are able to show that we can retain more than 98% of the fully
supervised performance with just 20% of samples (and more than 96% using 10%)
of the dataset on PASCAL VOC 2007 and 2012. Also, our proposed approach
consistently outperforms all other baseline metrics for all benchmark datasets
and model combinations.
- Abstract(参考訳): 多くの画像には複数のカテゴリのオブジェクトが存在する。
これを多クラス分類として扱うことは正当化されない。
これを多ラベル分類問題として扱う。
本稿では,マルチラベル分類における監督に必要な監督を最小化することを目的としている。
具体的には,境界ボックスあるいはセグメンテーションマスクを用いて,各カテゴリに弱局在を関連付ける効果的なアプローチについて検討する。
これにより、マルチラベル分類の精度が向上する。
私たちが採用するアプローチは、アクティブラーニングの1つで、現在のモデルに基づいて監督を必要とするサンプルセットを段階的に選択し、これらのサンプルの監督を取得し、教師付きサンプルのセットを追加してモデルを再トレーニングし、次のサンプルセットを選択する。
重要な懸念事項は、サンプルのセットの選択である。
その際,我々は新たな洞察を与え,一貫して改良された選択基準を得るための具体的な手段は得られない。
そこで我々は, 基準の異なるサンプルの上位k組を選択することにより, ベースライン基準を一貫して改善する選択基準を提供する。
この基準を用いることで、PASCAL VOC 2007と2012のデータセットの20%(および96%以上を10%使用)で、完全な教師付きパフォーマンスの98%以上を維持できることを示すことができる。
また,提案手法は,すべてのベンチマークデータセットとモデルの組み合わせに対して,他のすべてのベースラインメトリクスを一貫して上回っている。
関連論文リスト
- Adapt-$\infty$: Scalable Lifelong Multimodal Instruction Tuning via Dynamic Data Selection [89.42023974249122]
Adapt-$infty$は、Lifelong Instruction Tuningの新しいマルチウェイおよびアダプティブデータ選択アプローチである。
勾配に基づくサンプルベクトルをグループ化して擬似スキルクラスタを構築する。
セレクタエキスパートのプールから各スキルクラスタの最高のパフォーマンスデータセレクタを選択する。
論文 参考訳(メタデータ) (2024-10-14T15:48:09Z) - Liberating Seen Classes: Boosting Few-Shot and Zero-Shot Text Classification via Anchor Generation and Classification Reframing [38.84431954053434]
短いショットとゼロショットのテキスト分類は、ラベル付きサンプルやラベル付きサンプルが全くない新しいクラスからのサンプルを認識することを目的としている。
少数ショットとゼロショットのテキスト分類のためのシンプルで効果的な戦略を提案する。
論文 参考訳(メタデータ) (2024-05-06T15:38:32Z) - Boundary Matters: A Bi-Level Active Finetuning Framework [100.45000039215495]
アクティブファインタニングの概念は、限られた予算内でモデルファインタニングに最も適したサンプルを選択することを目的としている。
従来のアクティブな学習手法は、バッチ選択に固有のバイアスがあるため、この設定で苦労することが多い。
そこで本研究では,アノテーションのサンプルを1ショットで選択するバイレベルアクティブファインタニングフレームワークを提案し,その2段階として,多様性のためのコアサンプル選択と不確実性のための境界サンプル選択を提案する。
論文 参考訳(メタデータ) (2024-03-15T07:19:15Z) - Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - Cost-Effective Online Contextual Model Selection [14.094350329970537]
我々は,このタスクを,学習者が文脈とともにラベルのないデータポイントを受信する,オンラインコンテキストアクティブモデル選択問題として定式化する。
目標は、ラベルの過剰な量を得ることなく、任意のコンテキストに対して最良のモデルを出力することである。
本稿では,適応モデル選択のためのポリシークラスに定義された新しい不確実性サンプリングクエリ基準に依存する,文脈型アクティブモデル選択アルゴリズム(CAMS)を提案する。
論文 参考訳(メタデータ) (2022-07-13T08:22:22Z) - Minimax Active Learning [61.729667575374606]
アクティブラーニングは、人間のアノテーションによってラベル付けされる最も代表的なサンプルをクエリすることによって、ラベル効率の高いアルゴリズムを開発することを目指している。
現在のアクティブラーニング技術は、最も不確実なサンプルを選択するためにモデルの不確実性に頼るか、クラスタリングを使うか、最も多様なラベルのないサンプルを選択するために再構築する。
我々は,不確実性と多様性を両立させる半教師付きミニマックスエントロピーに基づく能動学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-12-18T19:03:40Z) - Mask-guided sample selection for Semi-Supervised Instance Segmentation [13.091166009687058]
半教師付きインスタンスセグメンテーションのためのアノテートするサンプルを決定するためのサンプル選択手法を提案する。
本手法は, サンプルのラベル付きプールに対する擬似マスクの初回予測と, マスクの質を予測するスコアから構成される。
品質スコアからアノテートしたほうがよいサンプルについて検討し, ランダム選択よりも優れた手法を示す。
論文 参考訳(メタデータ) (2020-08-25T14:44:58Z) - Joint Visual and Temporal Consistency for Unsupervised Domain Adaptive
Person Re-Identification [64.37745443119942]
本稿では,局所的なワンホット分類とグローバルなマルチクラス分類を組み合わせることで,視覚的・時間的整合性を両立させる。
3つの大規模ReIDデータセットの実験結果は、教師なしと教師なしの両方のドメイン適応型ReIDタスクにおいて提案手法の優位性を示す。
論文 参考訳(メタデータ) (2020-07-21T14:31:27Z) - UniT: Unified Knowledge Transfer for Any-shot Object Detection and
Segmentation [52.487469544343305]
オブジェクト検出とセグメンテーションの方法は、トレーニングのための大規模インスタンスレベルのアノテーションに依存します。
本稿では,直感的かつ統一的な半教師付きモデルを提案する。
論文 参考訳(メタデータ) (2020-06-12T22:45:47Z) - Global Multiclass Classification and Dataset Construction via
Heterogeneous Local Experts [37.27708297562079]
得られたデータセットの信頼性を確保しながら、ラベルの数を最小化する方法を示す。
MNISTとCIFAR-10データセットを用いた実験では、アグリゲーション方式の良好な精度が示されている。
論文 参考訳(メタデータ) (2020-05-21T18:07:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。