論文の概要: The Weak Supervision Landscape
- arxiv url: http://arxiv.org/abs/2203.16282v1
- Date: Wed, 30 Mar 2022 13:19:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-31 20:39:00.064410
- Title: The Weak Supervision Landscape
- Title(参考訳): 弱い監督の風景は
- Authors: Rafael Poyiadzi, Daniel Bacaicoa-Barber, Jesus Cid-Sueiro, Miquel
Perello-Nieto, Peter Flach, Raul Santos-Rodriguez
- Abstract要約: 弱い監督設定を分類する枠組みを提案する。
我々は、弱い監督を特徴付ける重要な要素を特定し、既存のアプローチのほとんどを分類する一連の次元を考案する。
文献における一般的な設定がフレームワークにどのように適合するかを示し、実際に使用可能な使用法について議論する。
- 参考スコア(独自算出の注目度): 5.186945902380689
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many ways of annotating a dataset for machine learning classification tasks
that go beyond the usual class labels exist in practice. These are of interest
as they can simplify or facilitate the collection of annotations, while not
greatly affecting the resulting machine learning model. Many of these fall
under the umbrella term of weak labels or annotations. However, it is not
always clear how different alternatives are related. In this paper we propose a
framework for categorising weak supervision settings with the aim of: (1)
helping the dataset owner or annotator navigate through the available options
within weak supervision when prescribing an annotation process, and (2)
describing existing annotations for a dataset to machine learning practitioners
so that we allow them to understand the implications for the learning process.
To this end, we identify the key elements that characterise weak supervision
and devise a series of dimensions that categorise most of the existing
approaches. We show how common settings in the literature fit within the
framework and discuss its possible uses in practice.
- Abstract(参考訳): 通常のクラスラベルを超える機械学習分類タスクのためのデータセットを注釈する多くの方法が実際に存在する。
これらは、アノテーションの収集を単純化または促進できると同時に、結果として生じる機械学習モデルに大きな影響を与えない、という点で興味深い。
それらの多くは、弱いラベルやアノテーションの傘の言葉に該当する。
しかし、どのような選択肢が関係しているかは必ずしも明確ではない。
本稿では,(1)アノテーションプロセスを記述する際に,データセット所有者やアノテーション者が,弱監督下で利用可能なオプションをナビゲートするのを助けること,(2)機械学習実践者にデータセットの既存のアノテーションを記述することによって,学習プロセスへの影響を理解することを目的とした,弱い監督設定を分類するフレームワークを提案する。
この目的のために、弱い監督を特徴付ける重要な要素を特定し、既存のアプローチの大部分を分類する一連の次元を考案する。
本稿では,文献の共通設定がフレームワーク内でどのように適合するかを示し,その実用性について議論する。
関連論文リスト
- Self-Supervised Visual Representation Learning with Semantic Grouping [50.14703605659837]
我々は、未ラベルのシーン中心のデータから視覚表現を学習する問題に取り組む。
本研究では,データ駆動型セマンティックスロット,すなわちSlotConによる協調型セマンティックグルーピングと表現学習のためのコントラスト学習を提案する。
論文 参考訳(メタデータ) (2022-05-30T17:50:59Z) - Assisted Text Annotation Using Active Learning to Achieve High Quality
with Little Effort [9.379650501033465]
研究者は、手動の注釈だけで、大規模で高品質な注釈付きデータセットを作成できるツールを提案する。
我々は、アクティブラーニング(AL)アプローチと事前訓練された言語モデルを組み合わせて、アノテーションカテゴリを半自動で識別する。
予備的な結果から,ALを用いることで,複雑なフレームや微妙なフレームを正しく分類するアノテーションの数が大幅に削減されることがわかった。
論文 参考訳(メタデータ) (2021-12-15T13:14:58Z) - Learning to Detect Instance-level Salient Objects Using Complementary
Image Labels [55.049347205603304]
本報告では,本問題に対する第1の弱教師付きアプローチを提案する。
本稿では,候補対象の特定にクラス整合性情報を活用するSaliency Detection Branch,オブジェクト境界をデライン化するためにクラス整合性情報を利用するBundary Detection Branch,サブティナイズ情報を用いたCentroid Detection Branchを提案する。
論文 参考訳(メタデータ) (2021-11-19T10:15:22Z) - OPAD: An Optimized Policy-based Active Learning Framework for Document
Content Analysis [6.159771892460152]
文書のコンテンツ検出タスクにおける能動的学習のための強化ポリシーを用いた新しいフレームワークであるtextitOPADを提案する。
フレームワークは、取得機能を学び、パフォーマンスメトリクスを最適化しながら、選択するサンプルを決定する。
本稿では,文書理解に関わる様々なタスクに対する能動的学習のためのテキストOPADフレームワークの優れた性能を示す。
論文 参考訳(メタデータ) (2021-10-01T07:40:56Z) - Annotation Curricula to Implicitly Train Non-Expert Annotators [56.67768938052715]
自発的な研究は、しばしば、アノテータがタスク、そのアノテーションスキーム、およびデータドメインに精通することを要求する。
これは最初は圧倒的であり、精神的に課税され、結果として生じるアノテーションにエラーを誘導する。
暗黙的にアノテータを訓練する新しい手法であるアノテーションキュリキュラを提案する。
論文 参考訳(メタデータ) (2021-06-04T09:48:28Z) - Dynamic Semantic Matching and Aggregation Network for Few-shot Intent
Detection [69.2370349274216]
利用可能な注釈付き発話が不足しているため、インテント検出は困難である。
セマンティック成分はマルチヘッド自己認識によって発話から蒸留される。
本手法はラベル付きインスタンスとラベルなしインスタンスの両方の表現を強化するための総合的なマッチング手段を提供する。
論文 参考訳(メタデータ) (2020-10-06T05:16:38Z) - OLALA: Object-Level Active Learning for Efficient Document Layout
Annotation [24.453873808984415]
本稿では,効率的な文書レイアウトのためのオブジェクトレベルアクティブラーニングフレームワークを提案する。
このフレームワークでは、アノテータにラベルを付けるために、画像内で最も曖昧なオブジェクト予測を行う領域のみが選択される。
選択されていない予測に対して,レイアウト構造に関する事前の知識に基づいて,半自動補正アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-10-05T03:48:07Z) - UniT: Unified Knowledge Transfer for Any-shot Object Detection and
Segmentation [52.487469544343305]
オブジェクト検出とセグメンテーションの方法は、トレーニングのための大規模インスタンスレベルのアノテーションに依存します。
本稿では,直感的かつ統一的な半教師付きモデルを提案する。
論文 参考訳(メタデータ) (2020-06-12T22:45:47Z) - Structured Prediction with Partial Labelling through the Infimum Loss [85.4940853372503]
弱い監督の目標は、収集コストの安いラベル付け形式のみを使用してモデルを学習できるようにすることである。
これは、各データポイントに対して、実際のものを含むラベルのセットとして、監督がキャストされる不完全なアノテーションの一種です。
本稿では、構造化された予測と、部分的なラベリングを扱うための無限損失の概念に基づく統一的なフレームワークを提供する。
論文 参考訳(メタデータ) (2020-03-02T13:59:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。