論文の概要: Neighborhood-based Pooling for Population-level Label Distribution
Learning
- arxiv url: http://arxiv.org/abs/2003.07406v2
- Date: Wed, 29 Apr 2020 23:13:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-23 02:48:10.323755
- Title: Neighborhood-based Pooling for Population-level Label Distribution
Learning
- Title(参考訳): 人口レベルラベル分布学習のための近傍型プール
- Authors: Tharindu Cyril Weerasooriya, Tong Liu, Christopher M. Homan
- Abstract要約: 監視された機械学習は、しばしば人間の注釈付きデータを必要とする。
人口レベルのラベル分布学習は、人間のアノテータの集団の意見のサンプルとして、各データ項目に対するアノテーションの収集を扱う。
本稿では,サンプリングサイズを考慮したPLDLのためのアルゴリズムフレームワークと新しい統計的テストを提案する。
- 参考スコア(独自算出の注目度): 5.790608871289107
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Supervised machine learning often requires human-annotated data. While
annotator disagreement is typically interpreted as evidence of noise,
population-level label distribution learning (PLDL) treats the collection of
annotations for each data item as a sample of the opinions of a population of
human annotators, among whom disagreement may be proper and expected, even with
no noise present. From this perspective, a typical training set may contain a
large number of very small-sized samples, one for each data item, none of
which, by itself, is large enough to be considered representative of the
underlying population's beliefs about that item. We propose an algorithmic
framework and new statistical tests for PLDL that account for sampling size. We
apply them to previously proposed methods for sharing labels across similar
data items. We also propose new approaches for label sharing, which we call
neighborhood-based pooling.
- Abstract(参考訳): 教師付き機械学習は、しばしば人間の注釈データを必要とする。
アノテータの不一致は通常、ノイズの証拠として解釈されるが、人口レベルラベル分布学習(pldl)は、各データ項目に対するアノテーションの収集を、ノイズがなくても、不一致が適切で期待できる人間のアノテータの意見のサンプルとして扱う。
この観点からすると、典型的なトレーニングセットには多数の非常に小さなサンプルが含まれており、各データ項目に対して1つであり、それ自身は、その項目に関する人口の信念を表すのに十分な大きさではない。
サンプリングサイズを考慮したPLDLのためのアルゴリズムフレームワークと新しい統計的テストを提案する。
類似したデータ項目間でラベルを共有するために,提案手法を適用した。
また,ラベル共有のための新しい手法を提案する。
関連論文リスト
- Extracting Clean and Balanced Subset for Noisy Long-tailed Classification [66.47809135771698]
そこで我々は,分布マッチングの観点から,クラスプロトタイプを用いた新しい擬似ラベリング手法を開発した。
手動で特定の確率尺度を設定することで、ノイズと長い尾を持つデータの副作用を同時に減らすことができる。
本手法は, クリーンなラベル付きクラスバランスサブセットを抽出し, ラベルノイズ付きロングテール分類において, 効果的な性能向上を実現する。
論文 参考訳(メタデータ) (2024-04-10T07:34:37Z) - Virtual Category Learning: A Semi-Supervised Learning Method for Dense
Prediction with Extremely Limited Labels [63.16824565919966]
本稿では,ラベルの修正を伴わずに,混乱したサンプルを積極的に使用することを提案する。
仮想カテゴリー(VC)は、モデルの最適化に安全に貢献できるように、各混乱したサンプルに割り当てられる。
私たちの興味深い発見は、密集した視覚タスクにおけるVC学習の利用に注目しています。
論文 参考訳(メタデータ) (2023-12-02T16:23:52Z) - Robust Assignment of Labels for Active Learning with Sparse and Noisy
Annotations [0.17188280334580192]
監視された分類アルゴリズムは、世界中の多くの現実の問題を解決するために使用される。
残念なことに、多くのタスクに対して良質なアノテーションを取得することは、実際に行うには不可能か、あるいはコストがかかりすぎます。
サンプル空間のラベルのない部分を利用する2つの新しいアノテーション統一アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-07-25T19:40:41Z) - Subjective Crowd Disagreements for Subjective Data: Uncovering
Meaningful CrowdOpinion with Population-level Learning [8.530934084017966]
emphCrowdOpinionは、言語特徴とラベル分布を用いて、類似した項目をラベル分布のより大きなサンプルにまとめる教師なし学習手法である。
ソーシャルメディアから利用可能な5つのベンチマークデータセット(アノテータの不一致のレベルが異なる)を使用します。
また、Facebookのデータセットを使って、投稿に反応するユーザーによって、プラットフォーム自体からアノテーションが送られてくるような実験も行っています。
論文 参考訳(メタデータ) (2023-07-07T22:09:46Z) - Utilizing supervised models to infer consensus labels and their quality
from data with multiple annotators [16.79939549201032]
分類のための実世界のデータは、しばしば複数のアノテータによってラベル付けされる。
このようなデータを推定するための簡単なアプローチであるCROWDLABを紹介します。
提案手法は,(1)-(3)に対して,多くの代替アルゴリズムよりも優れた推定値を提供する。
論文 参考訳(メタデータ) (2022-10-13T07:54:07Z) - Label-Noise Learning with Intrinsically Long-Tailed Data [65.41318436799993]
本稿では,本質的な長期データを用いたラベルノイズ学習のための学習フレームワークを提案する。
具体的には, 2段階の2次元試料選択法(TABASCO)を提案する。
論文 参考訳(メタデータ) (2022-08-21T07:47:05Z) - Instance-Dependent Partial Label Learning [69.49681837908511]
部分ラベル学習は、典型的には弱教師付き学習問題である。
既存のほとんどのアプローチでは、トレーニングサンプルの間違ったラベルがランダムに候補ラベルとして選択されていると仮定している。
本稿では,各例が実数で構成された潜在ラベル分布と関連していると仮定する。
論文 参考訳(メタデータ) (2021-10-25T12:50:26Z) - On Releasing Annotator-Level Labels and Information in Datasets [6.546195629698355]
ラベルアグリゲーションは,個人的視点とグループ的視点の表現バイアスをもたらす可能性があることを示す。
下流のユースケースに対するデータセットの有用性と透明性を高めるための推奨事項を提案する。
論文 参考訳(メタデータ) (2021-10-12T02:35:45Z) - Disentangling Sampling and Labeling Bias for Learning in Large-Output
Spaces [64.23172847182109]
異なる負のサンプリングスキームが支配的ラベルと稀なラベルで暗黙的にトレードオフパフォーマンスを示す。
すべてのラベルのサブセットで作業することで生じるサンプリングバイアスと、ラベルの不均衡に起因するデータ固有のラベルバイアスの両方に明示的に対処する統一された手段を提供する。
論文 参考訳(メタデータ) (2021-05-12T15:40:13Z) - One-bit Supervision for Image Classification [121.87598671087494]
1ビットの監視は、不完全なアノテーションから学ぶための新しい設定である。
負ラベル抑圧を既成の半教師付き学習アルゴリズムに組み込んだ多段階学習パラダイムを提案する。
論文 参考訳(メタデータ) (2020-09-14T03:06:23Z) - Active Crowd Counting with Limited Supervision [13.09054893296829]
本稿では,限られた監督下で正確な群集カウントを可能にする能動的学習フレームワークを提案する。
まず、データセットの最も情報性の高い画像に注釈を付けるためのアクティブなラベリング戦略を導入し、その上にカウントモデルを学習する。
ラベリング予算が満たされた最後のサイクルでは、大量の未ラベルデータも利用される。
論文 参考訳(メタデータ) (2020-07-13T12:07:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。