論文の概要: A Light-weight, Effective and Efficient Model for Label Aggregation in
Crowdsourcing
- arxiv url: http://arxiv.org/abs/2212.00007v1
- Date: Sat, 19 Nov 2022 11:13:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-04 14:24:06.991447
- Title: A Light-weight, Effective and Efficient Model for Label Aggregation in
Crowdsourcing
- Title(参考訳): クラウドソーシングにおけるラベル集約のための軽量・効率的・効率的なモデル
- Authors: Yi Yang, Zhong-Qiu Zhao, Quan Bai, Qing Liu, Weihua Li
- Abstract要約: ラベルアグリゲーション(LA)は、クラウドソースラベルのプロセス後処理の標準手順として登場した。
本稿では,LAを動的システムとして扱い,動的ベイズネットワークとしてモデル化する。
LAtextsuperscriptonepass と LAtextsuperscripttwopass という2つの軽量アルゴリズムを導出する。
- 参考スコア(独自算出の注目度): 26.699587663952975
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Due to the noises in crowdsourced labels, label aggregation (LA) has emerged
as a standard procedure to post-process crowdsourced labels. LA methods
estimate true labels from crowdsourced labels by modeling worker qualities.
Most existing LA methods are iterative in nature. They need to traverse all the
crowdsourced labels multiple times in order to jointly and iteratively update
true labels and worker qualities until convergence. Consequently, these methods
have high space and time complexities. In this paper, we treat LA as a dynamic
system and model it as a Dynamic Bayesian network. From the dynamic model we
derive two light-weight algorithms, LA\textsuperscript{onepass} and
LA\textsuperscript{twopass}, which can effectively and efficiently estimate
worker qualities and true labels by traversing all the labels at most twice.
Due to the dynamic nature, the proposed algorithms can also estimate true
labels online without re-visiting historical data. We theoretically prove the
convergence property of the proposed algorithms, and bound the error of
estimated worker qualities. We also analyze the space and time complexities of
the proposed algorithms and show that they are equivalent to those of majority
voting. Experiments conducted on 20 real-world datasets demonstrate that the
proposed algorithms can effectively and efficiently aggregate labels in both
offline and online settings even if they traverse all the labels at most twice.
- Abstract(参考訳): クラウドソーシングラベルのノイズのため、クラウドソーシングラベルの標準手順としてラベルアグリゲーション(la)が登場している。
laメソッドは、ワーカーの品質をモデル化することで、クラウドソースのラベルから真のラベルを推定する。
既存のLA法の多くは本質的に反復的である。
すべてのクラウドソースのラベルを複数回トラバースして,真のラベルとワーカの品質をコンバージェンスまで共同で,反復的に更新する必要があります。
したがって、これらの手法は空間と時間の複雑さが高い。
本稿では,LAを動的システムとして扱い,動的ベイズネットワークとしてモデル化する。
動的モデルからLA\textsuperscript{onepass}とLA\textsuperscript{twopass}という2つの軽量アルゴリズムを導出する。
動的性質から,提案手法では過去のデータを再訪することなく,オンライン上のラベルを推定することもできる。
提案するアルゴリズムの収束特性を理論的に証明し,推定労働者品質の誤差を限定した。
また,提案アルゴリズムの空間と時間的複雑度を分析し,多数決のそれと同値であることを示す。
20個の実世界のデータセットで実施した実験により、提案アルゴリズムは、すべてのラベルを最大2回トラバースしても、オフラインとオンラインの両方でラベルを効果的かつ効率的に集約できることが示されている。
関連論文リスト
- Inaccurate Label Distribution Learning with Dependency Noise [52.08553913094809]
本稿では,依存雑音に基づく不正確なラベル分布学習(DN-ILDL)フレームワークを導入し,ラベル分布学習におけるノイズによる課題に対処する。
本稿では,DN-ILDLがILDL問題に効果的に対処し,既存のLCL法より優れていることを示す。
論文 参考訳(メタデータ) (2024-05-26T07:58:07Z) - SPAMming Labels: Efficient Annotations for the Trackers of Tomorrow [35.76243023101549]
SPAMは、人間の介入を最小限に抑えた高品質なラベルを提供するビデオラベルエンジンである。
我々は統合グラフの定式化を用いて、トラックの検知と同一性関連の両方のアノテーションに時間をかけて対処する。
我々はSPAMラベルでトレーニングされたトラッカーが人間のアノテーションでトレーニングされたトラッカーに匹敵する性能を発揮することを示した。
論文 参考訳(メタデータ) (2024-04-17T14:33:41Z) - Pseudo-labelling meets Label Smoothing for Noisy Partial Label Learning [8.387189407144403]
部分ラベル学習(Partial label learning、PLL)は、各トレーニングインスタンスが候補ラベル(Partial label)のセットとペアリングされる弱い教師付き学習パラダイムである。
NPLLはこの制約を緩和し、一部の部分ラベルが真のラベルを含まないようにし、問題の実用性を高める。
本稿では,近傍の重み付けアルゴリズムを用いて,雑音のある部分ラベルを利用して画像に擬似ラベルを割り当てる最小限のフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-07T13:32:47Z) - Learning with Noisy Labels: Interconnection of Two
Expectation-Maximizations [41.65589788264123]
労働集約型ラベリングは、ディープラーニングに基づくコンピュータビジョンアルゴリズムの開発においてボトルネックとなる。
雑音データ中の構造的多様体を見つけるタスクとして形式化された雑音ラベル(LNL)問題による学習に対処する。
本アルゴリズムは,複数の標準ベンチマークにおいて,様々な種類のラベルノイズの下でかなりのマージンを有する最先端性能を実現する。
論文 参考訳(メタデータ) (2024-01-09T07:22:30Z) - Label-Retrieval-Augmented Diffusion Models for Learning from Noisy
Labels [61.97359362447732]
ノイズの多いラベルからの学習は、実際のアプリケーションのための機械学習において、重要かつ長年にわたる問題である。
本稿では,生成モデルの観点からラベルノイズ問題を再構成する。
我々のモデルは、標準的な実世界のベンチマークデータセットで新しいSOTA(State-of-the-art)結果を達成する。
論文 参考訳(メタデータ) (2023-05-31T03:01:36Z) - Complementary to Multiple Labels: A Correlation-Aware Correction
Approach [65.59584909436259]
理論上, マルチクラスCLLにおける遷移行列が, 複数ラベルの場合どのように歪むかを示す。
候補ラベルから遷移行列を推定する2段階の手法を提案する。
論文 参考訳(メタデータ) (2023-02-25T04:48:48Z) - Improving Model Training via Self-learned Label Representations [5.969349640156469]
より洗練されたラベル表現は、通常のワンホット符号化よりも分類に適していることが示される。
分類タスクの学習中にラベル表現を同時に学習する適応ラベル付き学習(LwAL)アルゴリズムを提案する。
我々のアルゴリズムは無視可能な追加パラメータを導入し、計算オーバーヘッドを最小限に抑える。
論文 参考訳(メタデータ) (2022-09-09T21:10:43Z) - Trustable Co-label Learning from Multiple Noisy Annotators [68.59187658490804]
監督されたディープラーニングは、大量の注釈付き例に依存している。
典型的な方法は、複数のノイズアノテータから学習することである。
本稿では,emphTrustable Co-label Learning (TCL)と呼ばれるデータ効率のよい手法を提案する。
論文 参考訳(メタデータ) (2022-03-08T16:57:00Z) - Instance-Dependent Partial Label Learning [69.49681837908511]
部分ラベル学習は、典型的には弱教師付き学習問題である。
既存のほとんどのアプローチでは、トレーニングサンプルの間違ったラベルがランダムに候補ラベルとして選択されていると仮定している。
本稿では,各例が実数で構成された潜在ラベル分布と関連していると仮定する。
論文 参考訳(メタデータ) (2021-10-25T12:50:26Z) - Group-aware Label Transfer for Domain Adaptive Person Re-identification [179.816105255584]
Unsupervised Adaptive Domain (UDA) Person Re-identification (ReID) は、ラベル付きソースドメインデータセットで訓練されたモデルを、さらなるアノテーションなしでターゲットドメインデータセットに適応することを目的としている。
最も成功したUDA-ReIDアプローチは、クラスタリングに基づく擬似ラベル予測と表現学習を組み合わせて、2つのステップを交互に実行する。
疑似ラベル予測と表現学習のオンラインインタラクションと相互促進を可能にするグループ認識ラベル転送(GLT)アルゴリズムを提案します。
論文 参考訳(メタデータ) (2021-03-23T07:57:39Z) - Analysis of label noise in graph-based semi-supervised learning [2.4366811507669124]
機械学習では、目に見えないデータに一般化できるモデルを監督するためにラベルを取得する必要がある。
多くの場合、私たちのデータのほとんどはラベル付けされていない。
半教師付き学習(SSL)は、ラベルと入力データ分布の関係について強い仮定をすることで緩和する。
論文 参考訳(メタデータ) (2020-09-27T22:13:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。