論文の概要: Towards Mitigating the Problem of Insufficient and Ambiguous Supervision
in Online Crowdsourcing Annotation
- arxiv url: http://arxiv.org/abs/2210.11194v1
- Date: Thu, 20 Oct 2022 12:15:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-21 14:40:44.244636
- Title: Towards Mitigating the Problem of Insufficient and Ambiguous Supervision
in Online Crowdsourcing Annotation
- Title(参考訳): オンラインクラウドソーシングアノテーションにおける不適切かつ曖昧なスーパービジョンの問題の緩和に向けて
- Authors: Qian-Wei Wang, Bowen Zhao, Mingyan Zhu, Tianxiang Li, Zimo Liu,
Shu-Tao Xia
- Abstract要約: 実世界のクラウドソーシングアノテーションシステムでは、ユーザ知識と文化的背景の違いにより、監視情報が不十分で曖昧である可能性がある。
擬似ラベルとコントラスト学習に基づく新しい手法を提案する。
画像ベンチマークにおいて,半教師付き部分ラベル学習のための最先端性能を初めて設定した。
- 参考スコア(独自算出の注目度): 47.729222959408865
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In real-world crowdsourcing annotation systems, due to differences in user
knowledge and cultural backgrounds, as well as the high cost of acquiring
annotation information, the supervision information we obtain might be
insufficient and ambiguous. To mitigate the negative impacts, in this paper, we
investigate a more general and broadly applicable learning problem, i.e.
\emph{semi-supervised partial label learning}, and propose a novel method based
on pseudo-labeling and contrastive learning. Following the key inventing
principle, our method facilitate the partial label disambiguation process with
unlabeled data and at the same time assign reliable pseudo-labels to weakly
supervised examples. Specifically, our method learns from the ambiguous
labeling information via partial cross-entropy loss. Meanwhile, high-accuracy
pseudo-labels are generated for both partial and unlabeled examples through
confidence-based thresholding and contrastive learning is performed in a hybrid
unsupervised and supervised manner for more discriminative representations,
while its supervision increases curriculumly. The two main components
systematically work as a whole and reciprocate each other. In experiments, our
method consistently outperforms all comparing methods by a significant margin
and set up the first state-of-the-art performance for semi-supervised partial
label learning on image benchmarks.
- Abstract(参考訳): 実世界のクラウドソーシングアノテーションシステムでは,ユーザ知識や文化的背景の相違,アノテーション情報の取得コストの高騰などにより,得られた監視情報は不十分で曖昧である可能性がある。
本稿では, 負の影響を軽減するために, より汎用的で広く適用可能な学習問題,すなわち \emph{semi-supervised partial label learning} を調査し, 擬似ラベルとコントラスト学習に基づく新しい手法を提案する。
鍵発明の原則に従い,本手法はラベルなしデータによる部分ラベルの曖昧化を容易にすると同時に,信頼性の高い擬似ラベルを弱教師付き例に割り当てる。
具体的には,部分クロスエントロピー損失による曖昧なラベル情報から学習する。
一方、信頼度に基づくしきい値付けと、より識別的な表現のために教師なしかつ教師なしのハイブリッド方式でコントラスト学習を行い、その指導がカリキュラム的に増加することにより、部分的および無ラベルの例の両方に対して高精度な擬似ラベルを生成する。
2つの主要なコンポーネントは全体として体系的に動作し、相互に連携します。
実験では,画像ベンチマークによる半教師付き部分ラベル学習において,すべての比較手法を有意なマージンで圧倒し,最初の最先端性能を設定した。
関連論文リスト
- Rethinking Classifier Re-Training in Long-Tailed Recognition: A Simple
Logits Retargeting Approach [102.0769560460338]
我々は,クラスごとのサンプル数に関する事前知識を必要とせず,シンプルなロジットアプローチ(LORT)を開発した。
提案手法は,CIFAR100-LT, ImageNet-LT, iNaturalist 2018など,様々な不均衡データセットの最先端性能を実現する。
論文 参考訳(メタデータ) (2024-03-01T03:27:08Z) - Adaptive End-to-End Metric Learning for Zero-Shot Cross-Domain Slot
Filling [2.6056468338837457]
スロットフィリングは、トレーニング中にサンプルを見ることのない新しいドメインを扱う上で重要な課題である。
ほとんどの先行研究は、メートル法学習に基づく2パスパイプライン方式でこの問題に対処している。
そこで本研究では,ゼロショットスロットの補充に挑戦する手法として,適応的なエンドツーエンドの計量学習手法を提案する。
論文 参考訳(メタデータ) (2023-10-23T19:01:16Z) - Robust Representation Learning for Unreliable Partial Label Learning [86.909511808373]
部分ラベル学習(Partial Label Learning, PLL)は、弱い教師付き学習の一種で、各トレーニングインスタンスに候補ラベルのセットが割り当てられる。
これはUn Reliable partial Label Learning (UPLL) と呼ばれ、部分ラベルの本質的な信頼性の欠如とあいまいさにより、さらなる複雑さをもたらす。
本研究では,信頼できない部分ラベルに対するモデル強化を支援するために,信頼性に欠けるコントラスト学習を活用するUnreliability-Robust Representation Learning framework(URRL)を提案する。
論文 参考訳(メタデータ) (2023-08-31T13:37:28Z) - Class-Distribution-Aware Pseudo Labeling for Semi-Supervised Multi-Label
Learning [97.88458953075205]
Pseudo-labelingは、ラベルなしデータを利用するための人気で効果的なアプローチとして登場した。
本稿では,クラスアウェアの擬似ラベル処理を行うCAP(Class-Aware Pseudo-Labeling)という新しい手法を提案する。
論文 参考訳(メタデータ) (2023-05-04T12:52:18Z) - SoftMatch: Addressing the Quantity-Quality Trade-off in Semi-supervised
Learning [101.86916775218403]
本稿では, サンプル重み付けを統一した定式化により, 一般的な擬似ラベル法を再検討する。
トレーニング中の擬似ラベルの量と質を両立させることでトレードオフを克服するSoftMatchを提案する。
実験では、画像、テキスト、不均衡な分類など、さまざまなベンチマークで大幅に改善されている。
論文 参考訳(メタデータ) (2023-01-26T03:53:25Z) - Meta Objective Guided Disambiguation for Partial Label Learning [44.05801303440139]
メタ客観的ガイド型曖昧化(MoGD)を用いたラベル学習のための新しい枠組みを提案する。
MoGDは、小さな検証セットでメタ目標を解くことで、候補ラベルから基底トラスラベルを復元することを目的としている。
提案手法は,通常のSGDを用いた様々なディープネットワークを用いて容易に実装できる。
論文 参考訳(メタデータ) (2022-08-26T06:48:01Z) - Contrastive Regularization for Semi-Supervised Learning [46.020125061295886]
そこで本稿では, ラベルのないデータの特徴量により, 整合正則化の効率性と精度を両立させるために, 対照的な正則化を提案する。
また,提案手法は,ラベルなしデータに分布しないサンプルを含むオープンセット半教師付き学習において,頑健な性能を示す。
論文 参考訳(メタデータ) (2022-01-17T07:20:11Z) - Noised Consistency Training for Text Summarization [23.16890559954038]
整合性トレーニングは半教師付きアプローチによって克服できると主張している。
我々は,大量のラベル付きデータを活用することで,ラベル付きデータセットが不十分な場合の教師あり学習性能が向上することを確認した。
論文 参考訳(メタデータ) (2021-05-28T07:21:39Z) - In Defense of Pseudo-Labeling: An Uncertainty-Aware Pseudo-label
Selection Framework for Semi-Supervised Learning [53.1047775185362]
Pseudo-labeling (PL) は一般的な SSL アプローチで、この制約はありませんが、当初の処方では比較的不十分です。
PLは不整合モデルからの誤った高い信頼度予測により性能が低下していると論じる。
そこで本研究では,疑似ラベリング精度を向上させるための不確実性認識型擬似ラベル選択(ups)フレームワークを提案する。
論文 参考訳(メタデータ) (2021-01-15T23:29:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。